75
Armand Colin Mises au point et perspectives àpropos de l'analyse automatique du discours Author(s): M. PÊCHEUX and C. FUCHS Source: Langages, No. 37, Analyse du discours langue et idéologies (MARS 1975), pp. 7-80 Published by: Armand Colin Stable URL: http://www.jstor.org/stable/41680911 . Accessed: 09/09/2013 16:32 Your use of the JSTOR archive indicates your acceptance of the Terms & Conditions of Use, available at . http://www.jstor.org/page/info/about/policies/terms.jsp . JSTOR is a not-for-profit service that helps scholars, researchers, and students discover, use, and build upon a wide range of content in a trusted digital archive. We use information technology and tools to increase productivity and facilitate new forms of scholarship. For more information about JSTOR, please contact [email protected]. . Armand Colin is collaborating with JSTOR to digitize, preserve and extend access to Langages. http://www.jstor.org This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PM All use subject to JSTOR Terms and Conditions

Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

Embed Size (px)

Citation preview

Page 1: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

Armand Colin

Mises au point et perspectives àpropos de l'analyse automatique du discoursAuthor(s): M. PÊCHEUX and C. FUCHSSource: Langages, No. 37, Analyse du discours langue et idéologies (MARS 1975), pp. 7-80Published by: Armand ColinStable URL: http://www.jstor.org/stable/41680911 .

Accessed: 09/09/2013 16:32

Your use of the JSTOR archive indicates your acceptance of the Terms & Conditions of Use, available at .http://www.jstor.org/page/info/about/policies/terms.jsp

.JSTOR is a not-for-profit service that helps scholars, researchers, and students discover, use, and build upon a wide range ofcontent in a trusted digital archive. We use information technology and tools to increase productivity and facilitate new formsof scholarship. For more information about JSTOR, please contact [email protected].

.

Armand Colin is collaborating with JSTOR to digitize, preserve and extend access to Langages.

http://www.jstor.org

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 2: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

M. PÊCHEUX

CNRS, Laboratoire Associé n° 59, Paris VII.

C. FUCHS

CNRS, Paris VII, Département de Recherches Linguistiques.

Mises au point et perspectives

à propos de l'analyse

automatique du discours

Introduction. Première partie : Formation sociale, langue, discours.

1. Formation sociale, idéologie, discours. 2. La linguistique comme théorie des mécanismes syntaxiques et des processus dénonciation. 3. Langue, idéologie, discours.

Deuxième partie : L'analyse automatique du discours : critiques et perspectives NOUVELLES. 1. Construction du corpus en fonction de ses conditions de production dominantes. 2. L'analyse linguistique.

2.1. Les objectifs d'une analyse linguistique du discours. 2.2. Critique de la phase d'analyse linguistique. 2.3. Perspectives d'avenir.

3. L'analyse du processus discursif. 3.1. Aspects principaux de la désyntagmatisation discursive. 3.2. Critique de la procédure actuelle. 3 . 3. Vers une transformation des entrées.

Conclusion.

Introduction

L'« analyse automatique du discours » (que nous désignerons en abrégé par : AAD) a donné lieu, depuis quelques années, à un certain nombre de publications, tant au niveau théorique qu'à celui des applications expéri- mentales 1. Les remarques, interprétations, critiques, voire déformations

1. Voir bibliographie II, 1 et 2.

7

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 3: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

qu'elles ont suscitées à ces deux niveaux 1 nous ont semblé nécessiter une mise au point d'ensemble visant à lever certaines ambiguïtés, rectifier certaines erreurs, constater certaines difficultés non résolues et indiquer simultanément les bases d'une formulation nouvelle de la question, à la lumière des développements plus récents, souvent non publiés, de la réflexion sur le rapport entre linguistique et théorie du discours, d'où la présence indispensable d'un linguiste dans le bilan que nous entreprenons.

Pour éviter toute équivoque risquant de mêler le nécessaire travail critique propre à un champ théorique et les tentatives de retour en arrière visant à abandonner ce champ, nous commencerons par présenter, dans une première partie, le cadre épistémologique général de l'entreprise. Il réside selon nous, dans l'articulation de trois régions de connaissances scientifiques:

1) le matérialisme historique comme théorie des formations sociales et de leurs transformations, y compris la théorie des idéologies,

2) la linguistique comme théorie à la fois des mécanismes syntaxiques et des processus d'énonciation,

3) la théorie du discours comme théorie de la détermination historique des processus sémantiques.

Ajoutons que ces trois régions sont d'une certaine manière traversées et articulées par la référence qu'il conviendra d'expliciter à une théorie de la subjectivité (de nature psychanalytique).

Ceci nous conduira à reformuler comme une des questions centrales celle de la lecture, de l'effet lecteur comme constitutif de la subjectivité et caractérisé par le fait que les conditions d'existence de cet effet doivent, pour que celui-ci se réalise, être dissimulées au sujet lui-même. Nous essaie- rons sur ce point de faire la part de ce qui relève spécifiquement du domaine du linguistique dans cet oubli, par rapport aux régions non- ou pré-lin- guistiques.

La deuxième partie sera consacrée à la discussion des différents aspects critiqués, dans leur détail, ce qui ne peut se faire que dans le cadre théorique général de la première partie, en indiquant, toutes les fois que ce sera pos- sible, les moyens de réformer localement tel ou tel aspect dépassé (tout en restant dans le cadre de la problématique initiale), et en essayant par ailleurs, dans la mesure du possible, de préparer les conditions d'une trans- formation radicale du problème dans ses termes mêmes, c'est-à-dire les conditions d'une révolution dont chacun éprouve la nécessité, mais dont il est aujourd'hui impossible de prévoir la forme : s'il est vrai que « l'on (ne) détruit (que) ce que l'on remplace » (l'AAD visant elle-même à détruire de ce point de vue 1'« analyse de contenu »), la responsabilité théorique impose que l'on prépare d'abord le terrain sur lequel pourra s'effectuer le déplacement-remplacement que nous évoquons ici par la métaphore

1. Voir bibliographie II, 3.

8

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 4: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

du mot « révolution ». En particulier cela suppose que soit comblé le retard pris au niveau des procédures pratiques de traitement des textes par rap- port au niveau atteint dans les discussioni portant sur le rapport entre les trois régions que nous mentionnions plus haut, et avant tout que soit rattrapé l'écart qui sépare V analyse du discours de la théorie du discours .

Première partie

FORMATION SOCIALE, LANGUE, DISCOURS

1. Formation sociale f idéologie, discours.

Le point d'organisation de cette première partie est constitué par le rapport entre les trois régions que nous avons désignées antérieurement et qui sont rappelées dans le titre général de la première partie. Notons tout de suite que, dans les conditions actuelles du travail universitaire, tout concourt à rendre très difficile l'articulation théorique entre ces régions. Outre le fait que cette entreprise d'articulation peut apparaître à certains comme étant d'un goût théorique douteux, il reste que, avec la meilleure volonté théorique et politique du monde, il est difficile de lever les obstacles organisationnels et épistémologiques liés à la balkanisation des connais- sances et surtout au refoulement-travestissement universitaire du matérialisme historique. L'expérience commence à nous apprendre qu'il est très difficile d'éviter des traductions spontanées faisant que le matéria- lisme historique devient « la sociologie », la théorie du discours se réservant 1'« aspect social du langage », etc. Même pour des chercheurs marxistes, il arrive souvent que, capables d'une critique lucide de leur discipline d'origine, ils restent aveugles à certains aspects académiques-idéalistes des disciplines voisines, au point qu'ils croient pouvoir y trouver directement des « instruments » utiles pour leur propre pratique, y compris pour leur pratique critique.

La formulation que nous proposons ici de cette articulation n'échappe évidemment pas au risque que nous signalons, puisque ce risque est coexis- tensif aux conditions de la pratique universitaire actuelle. En reprenant l'état le plus récent de cette formulation 1, nous poserons d'abord que la région du matérialisme historique qui nous concerne ici est celle de la superstructure idéologique dans son lien avec le mode de production domi- nant la formation sociale considérée. Les travaux marxistes récents 2 montrent qu'il est insuffisant de considérer la superstructure idéologique

1. C. Haroche, P. Henry, M. Pêcheux, 1971. 2. Cf. en particulier l'article de L. Athusser, Idéologie et Appareils idéologiques

d'Etat (1970).

9

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 5: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

comme l'expression de « la base économique », comme si l'idéologie était constituée par la « sphère des idées » au-dessus du monde des choses, des faits économiques, etc. En d'autres termes, la région de l'idéologie doit être caractérisée par une matérialité spécifique articulée sur la matérialité économique : plus particulièrement, le fonctionnement de l'instance idéolo- gique doit être conçu comme « déterminé en dernière instance » par l'ins- tance économique dans la mesure où il apparaît comme une des conditions (non économiques) de la reproduction de la base économique, plus spécifi- quement des rapports de production inhérents à cette base économique La modalité particulière du fonctionnement de l'instance idéologique quant à la reproduction des rapports de production consiste dans ce qu'on a pu appeler Y interpellation ou l'assujettissement du sujet comme sujet idéologique de telle sorte que chacun soit conduit sans s'en apercevoir et en ayant l'impression d'exercer sa libre volonté, à prendre sa place dans l'une ou dans l'autre des deux classes sociales antagonistes du mode de production (ou dans telle catégorie, couche ou fraction de classe reliée à l'une d'entre elles) 2. Cette reproduction continuelle des rapports de classe (économique, mais aussi, on vient de le voir, non économique) est assurée matériellement par l'existence de réalités complexes qui ont été désignées par Althusser sous le nom d'« appareils idéologiques d'Etat », et qui se caractérisent par le fait qu'elles mettent en jeu des pratiques associées à des places ou à des rapports de places qui renvoient aux rapports de classes sans pourtant les décalquer exactement. A un moment historique donné, les rapports de classes (la lutte de classes) se caractérisent par l'affrontement, à l'intérieur même de ces appareils, de positions politiques et idéologiques «qui ne sont pas le fait d'individus, mais qui s'organisent en formations entretenant entre elles des rapports d'antagonisme, d'alliance ou de domi- nation. On parlera de formation idéologique pour caractériser un élément (tel aspect de la lutte dans les appareils) susceptible d'intervenir comme une force confrontée à d'autres forces dans la conjoncture idéologique caractéristique d'une formation sociale en un moment donné ; chaque formation idéologique constitue ainsi un ensemble complexe d'attitudes et

1. Les rapports de production ne sont nullement figés dans une répétition éter- nelle comme le prétend la sociologie fonctionnaliste : en réalité, et dans la mesure où les rapports de production correspondent à des rapports de classe, il faut parler de reproduction-transformation des rapports de production. Ce n'est pas ici le lieu de déve- lopper davantage ce point essentiel du matérialisme historique.

2. L'idéologie bourgeoise, comme forme la plus complètement développée nous instruit non seulement sur le fonctionnement de l'instance idéologique en général, mais aussi sur les formes historiques qui l'ont précédées. Toutefois, on ne doit pas projeter les formes bourgeoises d'interpellation sur les formes antérieures : il n'est pas évident, par exemple, que l'interpellation consiste toujours à reporter sur le sujet lui-même sa détermination. L'autonomie du sujet comme « représentation du rapport imaginaire * est en fait étroitement liée à l'apparition et à l'extension de l'idéologie juridico-poli- tique bourgeoise. Dans les formations sociales dominées par d'autres modes de produc- tion, le sujet peut se représenter sa propre détermination comme s'imposant à lui sous la forme d'une contrainte ou d'une volonté étrangère, sans pour autant que le rapport ainsi représenté cesse d'être imaginaire.

10

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 6: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

de représentations 1 qui ne sont ni « individuelles » ni « universelles mais se rapportent plus ou moins directement à des positions de classes en conflit les unes par rapport aux autres 2 ». Nous sommes ainsi amenés à nous poser la question du rapport entre idéologie et discours. Compte tenu de ce qui précède, on voit clairement qu'il est impossible d'identifier idéologie et discours (ce serait une conception idéaliste de l'idéologie comme sphère des idées et des discours), mais que l'on doit concevoir le discursif comme un des aspects matériels de ce que nous avons appelé la matérialité idéolo- gique. Autrement dit, Y espèce discursive appartient selon nous au genre idéologique, ce qui revient à dire que les formations idéologiques dont nous venons de parler « comportent nécessairement 3 comme une de leurs compo- santes une ou plusieurs formations discursives inter-reliées qui déterminent ce qui peut et doit être dit (articulé sous la forme d'une harangue, d'un sermon, d'un pamphlet, d'un exposé, d'un programme, etc.) à partir d'une position donnée dans une conjoncture 4 », autrement dit dans un certain rapport de places intérieur à un appareil idéologique et inscrit dans un rapport de classes. Nous dirons dès lors que toute formation discursive relève de conditions de production 5 spécifiques, identifiables à partir de ce que nous venons de désigner.

Donc « l'idéologie interpelle les individus en sujets » : cette loi consti- tutive de V Idéologie ne se réalise jamais « en général », mais toujours à travers un ensemble complexe déterminé de formations idéologiques qui, à l'intérieur de cet ensemble, jouent à chaque phase historique de la lutte des classes un rôle nécessairement inégal dans la reproduction et la trans- formation des rapports de production, et cela en raison à la fois de leurs

1. Nous ne nous dissimulons pas qu'en utilisant des termes comme « attitudes » et « représentations » empruntés au vocabulaire de la sociologie, nous laissons planer une équivoque ; les pratiques au sens marxiste ne sont pas des « comportements sociaux » ou des « représentations sociales ».

2. C. Haroche, P. Henry, M. Pêcheux, 1971, p. 102. 3. Cette nécessité renvoie à la spécificité du langage inhérent à l'homme comme

animal idéologique. 4. C. Haroche, P. Henry, M. Pêcheux, 1971, p. 102. 5. Précisons que le terme de production peut ici entraîner certaines ambiguïtés.

Pour les éviter, nous distinguerons le sens économique de ce terme, de son sens épisté- mologique (production de connaissances), de son usage psycho-linguistique (production du message), et enfin de la signification qu'il reçoit dans l'expression : « production d'un effet ». C'est avant tout dans ce dernier sens qu'il faut ici entendre ce terme. Nous ver- rons cependant plus loin que les mécanismes de réalisation du discours produit par le sujet sont également en cause. Par ailleurs l'usage de ce terme revêt à nos yeux une fonction polémique à l'égard de l'emploi réitéré du terme de « circulation » voire de « création » pour caractériser des processus de signification.

Ajoutons enfin que la matérialité verbale (phonique ou graphique) est un des pré- supposés de la production économique, à la fois comme condition infrastructure^ de commerce (et de façon générale du contrat), et comme condition de mise en œuvre sociale des forces productives (transmission du « mode d'emploi » des moyens de travail et « éducation » de la force de travail).

La signification de l'expression « conditions de production » sera précisée plus loin, p. 15, p. 23 et p. 24 sqq.

11

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 7: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

caractéristiques « régionales * (le Droit, la Morale, la Connaissance, Dieu, etc...) et de leurs caractéristiques de classe. A ce double titre, des formations discursives interviennent dans ces formations idéologiques à titre de composantes. Prenons un exemple : la formation idéologique reli- gieuse constitue, dans le mode de production féodal, la forme de Y idéologie dominante ; elle réalise « l'interpellation des individus en sujets » à travers l'Appareil Idéologique d'Etat religieux, « spécialisé » dans les rapports de Dieu avec les hommes, sujets de Dieu, dans la forme spécifique des céré- monies (offices, baptêmes, mariages et enterrements, etc...) qui, sous la figure de la religion, interviennent en réalité dans les rapports juridiques et dans la production économique, donc à l'intérieur même des rapports de production féodaux. Dans la réalisation de ces rapports idéologiques de classes, diverses formations discursives, combinées sous des formes chaque fois spécifiques, interviennent à titre de composantes ; par exemple, et en tant qu'hypothèse historique à vérifier : d'un côté le prêche campagnard , reproduit par le « Bas-Clergé » à l'intérieur de la paysannerie, de l'autre le sermon du Haut-Clergé pour les Grands de la noblesse , donc deux forma- tions discursives dont la première se trouve subordonnée à la seconde, de sorte qu'il y est question à la fois des mêmes « choses » (la pauvreté, la mort, la soumission, etc...) mais sous des formes différentes (ex. : la sou- mission du peuple aux Grands/la soumission des Grands à Dieu), et aussi de « choses » différentes (ex. : le travail de la terre/la destinée des Grands).

Soulignons enfin qu'une formation discursive existe historiquement à l'intérieur de rapports de classes donnés ; elle peut fournir des éléments s'intégrant dans de nouvelles formations discursives, se constituant à l'intérieur de nouveaux rapports idéologiques mettant en jeu de nouvelles formations idéologiques. Par exemple, on peut avancer (ceci serait égale- ment l'objet d'une vérification historique) que les formations discursives évoquées ci-dessus, disparues en tant que telles, ont fourni des ingrédients qui ont été « retournés » dans différentes formes historiques de l'athéisme bourgeois et réappropriés, sous la forme de nouvelles formations discur- sives (intégrant par exemple certains discours parlementaires de la Révo- lution de 1789), à la domination idéologique de la classe bourgeoise.

Une difficulté que les théoriciens marxistes connaissent bien surgit ici : la difficulté à caractériser les frontières réelles des objets réels qui correspondent aux concepts introduits (p. ex. ici formation idéologique, formation discursive, conditions de production). Cette « difficulté » n'est pas l'effet d'un malencontreux hasard, mais résulte de la contradiction existant entre la nature de ces concepts et l'usage spontanément fixiste et classifi- catoire que l'on ne peut pas ne pas essayer de leur faire jouer, sous la forme de questions en apparence inévitables du genre : « combien y a-t-il de for- mations idéologiques dans une formation sociale, combien chacune peut-elle contenir de formations discursives, etc. ? ». En fait, et précisément compte tenu du caractère dialectique des réalités ici désignées, une semblable dis- crétisation est radicalement impossible, sauf à inscrire dans la détermination

12

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 8: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

même de chacun de ces objets la possibilité de se transformer en un autre, c'est-à-dire précisément de dénoncer leur caractère discret comme une illusion.

Le point de l'extériorité relative d'une formation idéologique par rapport à une formation discursive se traduit à l'intérieur même de cette formation discursive : elle désigne l'effet nécessaire, dans une formation discursive donnée, d'éléments idéologiques non discursifs (représentations, images liées à des pratiques, etc.). Mieux, elle entraîne à l'intérieur même du discursif un décalage qui reflète cette extériorité. Il s'agit du décalage entre une formation discursive et une autre, la première servant en quelque sorte de matière première représentationnelle à la seconde, comme si la discursivité de cette « matière première » s'évanouissait aux yeux du sujet parlant 1. Il s'agit là de ce que nous caractériserons comme l'oubli n° 1 2, inévitablement inhérent à la pratique subjective liée au langage. Mais simultanément, et ceci constitue une autre forme de ce même oubli, le processus par lequel une séquence discursive concrète est produite ou reconnue comme ayant un sens pour un sujet s'efface lui-même aux yeux du sujet. Nous voulons dire que, selon nous, la production du sens est strictement indissociable de la relation de paraphrase 3 entre des séquences telles que la famille paraphrastique de ces séquences constitue ce qu'on pourrait appeler la matrice du sens. Cela revient à dire que c'est à partir de la relation intérieure à cette famille que se constitue l'effet de sens ainsi que la relation à un référent qu'implique cet effet 4. Si l'on nous suit, on comprend dès lors que l'évidence de la lecture subjective selon laquelle un texte est biunivoquement associé à son sens (aux ambiguïtés syntaxiques et/ou sémantiques près) est une illusion constitutive de l'effet-sujet à l'égard du langage, et contribuant dans ce domaine spécifique à produire l'effet d'assujettissement que nous mentionnions plus haut : en réalité, nous

1. Cf. P. Henry (1971, 1974). 2. Le terme d'oubli ne renvoie pas ici à un trouble individuel de la mémorisation.

Il désigne paradoxalement ce qui n'a jamais été su et qui pourtant touche au plus près le « sujet parlant », dans l'étrange familiarité qu'il entretient avec les causes qui le déterminent... en toute ignorance de cause.

3. Nous ne posons donc pas au départ une « identité de sens » entre les membres de la famille paraphrastique, nous supposons au contraire que c'est dans cette relation que sens et identité de sens peuvent se définir, voir plus loin p. 61 et 70-72.

4. Donnons tout de suite un exemple de ce que nous entendons ici du point de vue discursif par « famille paraphrastique », à travers la présentation d'un « domaine sémantique » obtenu dans une étude récente effectuée avec l'AAD :

' , i équitable 1 ' l biens ' .... p US [ juste I I des { richesses } Répartition .... juste I des

' richesses revenus j

} * meilleure '

On verra plus loin que les relations que nous représentons ici par des accolades sont à interpréter comme des relations symétriques (traits verticaux) ou des relations non symétriques (flèches). Cf. p. 61. Remarquons du même coup que la paraphrase discursive ne doit pas être confondue avec ce que certains linguistes appellent para- phrase (par exemple la transformation passive). On y reviendra p. 71-73.

13

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 9: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

posons que le « sens » d'une séquence n'est matériellement concevable que dans la mesure où on conçoit cette séquence comme appartenant nécessairement à telle formation discursive et/ou à telle autre (ce qui explique au passage qu'elle puisse avoir plusieurs sens) x. C'est cette appartenance nécessaire de toute séquence à une formation discursive pour que cette séquence soit « douée de sens » qui se trouve refoulée pour (ou pâr ?) le sujet et recouverte pour ce dernier par l'illusion d'être à la source du sens, sous la forme de la re-saisie par le sujet d'un sens pré-existant universel (ceci explique en particulier le couple éternel individualité/uni- versalité caractéristique de l'illusion discursive du sujet). On remarquera au passage que cette herméneutique spontanée caractérisant l'effet sub- jectif par rapport au langage se redouble, sans changer fondamentalement de nature, dans les élaborations théoriques inhérentes à la conception chomskienne et post-chomskienne de la sémantique (recours inévitable à une sémantique universelle mise en mouvement dans une logique des prédicats, ce qui revient proprement à supposer le problème résolu en annulant la distance entre processus discursif et formulation logique).

Ces précisions permettent de comprendre pourquoi le dispositif AAD, dans la mesure où il se conforme aux conceptions de la théorie du discours que nous venons d'énoncer, exclut fondamentalement l'idée même de l'analyse sémantique d'un texte. Sur ce point il convient de noter la dis- tinction, sur laquelle nous reviendrons, entre analyse linguistique d'une séquence discursive et traitement automatique d'un ensemble d'objets obtenu au moyen de cette analyse, ce qui semble avoir partiellement échappé à S. Fisher et E. Veron 2 dans la mesure où ils semblent s'étonner que «malgré cet avertissement (l'impossibilité que nous venons de rappeler) Pêcheux. . . a essayé son système d'analyse sur un seul texte » - l'expres- sion « système d'analyse » est ici le lieu d'un jeu de mots télescopant analyse linguistique et analyse discursive.

Dans cette mesure, et à condition d'entendre par processus discursif les relations de paraphrase intérieures à ce que nous avons appelé la matrice du sens inhérente à la formation discursive, nous dirons que la procédure AAD constitue l'ébauche d'une analyse non subjective des effets de sens traversant l'illusion de l'effet-sujet (production/lecture) et remontant par une sorte d'archéologie réglée vers le processus discursif. Dans son état actuel, la procédure fournit ce qu'on peut appeler des traces du processus discursif que l'on se donne pour objet d'étude. Comme nous le montrerons plus loin,

1. Nous soulignons bien que cette conception ne s'identifie pas à celle des « lec- tures plurielles » qui suggèrent l'idée d'un foisonnement infini des significations, chaque sujet y manifestant sa singularité. Ce serait, selon nous, perdre de vue la matérialité du discursif et c'est, semble-t-il, ce que fait A. Trognon lorsqu'il écrit : « Ce que le discours dit, c'est ce que nous en écrivons dans la problématique que nous nous sommes définie. » Trognon, 1972, p. 28.

2. S. Fisher, E. Veron, 1973, pp. 162-181.

14

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 10: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

la difficulté à résoudre ici réside dans le fait que la famille de paraphrases (ou plutôt les différentes familles paraphrastiques ou domaines sémantiques) ne correspond pas directement à une proposition logique (ou à un système de propositions logiques). Ce n'est pas dans notre esprit l'effet d'une ina- déquation accidentelle et que l'on pourrait réduire en procédant plus fine- ment ; il s'agit de la distance déjà mentionnée entre proposition logique et processus discursif, distance qui est précisément imaginairement annulée à la fois par la philosophie spontanée de la logique formelle et par l'idéa- lisme positiviste en linguistique.

Comme nous venons de le voir, les processus discursifs tels qu'ils sont ici conçus ne sauraient avoir leur origine dans le sujet. Néanmoins ils se réalisent nécessairement dans ce même sujet ; cette apparente contradiction renvoie en réalité à la question même de la constitution du sujet et à ce que nous avons appelé son assujettissement. Sur ce point, certains éclaircissements s'imposent par rapport aux formulations ambiguës que le texte de 1969 fournissait, concernant les « conditions de production » notamment : cette ambiguïté résidait dans le fait que le terme « conditions de production » désignait à la fois l'effet des rapports de place dans lesquels se trouve inscrit le sujet et, simultanément, la « situation » au sens concret et empirique du terme, c'est-à-dire l'environnement matériel et institutionnel, les rôles plus ou moins consciemment mis en jeu, etc. A la limite, les conditions de production dans ce dernier sens détermineraient « la situation vécue par le sujet » au sens de variable subjective («attitudes », «représentations », etc.) inhérente à une situation expérimentale. Nous pouvons maintenant préciser que la première définition s'oppose à la seconde comme le réel à l'imaginaire et que ce qui faisait défaut dans le texte de 1969 c'était précisément une théorie de cet imaginaire repéré par rapport au réel. Faute de ce repérage il était inévitable (et c'est ce qui s'est effectivement produit) que les rapports de place soient confondus avec le jeu en miroir de rôles intérieurs à une institution le terme d'appareil introduit ci-dessus étant lui-même indû- ment confondu avec la notion d'institution. En d'autres termes, ce qui manquait et ce qui manque encore en partie, c'est une théorie non subjective de la constitution du sujet dans sa situation concrète d'énonciateur 2. Le fait qu'il s'agisse fondamentalement d'une illusion n'empêche pas la néces-

1. Les expressions par lesquelles nous tentions de caractériser les rapports entre «formations imaginaires » (Pêcheux, 1969, pp. 19-21), du type : Ia(A), Ia(B), etc..., laissent largement ouverte la possibilité d'une interprétation « interpersonnelle » du système des conditions de production : on trouve les répercussions de cette ambiguïté dans plusieurs travaux, dont par exemple M. J. Borel (1970). Par ailleurs, l'idée avan- cée par A. Trognon (1972, p. 164) selon laquelle l'AAD se donnerait pour fonction de distribuer les « éléments du discours » ou « unités textuelles » en fonction de ces diffé- rentes expressions (Ia(A), etc.) nous reste étrangère. Enfin nous serons d'accord avec L. Guespin pour reconnaître que la multiplication des « mécanismes » ne règle pas fondamentalement la question.

2. On verra plus loin les conséquences de cette difficulté à l'égard de la constitution du corpus.

15

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 11: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

sité de cette illusion et impose comme tâche au moins d'en décrire la struc- ture (sous la forme d'une ébauche descriptive des processus dénoncia- tion) et peut-être aussi d'articuler la description de cette illusion à ce que nous ayons ici appelé l'oubli n° 1.

2. La linguistique comme théorie des mécanismes syn- taxiques et des processus dénonciation.

Ainsi qu'il a été dit ci-dessus, le dispositif AAD vise à mettre en évi- dence les traces des processus discursifs 1. Le point de départ de Y AAD étant des corpus discursifs 2, il est normal que le dispositif comporte une phase d'analyse linguistique, puisque les textes appartenant aux corpus sont évidemment en « langue naturelle » et que les développements des trai- tements automatiques de textes ont montré l'impossibilité de s'en tenir à une étude statistique (cf. processus marko viens) de la linéarité.

Mais le choix de telle ou telle pratique d'analyse linguistique suppose au préalable une définition de la nature et du rôle que l'on attribue à la langue. Quel rapport en effet existe-t-il, du point de vue de la théorie du discours, entre les processus discursifs et la langue ? La perspective d'en- semble est la suivante : les processus discursifs étant à la source de la pro- duction des effets de sens, la langue constitue le lieu matériel où se réalisent ces effets de sens. Cette matérialité spécifique de la langue renvoie à l'idée de « fonctionnement » (au sens saussurien), par opposition à « fonction ». La caractérisation de cette matérialité constitue tout le problème de la linguistique. Comme on le verra plus loin, il est insuffisant de concevoir la langue comme la donnée d'un lexique et de systèmes phonologiques, mor- phologiques et syntaxiques (cette difficulté est accentuée dans l'article de T. A. Informations (Haroche-Pêcheux, 1972) où l'on parle de « stock lexical »). Néanmoins, on peut déjà utiliser cette formulation insuffisante en disant que, dans ces conditions, la tâche du linguiste consisterait à caractériser et à rendre opératoirement manipulables ce lexique et ces systèmes de règles, en se gardant bien d'y faire intervenir des considérations sémantiques incontrôlées, puisque ce serait justement retomber dans l'effet subjectif de la lecture.

1. Soulignons dès maintenant que les termes de discours, processus discursif, formation discursive, texte (ou séquence) ne sont aucunement interchangeables : leur définition va être précisée ci-après.

2. On entend par « corpus discursif » un ensemble de textes de longueur variable (ou séquences discursives), renvoyant à des conditions de production considérées comme stables, c'est-à-dire un ensemble d'images textuelles reliées à un « texte » virtuel (i. e. au processus discursif qui domine et engendre les différentes séquences discursives appartenant au corpus). On reprendra cette question à propos de la construction des corpus (cf. p. 23).

16

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 12: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

Or, précisément, l'analyse non subjective des effets de sens que l'AAD s'assigne comme objectif passe, on vient de le voir, par une phase d'analyse linguistique, dont nous allons montrer que le statut reste très problématique. En effet, la question tourne autour du rôle de la sémantique dans V analyse linguistique. Dans la perspective qui a été définie plus haut, il ne saurait être question de placer au départ de l'analyse linguistique ce qui doit jus- tement apparaître comme le résultat de la confrontation d'objets dérivant précisément de cette analyse. Autrement dit, l'analyse linguistique à laquelle l'AAD fait appel doit être essentiellement de nature morpho-syntaxique, et à ce titre permettre la dé-linéarisation spécifiquement linguistique des textes, liée aux phénomènes de hiérarchies, emboîtements, déterminations... Il ne saurait donc être question d'introduire une « conception du monde » reposant sur une sémantique universelle et a priori , puisque cela reviendrait à inclure dans le fonctionnement même de la langue les processus discursifs historiquement déterminés que l'on ne peut pas poser comme co-extensifs à la langue, sauf à identifier idéologie et langue x.

Ceci étant dit, il reste que les conditions de cette analyse « morpho- syntaxique » sont actuellement peu clairement définies et que le recours à un sémantisme implicite n'en est pas exclu. Tout se passe comme si l'analyse morpho-syntaxique mettait nécessairement en jeu des éléments que l'on a l'habitude d'appeler sémantiques. Gomme il sera montré dans la suite, la présentation initiale de l'AAD a systématiquement négligé cet aspect 2. Ceci s'explique à la fois par le caractère consciemment précaire des « solu- tions » linguistiques proposées et par l'urgence théorique de la lutte contre une conception idéaliste de la langue, conçue comme vision-perception du monde, et à la limite comme origine de ce dernier.

Présentée sous sa forme extrême, la position linguistique inhérente à l'AAD reviendrait à considérer que syntaxe et sémantique constituent deux niveaux autonomes et bien définis et que lexique et grammaire sont également deux domaines disjoints. Or, il n'en est visiblement pas ainsi. D'ailleurs la phase linguistique de l'AAD dans son état actuel illustre bien les difficultés liées à une telle exigence : loin d'éviter toute contamination de l'analyse linguistique par la sémantique, les règles syntaxiques appliquées

1. Le fait que le discours soit au point d'articulation des processus idéologiques et des phénomènes linguistiques ne doit pas aboutir à la confusion par laquelle la langue serait assimilée à une superstructure idéologique : cette précaution, qui constitue 'un des points de départ théoriques de l'AAD, a pu apparaître à certains comme une inter- diction (une normalisation !) cantonnant le linguiste dans des tâches subalternes (le sens interdit au linguiste !!!). On verra plus loin que, tout au contraire, cette distinction entre langue et idéologie conduit à une reformulation féconde de la problématique lin- guistique à travers la prise en compte des processus d'énonciation.

2. Le cas de l'analyse « syntaxique » des relatives constitue un exemple privilégié de la réintroduction subreptice de considérations sémantiques. Cet aspect, déjà abordé dans C. Fuchs, J. Milner et P. Le Goffic (1974) est repris dans le présent recueil par les textes de P. Henry et de A. Grésillon.

17 LANGAGES N° 37 2

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 13: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

introduisent subrepticement des recours incontrôlés au sens. Est-ce à dire que cette sémantique, à laquelle l'analyse syntaxique ne peut pas ne pas faire appel, c'est précisément ce qui a été désigné plus haut sous le nom de sémantique discursive ? S'il en était ainsi, cela reviendrait à dire que l'autonomie théorique de la linguistique est très exactement nulle puisqu'on ne retrouverait à la fin que ce qu'on avait mis au début. Nous ne pensons pas qu'il en soit ainsi. Cette situation nous paraît en fait liée à l'héritage philosophique que véhiculent nécessairement les catégories grammaticales, même sous leur aspect le plus neutre, le plus moderne, le plus technique. Ce qui fait actuellement défaut, c'est une théorie du fonctionnement matériel de la langue dans son rapport à elle-même , c'est-à-dire d'une systématicité qui ne s'oppose pas à du non-systématique (la langue/la parole), mais qui s'articule sur des processus. Si l'on convient d'appeler « sémantique formelle H la théorie de ce fonctionnement matériel de la langue, on peut dire que ce qui manque à l'analyse linguistique, c'est précisément une telle sémantique formelle, dont on voit bien qu'elle ne coïncide nullement avec la « séman- tique discursive » évoquée plus haut. L'expression « sémantique formelle », empruntée à A. Culioli, que nous définirons plus loin comme le niveau ultime de l'analyse linguistique, atteindrait, en ce sens, le lieu spécifique de la langue qui correspond à la construction de l'effet-sujet. Si notre hypo- thèse est juste, cela signifie du même coup que l'AAD qui se veut « traverser l'effet-sujet » doit repérer où elle le traverse dans la langue ; ne pas repro- duire cet effet dans la pratique d'une analyse objective est un souci légi- time, en oublier l'existence dans l'objet d'étude est par contre une erreur.

Ceci nous conduit nécessairement à la question de Y ènonciation, et il n'est pas inutile de fournir à ce propos quelques précisions, étant donné la manière dont l'idéalisme « occupe » aujourd'hui cette question, avec les différents obstacles qui en résultent.

Si l'on définit l'énonciation comme le rapport toujours nécessairement présent du sujet énonciateur à son énoncé, alors apparaît clairement, au niveau même de la langue, une nouvelle forme de l'illusion selon laquelle le sujet se trouve à la source du sens ou s'identifie à la source du sens : le discours du sujet s'organise par référence (directe, différée), ou absence de référence à la situation d'énonciation (le « moi-ici-maintenant » du locuteur), qu'il éprouve subjectivement comme autant d'origines sur des axes de repérages (axe des personnes, des temps, des localisations). Toute activité de langage nécessite la stabilité de ces points d'ancrage pour le sujet ; si cette stabilité vient à manquer, il y a atteinte à la structure même du sujet et à l'activité de langage.

Nous parlions d'obstacles : il s'agit à la fois de l'illusion empiriste subjective qui se reproduit dans la théorie linguistique et de l'illusion for- maliste qui fait de l'énonciation un simple système d'opérations. Commen-

1. Cf. plus loin, p. 50.

18

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 14: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

tant les notions de sujet énonciateur et de situation dénonciation, P. Fiala et C. Ridoux écrivent : « . . . encore faut-il ne pas les réduire à un simple support d'opérations formelles, mais tenter à chaque fois d'en dégager le contenu réel pour éviter les pièges toujours présents du formalisme » (Fiala et Ridoux, 1973, p. 44). Dans un texte antérieur, M. Hirsbrunner et P. Fiala notaient à ce propos, en commentant les propositions de Benve- nute : « En fait, sémiotique et sémantique apparaissent comme la transpo- position linguistique des catégories philosophiques de la puissance et de l'acte... Là encore la médiation est opérée à l'aide d'une notion ambiguë, l'énonciation, définie formellement (...) mais justifiée philosophiquement : « l'énonciation est cette mise en fonctionnement de la langue par un acte individuel d'utilisation ». Nous nous trouvons confrontés ici à la difficulté essentielle de la démarche saussurienne, celle qui constitue, selon nous, le blocage principal de toute théorie saussurienne du discours. Certes, la langue conçue seulement comme système de signes est dépassée, mais c'est au prix de l'introduction au sein même de la théorie linguistique des deux notions qu'elle avait tenté de rejeter, en se constituant comme science, le sujet et son rapport au monde social. Or - et c'est là le paradoxe - ces deux notions, si elles viennent remplir une place dans l'appareil concep- tuel, n'ont en fait aucun statut théorique précis. En opposant la liberté du sujet individuel à la nécessité du système de la langue, en posant la langue comme médiation du sujet au monde, et le sujet comme s' appro- priant le monde par l'intermédiaire de la langue, et la langue par l'inter- médiaire de l'appareil de l'énonciation, Benveniste ne fait que transposer en termes linguistiques des notions philosophiques qui, loin d'être neutres, appartiennent directement au courant idéaliste» (Hirsbrunner et Fiala, 1972, pp. 26-27). Nous tenterons de montrer ci-dessous comment nous proposons de sortir la problématique de l'énonciation de ce cercle de l'idéa- lisme.

La difficulté actuelle des théories de l'énonciation réside dans le fait que ces théories reflètent le plus souvent l'illusion nécessaire 1 constitutrice du sujet, c'est-à-dire qu'elles se contentent de reproduire au niveau théo- rique cette illusion du sujet , à travers l'idée d'un sujet énonciateur porteur de choix, intentions, décisions, etc. dans la tradition de Bally, Jakobson, Benveniste (la « parole » n'est pas loin !) 2.

La référence introduite ci-dessus au fonctionnement matériel des

1. Le terme d'« illusion nécessaire » a été introduit pour la première fois par P. le Goffic (Cf. ouvrage collectif sur les relatives, par G. Fuchs, J. Milner et P. le Goffic, 1974).

2. Cette conception de l'énonciation revient en fait à mettre le « sujet psycholo- gique » idéaliste à la base de la linguistique. C'est ce que constate R. Robin en disant : t La linguistique du discours n'a pas réussi à opérer le décentrement du sujet du discours car elle n'a pas réussi à intégrer à sa théorie du sujet ni le sujet idéologique du matéria- lisme historique ni le sujet psychanalytique » (Robin, 1973, p. 81).

19

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 15: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

mécanismes syntaxiques par rapport à eux-mêmes nous permet de préciser ce que nous entendons par énonciation de la manière suivante. Nous dirons que les processus dénonciation consistent en une série de déterminations successives par lesquelles l'énoncé se constitue peu à peu, et qui ont pour caractéristique de poser le « dit » et donc de rejeter le « non-dit ». L'énon- ciation revient donc à poser des frontières entre ce qui est « sélectionné » et précisé peu à peu (ce par quoi se constitue 1'« univers de discours ») et ce qui est rejeté. Ainsi se trouve donc dessiné en creux le champ de « tout de qu'il aurait été possible au sujet de dire (mais qu'il n'a pas dit) » ou de « tout ce à quoi s'oppose ce que le sujet a dit ». Cette zone du « rejeté » peut être plus ou moins proche de la conscience et il arrive que des questions de l'interlocuteur visant par exemple à faire préciser au sujet « ce qu'il voulait dire » lui fassent reformuler les frontières et ré-investiguer cette zone 1. Nous proposons d'appeler cet effet d'occultation partielle « oubli n° 2 » et d'y voir la source de l'impression de réalité de la pensée pour le sujet (« je sais ce que je dis », « je sais de quoi je parle »).

Il découle de ce qui précède que l'étude des marques liées à l'énonciation doit constituer un point central de la phase d'analyse linguistique de l'AAD, et qu'elle induit des modifications importantes dans la conception de la langue. Tout d'abord le lexique ne peut être considéré comme un « stock d'unités lexicales », simple liste de morphèmes sans connexion avec la syn- taxe, mais au contraire comme un ensemble structuré d'éléments articulés sur la syntaxe. Deuxièmement, la syntaxe ne constitue plus le domaine neutre de règles purement formelles, mais le mode d'organisation (propre à une langue donnée) des traces des repérages énonciatifs. Les constructions syntaxiques ont donc de ce point de vue une « signification » qu'il s'agit de dégager.

Il est, dans cette perspective, intéressant de préciser le lien entre les deux oublis que nous avons qualifiés respectivement de n° 1 et n° 2 : quel rapport existe-t-il entre la famille de séquences paraphrastiques constitu- tives des effets de sens, et le « non-dit », qui sont tous les deux mis hors jeu ?

3. Langue, idéologie, discours.

Considérons ce que nous avons désigné respectivement sous le nom d'« oubli n° 1» et d'« oubli n° 2». On voit que ces deux oublis diffèrent

profondément l'un de l'autre. On constate en effet que le sujet peut pénétrer consciemment dans la zone n° 2 et qu'il le fait en réalité cons- tamment par un retour sur soi de son discours, une anticipation de son effet et la prise en compte du décalage qu'y introduit le discours d'un

1. Cf. la notion ď« anti-paraphrase » introduite par S. Fisher et E. Veron (1973).

20

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 16: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

autre 1. Dans la mesure où le sujet se reprend pour s'expliciter à lui-même ce qu'il dit, pour approfondir « ce qu'il pense » et le formuler plus adéquate- ment, on peut dire que cette zone n° 2, qui est celle des processus dénon- ciation, se caractérise par un fonctionnement de type préconscient/cons- cient. Par opposition, l'oubli n° 1, dont la zone est inaccessible au sujet, apparaît précisément pour cette raison, comme constitutif de la subjectivité dans le langage. A ce titre on peut avancer que ce refoulement (portant à la fois sur le processus discursif lui-même et sur l'inter-discours 2 auquel il s'articule par des rapports de contradiction, d'asservissement ou d'empié- tement) est de nature inconsciente , au sens où l'idéologie est constitutivement inconsciente d'elle-même (et non pas seulement distraite à propos d'elle- même, s'échappant incessamment à elle-même, . . . ) 3.

Cette opposition entre les deux types d'oubli n'est pas sans rapport avec l'opposition déjà mentionnée entre la situation empirique concrète dans laquelle se trouve le sujet, marquée par le caractère de l'identification imaginaire où l'autre est un autre moi (« autre » avec un petit a), et le processus d'interpellation-assujettissement du sujet, se référant à ce que J. Lacan désigne métaphoriquement par 1'« Autre» avec un grand A ; en ce sens, le monologue est un cas particulier du dialogue et de l'interpella- tion.

En d'autres termes, nous posons que le rapport entre les deux oublis n° 1 et n° 2 renvoie au rapport entre la condition d'existence (non-subjec- tive) de l'illusion subjective d'une part et les formes subjectives de sa réalisation d'autre part 4.

En utilisant ici la terminologie freudienne qui distingue le pré-conscient- conscient d'une part, l'inconscient d'autre part, nous ne prétendons nulle- ment régler la question du rapport entre idéologie, inconscient et discur- sivité : nous voulons seulement marquer le fait qu'une formation discursive est constituée-bordée par ce qui lui est extérieur, donc par ce qui y est strictement informulable puisqu'il la détermine , et souligner en même temps que cette extériorité constitutive ne saurait en aucun cas être confondue avec Vespace subjectif de V énonciation, espace imaginaire qui assure au sujet parlant ses déplacements à V intérieur du reformulable , de sorte qu'il fait incessamment retour sur ce qu'il formule, et s'y reconnaît dans le « rapport réflexif ou préconscient aux mots, qui nous les fait apparaître

1. Cette zone n° 2 est le domaine de ce qu'on appelle parfois les « stratégies dis- cursives », comportant en particulier l'interrogation rhétorique, la reformulation tendan- cieuse et l'usage manipulatoire de l'ambiguïté. Cf. sur ce point C. Haroche (1974).

2. Nous entendons par là 1'« extérieur spécifique » d'un processus discursif donné (Cf. AAD 1969, p. 111), c'est-à-dire les processus qui interviennent dans la constitution et l'organisation de ce dernier.

3. Voir en particulier C. Haroche et M. Pêcheux, 1972 (b), pp. 67 à 83. 4. Sur ce point, et en particulier sur la distinction loi inconsciente/règle précons-

ciente-consciente, cf. Th. Herbert (1968), Voir la discussion de R. Robin (1973, p. 100).

21

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 17: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

comme l'expression des choses », selon la formulation de M. Safouan dans « De la structure en psychanalyse » (1968), p. 282. Le terme de préconscient renvoie, comme on le sait, à la première topique freudienne, et disparaît comme tel dans la deuxième. Or, c'est en grande partie dans le cadre de cette seconde topique que s'est effectuée la réélaboration lacanienne du freudisme, à laquelle nous faisons ici référence. Nous reviendrons dans une autre étude sur cette « incohérence » théorique, pour l'expliquer, la tra- vailler et la réduire.

Cette « inégalité » entre les deux oublis correspond à une relation de dominance que l'on peut caractériser en disant que «l'inasserté précède et domine l'asserté » 1.

En outre, il ne faut pas perdre de vue que le refoulement qui caractérise l'oubli n° 1 règle en fin de compte le rapport entre dit et non-dit dans l'ou- bli n° 2, où se structure la séquence discursive. Ceci doit être compris au sens où, pour Lacan « tout discours est occultation de l'inconscient ».

Pour conclure cette présentation générale, nous dirons qu'il y a deux erreurs complémentaires à éviter à propos du terme « discours », tel qu'il fonctionne dans l'expression « théorie du discours ». La première consiste à confondre discours et parole (au sens saussurien) : le discours serait alors la réalisation en actes verbaux de la liberté subjective « échappant au système » (de la langue). Contre cette interprétation nous réaffirmons que la théorie du discours et les procédures qu'elle engage ne sauraient s'identi- fier avec une « linguistique de la parole ». La deuxième erreur s'oppose à la première en ce qu'elle « tord dans l'autre sens » la signification du terme discours, en y voyant un supplément social de l'énoncé, donc un élément particulier du système de la langue, que la « linguistique classique » aurait négligé. Dans cette perspective, le niveau du discours s'intégrerait à la langue, par exemple sous la forme d'une compétence de type particulier, dont les propriétés varieraient en fonction de la position sociale, ce qui reviendrait à l'idée qu'il existe des langues, en prenant au pied de la lettre l'expression politiquement juste, mais linguistiquement discutable selon laquelle « patrons et ouvriers ne parlent pas la même langue ».

Face à ces deux déformations de la réalité désignée par le terme « dis- cours », nous pensons utile d'introduire la distinction entre base (linguis- tique) et processus (discursif) se développant sur cette base 2, distinction qui selon nous peut seule autoriser la prise en considération des rapports de contradiction, antagonisme, alliance, absorption, . . . entre des forma- tions discursives appartenant à des formations idéologiques différentes, sans pour autant impliquer l'existence mythique d'une pluralité de « langues » appartenant à ces différentes formations.

1. Cf. Culioli, Fuchs, Pêcheux (1970). 2. Les processus ďénonciation constituent ce qui, à l'intérieur même de la « base »

linguistique autorise que des processus se développent par rapport à elle.

22

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 18: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

Deuxième partie

L'ANALYSE AUTOMATIQUE DU DISCOURS : CRITIQUES ET PERSPECTIVES NOUVELLES

1. Construction du corpus en fonction de ses conditions de

production dominantes.

L'introduction et les développements qui précèdent indiquent clai- rement que les « conditions de production » d'un discours ne sont pas des sortes de filtres ou de freins qui viendraient infléchir le libre fonctionnement du langage, au sens où, par exemple, la résistance de l'air intervient sur la trajectoire d'un mobile dont la cinématique prévoit le déplacement théorique, c'est-à-dire ce que serait ce déplacement si le mobile était réduit à un point, et se déplaçait dans le vide. En d'autres termes, il n'y a pas d'espace théorique socialement vide dans lequel se développeraient les lois d'une sémantique générale (par exemple des lois de la « communica- tion »), et dans lequel on ré-introduirait, à titre de paramètres correctifs des « contraintes » supplémentaires, de nature sociale. En fait, tout ce que nous avons introduit plus haut vise à expliciter les raisons pour lesquelles le discursif ne peut être conçu que comme un processus social dont la spé- cificité réside dans le type de matérialité de sa base, à savoir la matérialité linguistique.

Dès lors, l'expression « conditions de production ďun discours » néces- site d'être explicitée dans son détail, pour éviter des erreurs d'interprétation que l'ambiguïté de certaines formulations a pu entraîner. Remarquons tout d'abord que le terme même de « discours » peut renvoyer à ce que nous avons appelé plus haut un processus discursif *, mais aussi à une séquence verbale orale ou écrite de dimension variable, en général supérieure à celle de la phrase. Cette dernière réalité, en raison de son caractère immédiate- ment « concret » a été désignée (Pêcheux, 1969) par l'expression « surface discursive » qui a cependant le double défaut de laisser entendre que les séquences sont traitées au niveau de leurs formes de « surface », au sens chomskien du terme, et de désigner sous une forme trop raccourcie, ce qui est en fait la surface linguistique d'un discours. Cette erreur sur le sens de « surface discursive » nous conduit à souligner la nécessaire distinction entre les deux types de dé-syntagmatisation inhérents, selon nous, au domaine du linguistique d'une part et à celui du discursif d'autre part : la dé-syn- tagmatisation linguistique (ou encore : dé-superficialisation) renvoie à l'existence matérielle de la langue, caractérisée par la structure non-linéaire des mécanismes syntaxiques et plus profondément par tout ce sur quoi

1. Par exemple quand on parle du « discours d'une science ».

23

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 19: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

s'exerce 1'« oubli n° 2 » ; la dé-syntagmatisation discursive, quant à elle, ne peut commencer à effectuer cette remontée au-delà de 1'« oubli n° 1 » qu'en prenant appui sur l'opération linguistique que nous venons de men- tionner. Ces remarques nous permettent de proposer les distinctions termi- nologiques suivantes :

• Surface linguistique sera entendu au sens de séquence orale ou écrite de dimension variable, en général supérieure à la phrase. Il s'agit là d'un « discours » concret, c'est-à-dire de l'objet empirique affecté par les oublis 1 et 2, dans la mesure même où il est le lieu de leur réalisation, sous la forme cohérente et subjectivement vécue comme nécessaire d'une double illusion.

• Objet discursif sera entendu comme le résultat de la transformation de la surface linguistique d'un discours concret en un objet théorique, c'est-à-dire en un objet linguistiquement désuperficialisé, produit par une analyse linguistique visant à annuler l'illusion n° 2.

• Processus discursif sera entendu comme le résultat de la mise en rapports réglée d'objets discursifs correspondant à des surfaces linguistiques relevant elles-mêmes de conditions de production stables et homogènes. Cet accès au processus discursif est obtenu par une dé-syntagmatisation portant sur la zone d'illusion-oubli n° 1.

Soulignons cependant que la remontée complète en deçà de cet oubli suppose non seulement la mise en évidence de la formation discursive sous-jacente (« matrice du sens » dont la procédure AAD actuelle permet de repérer certaines traces), mais aussi la saisie des rapports de décalage entre cette formation discursive et l'inter-discours qui la détermine (ce point n'a pas encore reçu aujourd'hui de solution « opérationnelle »).

Nous résumerons les remarques terminologiques ci-dessus par le schéma suivant :

LANGUE DISCOURS analyse des mécanis- analyse d'un corpus mes syntaxiques et d'objets discursifs fonc-

Surface lin- des fonctionnements tionnant comme auto- guistique énonciatifs objet dis- dictionnaire processus d'un dis- * cursif > discursif cours appar- = dé-superflcialisation (graphe = dé-syntagmatisation tenant au linguistique, visant à connexe) discursive, rompant corpus annuler l'effet de la connexité propre à

« l'oubli n° 2 » (pré- chaque objet discursif conscient-conscient au et commençant à annu- niveau de l'imagi- 1er l'effet de « l'oubli naire) n° 1 »

Nous pouvons maintenant reprendre l'examen de l'expression « condi- tions de production d'un discours » dont nous disions qu'elle peut présenter certaines ambiguïtés : il apparaît en effet, à la lumière de ce qui précède, que l'on peut entendre par là soit les déterminations qui caractérisent un

24

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 20: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

processus discursif , soit les caractéristiques multiples ďune « situation concrète » conduisant à la « production », au sens linguistique ou psycho-linguistique de ce terme, de la surface linguistique d'un discours empirique concret. Bien entendu, cette ambiguïté est la même que celle qui a déjà été signa- lée plus haut à propos de l'opposition institution/appareil : dans les deux cas, ce qui est en jeu, c'est la nécessité de reconnaître le décalage entre le registre de l'imaginaire, dont l'existence n'est pas annulable sous pré- texte qu'il s'agit de l'imaginaire, et l'extérieur qui le détermine. Dans cette mesure, il apparaît qu'il nous manque radicalement une théorie de la « situation concrète » en tant que formation idéologique où le « vécu » est informé, constitué par la structure de l'Idéologie, c'est-à-dire devient cette structure dans la forme de l'interpellation reçue, pour reprendre une formu- lation de L. Althusser.

Cette théorie de la « situation concrète », c'est-à-dire une mise en rapport théorique des déterminations à leur effet imaginaire, est en définitive le point à partir duquel les opérations de construction du corpus pourraient trouver leur véritable statut. Cette articulation faisant actuellement encore défaut *, la pratique de construction des corpus (et des plans de traitement combinant plusieurs corpus) en subit inévitablement l'effet, sous la forme d'une tentation empiriste visant l'impossible articulation d'une psychologie « expérimentale » et du Matérialisme Historique. Disons cependant que, sous les deux formes que nous allons examiner ci-dessous (traitement expérimental, traitement d'archives), le lien entre l'imaginaire et l'extérieur qui le détermine passe par le concept de dominance : on dira qu'un corpus est constitué par une série de surfaces linguistiques (discours concrets) ou d'objets discursifs (ce qui suppose un mode d'intervention différent de la pratique linguistique dans la définition du corpus, nous y reviendrons), ces surfaces étant dominées par des conditions de production stables et homogènes. Cela signifie que l'on suppose que tout discours « concret » est en fait un complexe de processus renvoyant à des conditions différentes. Déterminer la construction du corpus par la référence à cette dominance revient donc à défalquer comme des éléments étrangers au processus étudié les éléments individuels qui peuvent apparaître dans tel discours « concret » et non dans tel autre, les deux étant dominés par les mêmes conditions. Cela n'exclut bien entendu nullement que l'on se donne pour objet d'étude des différences, mais ces différences seront toujours considérées comme des différences entre corpus , résultant de différences entre conditions de produc- tion, et jamais comme des différences individuelles.

Précisons les deux formes de traitement que nous mentionnions plus haut, à savoir le traitement « expérimental » et le traitement d'archives. Il s'agit de deux procédures différentes visant toutes les deux à construire

1. Précisons que la théorie de cette articulation nécessite une élaboration sur un plan général et ne saurait se confondre avec les conditions et les résultats de telle ou telle analyse discursive particulière ; cette remarque afin d'éviter ici l'idée d'un cercle vicieux.

25

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 21: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

un corpus, ou un système de corpus, qui puisse être soumis à l'analyse AAD, Soulignons bien que, dans les deux cas, les principes théoriques et les consi- dérations pratiques qui guident cette phase sont strictement extérieurs aux principes et aux caractéristiques « techniques » du dispositif AAD lui-même. En d'autres termes, la responsabilité théorique qui préside à la construction du corpus (ou système de corpus) n'a en principe rien de commun avec la responsabilité qui est spécifiquement celle de la procédure AAD, à savoir la responsabilité de réaliser une lecture non-subjective ; il faut toutefois ajouter immédiatement que, bien entendu, les responsabilités prises au niveau extra-discursif (les différentes hypothèses sociologiques, histo- riques, etc.) qui président à la construction du corpus ne sont pas sans effet sur les résultats que produira l'analyse AAD. Mieux, on peut dire que ces résultats refléteront ces hypothèses au niveau des effets discursifs repérés, ce qui ne veut pas dire que les résultats soient le pur et simple reflet transparent des hypothèses extra-discursives servant à la construction. Sans cette distinction entre ces deux responsabilités, on est fatalement conduit à l'idée d'une circularité par laquelle l'AAD court le risque « de retrouver comme résultat de l'analyse le contenu même introduit et orga- nisé par cette catégorisation », comme le soupçonnent M. Borillo et J. Vir- bel dans un article récent (1973, p. 1) dont nous discuterons plus loin les remarques critiques de nature linguistique et/ou documentaire. En pré- tendant que « en fait, la démarche qui mène au choix du terme « circons- tance » revient exactement à celle que Gayot et Pêcheux récusent tout d'abord » (art. cit., p. 12), Borillo et Virbel mettent le doigt sur une diffi- culté tout à fait réelle, tout en commettant en même temps une subreption logique ; expliquons-nous : en disant que ces auteurs commettent une subreption logique, nous voulons dire que faute de reconnaître la nécessité de la distinction entre les deux types de responsabilité que nous évoquions plus haut, ils nous attribuent eux-mêmes cette confusion, et en tirent des « conséquences » qui, pour cette raison, sont au moins partiellement inva- lides : ne pas distinguer, en effet, entre les déterminations extra-discursives (et extra-linguistiques a fortiori) d'une part et la « catégorisation » (pour reprendre leur formulation) que la procédure AAD prétend produire comme un résultat sans en présupposer l'existence dans le système de lecture inhérent à cette procédure, c'est finalement superposer le niveau linguis- tique, le niveau discursif et le niveau idéologique-culturel (cf. hypothèse implicite de type Sapir-Whorf) et les identifier comme le lieu où s'effectue la même « catégorisation », une première fois sans le dire au niveau du choix des éléments constituant le corpus, une deuxième fois au niveau des « résultats » obtenus par AAD, qui ne seraient en réalité que le reflet trans- parent 1 de la première « catégorisation ». C'est finalement la non-réducti-

1. Cette transparence est démentie dans la pratique par l'alternance des commen- taires en présence d'un même ensemble de résultats AAD. Cette alternance fonctionne selon le principe : « Vous dites que vous obtenez ce résultat, prouvez-le »/« Ce résultat que vous obtenez est évident ».

26

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 22: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

bilité du discursif au linguistique ou à l'idéologique dont il faut ici rappeler l'importance, sauf à retomber dans les apories d'une théorie idéaliste de l'idéologie. Cette perspective, qu'il faut bien appeler régressive dans la mesure où elle vise en définitive à poser l'impossibilité de l'objectif que nous nous sommes fixé (« reconnaissez enfin qu'il est impossible d'éviter une catégorisation a priori , qu'on ne peut pas éviter le recours à la sub- jectivité », etc.) ne doit pas empêcher de discerner ce qui, dans les critiques sur lesquelles cette régression se fonde, constitue une mise en cause justifiée nous permettant d ' aller plus loin dans la direction que nous avons rappelée ci-dessus.

Une fois posé que la matérialité de l'idéologie ne s'identifie nullement à la matérialité discursive (dans la mesure où cette dernière en est un élément particulier, ce qui implique, en ce qui nous concerne, que les conditions de construction d'un corpus ne sauraient être intra-discursives exclusive- ment), il est possible de prendre en considération les critiques que Borillo- Virbel ont formulées sur ce point. Disons que la principale consiste à souligner le caractère passablement immotivé du principe de construction retenu dans l'article concerné, à savoir la sélection, dans un ouvrage donné, des phrases contenant un certain « mot-pôle », en l'occurrence, le mot « circonstances ». Le reproche est double :

- d'une part, on voit mal, ďun point de vue méthodologique , comment le détail de « justifications de nature extrêmement variée » (art. cit., p. 10) a conduit à retenir le terme « circonstances » et pas autre chose,

- d'autre part, la décision de retenir les phrases (séquences séparées par deux points) contenant le terme retenu constitue un deuxième aspect arbitraire contribuant également à incriminer la procédure choisie.

Reprenons successivement ces deux points : - En ce qui concerne la première critique, elle semble assez largement

justifiée. Il ne suffît pas en effet, pour y répondre, de souligner le caractère non méthodologique mais directement théorique (en l'occurrence la théorie matérialiste-historique) de la procédure qui a conduit à retenir le terme « circonstances ». En fait, une « analyse concrète de la situation concrète 1 » aurait dû aboutir à un système de points sensibles en rapport entre eux et susceptible de se projeter méthodologiquement dans un plan de traitement reliant plusieurs corpus en vue de l'interrogation de leurs différences. Autre- ment dit, il nous semble possible et nécessaire actuellement de ne pas s'en tenir à l'analyse d ''un corpus construit arbitrairement à partir ďun mot-

1. L'analyse concrète d'une situation concrète suppose, selon nous, que la maté- rialité discursive dans une formation idéologique soit conçue comme une articulation de processus. Rappelons sur ce point la remarque de P. Fiala et G. Ridoux (1973, p. 45) : « Le texte » - nous dirions quant à nous : le discours - « n'est pas un ensemble d'énoncés porteurs d'une, voire de plusieurs significations. C'est d'abord un processus qui se développe sous de multiples formes dans des situations sociales données. »

27

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 23: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

pôle, en ayant systématiquement recours à l'analyse des différences interne» qu'un plan de traitement peut mettre en évidence. Ceci suppose, au niveau méthodologique, l'existence d'un moyen permettant d'associer n corpus en un seul pour étudier les différences qui se trouvent ainsi induites ; ce moyen, actuellement réalisé dans le programme par la procédure dite de « compactage » (cf. p. 62), n'était pas disponible à l'époque où le travail évoqué a été réalisé. De fait, l'évolution de notre conception du traitement a été dans ce sens : en définitive, l'accès au processus discursif propre à un corpus nous paraît en grande partie trouver sa garantie dans l'étude de sa spécificité à l'intérieur d'un système d'hypothèses réalisées sous la forme d'un complexe de corpus , traité à l'aide de la procédure de compactage évoquée à l'instant. Finalement, il s'agit à la fois d'étudier la productivité de telle hypothèse et d'en déduire les caractéristiques du processus discursif étudié. Ajoutons, toujours sur ce premier point, que rien n'interdit de penser que des procédures préalables de défrichage statistique (par exemple des études de co-occurrences comme celles que propose l'équipe de lexico- logie de l'ENS de St-Cloud pourraient présenter un intérêt pour le repérage initial du champ des hypothèses ; par ailleurs, on peut envisager un contrôle statistique a priori de l'homogénéité de chaque corpus soumis à l'analyse, ou des règles de clôture d'un corpus 2.

- La deuxième critique porte sur le caractère relativement arbitraire de la procédure de segmentation, fondée sur le critère de la phrase. Disons tout de suite que ce reproche, tout à fait justifié, désigne une difficulté très grave dont il est impossible de dire aujourd'hui comment elle sera résolue. Quelles sont les limites empiriques d'un « discours » à l'intérieur d'une séquence complexe donnée ? Les combinaisons de processus corres- pondent-elles à des juxtapositions dans la linéarité de la séquence, ou non ? Tout ce qu'on peut dire, c'est que toute notion « littéraire » renvoyant à « l'unité intérieure » de 1'« œuvre », du texte, du paragraphe, etc. est nulle et non avenue, compte tenu des présupposés théoriques que nous avons rappelés plus haut. Le principe d'une liaison expressive entre l'unité organique de la forme et l'unité intentionnelle du fond - contenu, projet ou sens - est un mythe littéraire (nécessaire à la forme classique de 1'« explication de textes ») qui reproduit l'illusion subjective commentée plus haut. On ne peut que constater que cette question, soulevée également par Geneviève Provost- Chauveau (1970 p. 135), renvoie aux limites mêmes de la linguistique de la phrase, sur quoi nous reviendrons plus loin, et désigne le vide urgent à combler d'une théorie de Vinter -phrase.

L'étude critique que nous venons d'effectuer n'est pas sans conséquences à l'égard des deux procédures de construction de corpus que nous avions commencé par distinguer : si, en effet, on considère d'une part la voie « expérimentale » dans laquelle une mise en scène reproduit (avec un coeffi-

1. Geffroy et al. (1973). 2. Cf. ci-dessus, p. 24-25 et ci-dessous, pp. 56-57 et 68.

28

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 24: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

cient variable d'imaginaire) une « situation concrète » quant à tel ou tel des effets qui la caractérisent 1 et d'autre part la voie « archiviste 2 », on constate que le problème de la segmentation du discours ne se pose pas (ou est plus facilement soluble) dans le cas de la voie « expérimentale », et que par ailleurs l'idée qu'il est préférable de traiter un système d'hypothèses réalisé en « complexe de corpus » revient à considérer le champ d'archivé comme un dispositif quasi expérimental. Pour ces différentes raisons, nous avancerons l'opinion que la forme-archive est à considérer comme une forme dérivée, « abâtardie » de la procédure de traitement qui, dans sa visée, est de nature expérimentale ; ce point méritait d'être souligné, étant donné un certain nombre d'interprétations « non directivistes » auxquelles certaines formulations de AAD 1969 avaient donné lieu.

Il convient toutefois d'ajouter aussitôt que cette indication d'orienta-

1. Dans des rapports de places inscrits à l'intérieur des rapports de classes. 2. La procédure AAD a été appliquée (dans la perspective « archiviste ») par l'his-

torien G. Gayot pour trois études indépendantes portant sur des textes du xvme siècle. Voici les remarques qu'il nous a transmises sur ce point : « Dans les trois cas, les processus discursifs que nous avons repérés correspondaient à ce qu'une lecture informée des textes suggérait à l'historien. Mais deux faits méritent attention.

1) On sait que, dans la forme de traitement dite « archives », le corpus est constitué par les séquences extraites d'un ensemble donné et contenant le terme choisi en raison du rôle déterminant que je lui attribue hypothétiqueinent en tant qu'historien.

Or, malgré le soin apporté à mon choix, il est arrivé que les résultats soient « pauvres », en ce sens que les mécanismes discursifs mis en œuvre dans le contexte du terme choisi ne fournissent rien de plus que ce que fournissait un long apprentissage de la lecture des textes soumis à l'analyse (cf. Histoire et Linguistique, A. Colin, 1973, p. 242). Je crois qu'en fait il en sera toujours ainsi avec des corpus centrés sur un terme dont la puissance est telle, dans les conditions discursives considérées, qu'il crée le vide autour de lui et ne convoque, outre le processus principal qu'il contient, que des processus dérivés directement subordonnés. Ainsi se trouve « expérimentalement » mise en cause l'évidence qui voudrait que l'importance indiscutable d'un mot pour ceux qui l'ont utilisé, à une époque donnée, soit nécessairement productive du point de vue des processus discursifs qui lui sont liés.

2) Les deux autres études par contre (Gayot-Pêcheux, Annales 1971, (3-4) pp. 681- 704 et Gayot, à paraître) nous ont montré que la forme dominante de sélection-combi- naison des mots liée à l'emploi du terme choisi laissait la place au fonctionnement de processus discursifs secondaires relativement autonomes qui , à la simple lecture , pouvaient être perçus comme principaux (Exemples : les enchaînements sur le thème du progrès général réalisé par les masses chez Saint-Martin ; les enchaînements sur le thème de la fraternité et de l'égalité des hommes chez les francs-maçons au xvnie siècle). L'AAD a en fait montré que ces mécanismes secondaires étaient repris, intégrés et comme digé- rés dans l'organisation générale du discours régie chez Saint-Martin par la confiance accordée à la seule élite des élus de Dieu et, chez les francs-maçons, par le service rendu par la fraternité maçonnique à l'ordre établi, à l'ordre traditionnel et non pas à l'ordre « à venir ».

Ainsi l'AAD permet à l'historien, à partir d'une collection d'énoncés donnés, de recomposer et de distinguer les règles - principales et annexes - qui les produisent Cette distinction est capitale pour échapper aux pièges tendus, au long de la lecture, par les processus discursifs secondaires qui projettent une zone d'ombre autour du processus dominant. En ce qui nous concerne, le bénéfice que nous en avons retiré porte avant tout sur la mise en évidence du piège que constitue l'idéologie singulière conservatrice ou contre-révolutionnaire sous-tendue par le discours maçonnique ou martiniste au xvnie siècle, idéologie qui a pu tromper et trompe encore certains zéla- teurs du progrès. »

29

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 25: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

tion ne résout en elle-même aucun problème de fond quant à la nature d'une expérimentation matérialiste dans le domaine qui nous concerne. Conten- tons-nous de souligner que la pratique socio-historique qui sert de référence inévitable en ce point est en fait profondément ambiguë : cette pratique est très exactement « instable » en ce sens qu'elle peut basculer d'un côté ou de l'autre, sans garde-fou, c'est-à-dire du côté du matérialisme historique ou du côté de la psychologie sociale , avec, à vrai dire, une probabilité tout à fait inégale entre les deux issues, si l'on n'y prend garde : nous voulons dire que, sans autre garde-fou que « la méthode expérimentale », on tombe presque inévitablement dans la psychologie sociale des situations, et dans l'idéalisme qui en est corrélatif.

2. L'analyse linguistique.

2.1. Les objectifs ďune analyse linguistique du discours .

On parle parfois d'une « linguistique du discours » pour désigner en fait un type d'approche du langage susceptible d'échapper au moins par- tiellement à certains effets des restrictions théoriques d'une linguistique « traditionnelle » dont le défaut principal serait de concevoir son objet dans le cadre de ce que la grammaire classique (et avant tout la grammaire latine) a appelé « la phrase ». Gela signifie à la fois une fixation sur la struc- ture de l'énoncé et une sorte de cécité à l'égard de ce qu'on appelle actuelle- ment « énonciation » ; simultanément se trouve placée au centre des dis- cussions la question de l'interphrase, sur laquelle nous reviendrons. En effet, la prise en considération de la réalité du discours , l'espèce de décen- trement qu'elle introduit dans la linguistique elle-même est, on va le voir, décisif pour toute notre entreprise.

Néanmoins, ce serait une erreur de considérer que l'analyse du discours telle que nous la concevons est tout simplement l'exercice de cette nouvelle linguistique débarrassée des préjugés de la linguistique « traditionnelle ». Cela reviendrait à dire, en effet, que le changement par rapport à celle-ci réside essentiellement dans une autre façon d'aborder son objet, dans de nouvelles nécessités imposées à la recherche, etc... Tout cela qui par ailleurs est parfaitement exact ne touche cependant pas encore à l'objectif que nous assignons à une analyse linguistique du discours. Disons que cela en constitue une des conditions nécessaires de réalisation : il reste à préciser quelles sont les autres, et surtout comment elles s'articulent entre elles. Pour aller directement au point principal, il nous semble utile de souligner que les linguistes (en tant que « purs linguistes ») envisagent le plus souvent comme résultat de leur pratique un discours théorique pouvant avoir la forme d'une théorie générale ou d'une monographie, mais qui de toute façon concerne un objet linguistique plus ou moins spécifique sous la modalité de sa description , de V exposé de son fonctionnement , de la théorie des mécanismes qui

30

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 26: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

le constituent . Face à cette pratique du linguiste, celle de l'analyse du discours se caractérise par deux particularités : la première c'est que cette pratique met nécessairement en jeu une procédure algorithmique *, ce qui suppose une différence essentielle sur la forme du résultat produit (Remarque : il s'agit bien ici de l'analyse du discours et non de la théorie du discours qu'elle présuppose). En ce sens, l'analyse du discours se rapproche, on va le voir, de ce qu'on appelle parfois « linguistique appliquée », dans la mesure où, empiriquement, on observe dans les deux cas « le recours à l'ordinateur ». Mais cette première caractéristique reste en elle-même tout à fait insuffi- sante, et il faut immédiatement ajouter une deuxième spécificité de l'analyse du discours, à savoir que l'objet à propos duquel elle produit son « résul- tat » n'est pas un objet linguistique mais un objet socio-historique où le linguistique intervient comme présupposé 2. Et c'est cette relation d'appli- cation 3 qui, selon nous, détermine cet effet de séparation-clivage entre pratique linguistique et analyse du discours : du point de vue de l'analyse du discours, la pratique linguistique apparaît comme une première phase absolument indispensable (il ne saurait y avoir d'analyse sans une théorie et une pratique linguistiques), mais insuffisante comme telle, dans la mesure où elle existe en vue d'une deuxième phase, à propos de laquelle s'opère un changement de terrain : l'application n'est pas une application de la linguistique sur elle-même (c'est-à-dire une application interne, à l'intérieur d'une théorie donnée, comme dans le cas de l'informatique linguistique qui sert de relais à la linguistique dans une procédure visant à réaliser tel ou tel mécanisme exposé au niveau du discours théorique de la linguis- tique, par exemple un algorithme de génération de formes syntaxiques, ou une procédure de classification automatique des traits syntactico- sémantiques d'une liste de verbes, etc.), mais une application de la théorie linguistique sur un champ extérieur. Dans ces conditions, il est compré- hensible que celui que nous avons appelé « le pur linguiste » ait une réaction un peu agacée comparable à celle de l'artisan à qui le contenu de

1. Algorithme : suite réglée d'opérations réalisable en un temps fini par un cal- culateur, produisant un résultat déterminé à partir d'un point de départ donné.

2. C'est pourquoi il nous semble qu'il y a parfois abus de langage lorsqu'on utilise le terme « linguistique du discours » pour désigner en fait une linguistique des textes (voire d'un texte) sous le prétexte qu'elle dépasse le cadre d'analyse de la phrase, ce qu'on recouvre par ailleurs souvent sous l'expression « linguistique de la parole » ; nous avons indiqué plus haut les raisons de notre réticence à cet égard.

3. En employant le terme d'« application », nous risquons d'introduire une ambi- guïté sur laquelle il convient de s'expliquer en distinguant application technique et application théorique. - L'application technique consiste à utiliser une théorie et un appareillage comme l'instrument pour la production d'un effet, objet ou résultat dans la pratique (la théorie des semi-conducteurs s'applique techniquement à la fabrication des transistors). - L'application théorique consiste en l'intervention d'une discipline théorique dans une autre (application des mathématiques dans la physique) ou en l'application d'une discipline à elle-même. Soulignons que dans le cas de l'informatique linguistique, il n'est malheureusement pas toujours facile de distinguer entre les applications tech- niques et les applications théoriques.

31

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 27: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

son travail échappe ; il ne peut pas ne pas éprouver comme des exigences trop fortes les contraintes imposées par ce « champ extérieur j>. Dans cette mesure, l'analyse du discours, à laquelle se relient théoriquement par une dépendance de fondation la documentation et la traduction automatiques, rencontre de la part de la « linguistique pure » les mêmes réticences et les mêmes difficultés que celles-ci : le point commun est constitué par l'exigence d'une « grammaire de reconnaissance » susceptible de répondre à la fois aux exigences théoriques internes de la linguistique et aux nécessités de ce que nous avons appelé le « champ extérieur » :

En ce qui nous concerne, nous dirons que la grammaire de reconnais- sance nécessaire à l'analyse du discours doit répondre à deux requisits : a) cette grammaire doit pouvoir produire algorithmiquement une repré- sentation de ce qui a été désigné plus haut sous le nom de surface linguistique , cette représentation produite algorithmiquement constituant ce que nous avons appelé V objet discursif correspondant ; b) que cette représentation (l'objet discursif produit) soit susceptible de permettre un calcul effectuable sur le rapport entre différents objets discursifs ainsi pro- duits, ce calcul ayant pour but de restituer la trace des processus séman- tiques-discursifs caractéristiques du corpus étudié.

Il est bien clair que, dans les conditions actuelles de développement de la théorie linguistique, la solution d'un tel problème se heurte à de multiples difficultés. Certes il existe depuis quelques années des grammaires capables de reconnaître (en vue de la documentation ou de la traduction) des textes spécialisés en langue anglaise, russe ou française, mais elles tombent sous le coup des critiques (le plus souvent parfaitement justifiées) de la « linguis- tique pure » et la solution que nous avons proposée n'y échappe pas davan- tage qu'une autre. Considérons les deux cas que nous venons d'évoquer, où une grammaire de reconnaissance est en jeu, à savoir la traduction d'une part, la documentation ou comparaison de textes d'autre part ; on peut leur faire respectivement correspondre les deux schémas suivants dont « l'évidence » garantit la stabilité :

A. Traduction.

Dx >»Mxy *Dy

où Dx et Dy représentent deux « versions » du « même » texte, dans les langues x et y, et où Mxy désigne la « représentation profonde » sous-jacente commune à Dx et à Dy.

B. Documentation et comparaison de textes .

Dx > Sx <k

R(Sx/Sy) Dy »• Sy ,,

32

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 28: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

où Dx et Dy représentent deux séquences à mettre en rapport, Sx et Sy les descriptions que l'analyse linguistique en fournit respectivement, et R (Sx/Sy) le résultat de la mise en rapport effectuée par le dispositif compa- rateur ou documentaire. En dépit des apparences graphiques, nous soute- nons que le deuxième schéma est plus élémentaire que le premier, et qu'à vrai dire il lui préexiste logiquement : en effet, le terme de « représentation profonde », qui apparaît dans le schéma « traduction » disparaît dans le second schéma ; il est remplacé par le rapport entre deux structures Sx et Sy dont on ne présuppose pas qu'elles constituent les « représentations profondes » respectives de Dx et Dy. Nous dirons pour notre compte que l'idée de faire correspondre une « représentation profonde » à une surface lin- guistique (ce qui est le cas du schéma A) met en jeu des présupposés psycho- sémantiques que la conception discursive de la signification remet préci- sément radicalement en cause. Dans la perspective du schéma A en effet, la conception de la relation entre syntaxe et sémantique est celle d'une relation entièrement intra-linguistique , puisque l'analyse représentée par la flèche horizontale (->) conduit par étapes de la surface morpho-phonolo- gique du texte à sa structure sémantique ou représentation profonde Mxy, supposée commune à toutes les langues et constituant ainsi une sorte de pont logique ou « pivot » (cette structure logique étant formée d'arguments et de prédicats extraits de la langue logique universelle, c'est-à-dire de la « structure de l'esprit humain »). Dans la perspective correspondant au deuxième schéma au contraire, on voit que la « représentation profonde » (ou plutôt ce qui s'y substitue, à savoir le rapport R(Sx/Sy)) n'est pas conçue comme l'aboutissement de l'analyse linguistique (->), mais comme le produit d'une opération spécifique s"* effectuant sur le résultat préalable de l'analyse linguistique, à savoir Sx et Sy. Tout ceci pour bien mettre en évidence que lorsque nous parlons maintenant d'« analyse linguistique », nous nous situons dans la deuxième perspective, où Sx ne désigne pas une « repré- sentation profonde » mais simplement le résultat ďune délinéarisation mor pho- syntaxique appliquée de manière éventuellement algorithmique à la surface linguistique de départ : autrement dit, l'analyse que nous désignons comme « linguistique », et qui constitue la deuxième phase de VA AD que nous commentons actuellement, a exclusivement pour but de produire ce qui a été décrit plus haut sous le nom d'objet discursif, à l'exclu- sion de toute « représentation profonde ».

Nous pouvons désormais reformuler en les précisant les deux exigences que nous avions définies plus haut :

a) Il est nécessaire que la grammaire de reconnaissance soit capable, à partir d'une surface linguistique Dx donnée, d'en produire une représen- tation morpho-syntaxiquement cohérente Sx, c'est-à-dire une représenta- tion linguistiquement délinéarisée, restituant la non-linéarité syntaxique faisant l'objet de ce que nous avons désigné par l'expression « oubli n° 2 ». La cohérence de cette représentation, fondée sur l'autonomie relative des structures morpho-syntaxiques (« fonctionnement de la langue par rapport

33 LANGAGES N° 37 3

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 29: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

à elle-même ») suppose qu'il soit possible sinon de reconstituer le texte de départ, étant donné la représentation qu'en fournit la grammaire de reconnaissance, du moins de décider, au vu d'une représentation Sx donnée, celle à laquelle elle correspond (i. e. dont elle est dérivée), parmi deux surfaces linguistiques dont la proximité est telle que l'état actuel de la théôrie linguistique permet malgré tout de les distinguer.

b) Il est d'autre part indispensable que la représentation Sx constitue une entrée possible pour l'effectuation de la comparaison que nous avons représentée par une flèche verticale (cf. p. 32) sur le schéma B. Disons tout de suite que cette deuxième condition, extérieure à l'analyse lin- guistique comme telle, est la source de grandes difficultés qui se résument en définitive dans le fait qu'il est, semble-t-il, très malaisé de comparer des structures complexes entre elles, à l'aide de procédures algorithmiques.

On n'entreprendra pas de décrire ici les différentes solutions qui sont actuellement utilisées ou envisagées ; mentionnons simplement, sans aucune prétention à l'exhaustivité :

- Les analyseurs syntaxiques fondés sur les « systèmes-Q » (Colme- rauer, Vauquois) et les représentations de type « pivot 2 » (Equipe TAL de Grenoble) 1, qui semblent avoir pour commune propriété de réaliser ou d'avoir été conçus en vue de réaliser de manière algorithmique les procé- dures proposées jadis par Tesnière (Eléments de syntaxe structurale, Klincksieck, 1959), en articulant des dépendances hiérarchisées en filiations sur un point initial constitué en général par le verbe.

- Les dispositifs d'analyse syntaxique inspirés directement des travaux de Harris (y compris les « string grammars »), qui reposent sur l'extraction de « schémas-noyaux » (NV, NYN, NVPN, etc.) et sur la dis- tinction entre chaîne centrale et adjonctions 2.

- Les grammaires des cas qui se développent dans la ligne des travaux de Fillmore (voir notamment Slakta, 1974) sur une base générative- transformationnelle.

- Pour les raisons que nous avons exposées ci-dessus, nous ne retien- drons pas dans cette énumération la procédure d'« analyse linguistique du discours » de F. Bugniet 3, dans la mesure où la représentation qu'il fait correspondre à la séquence de départ est davantage une liste de traits

1. Cette équipe, dirigée par J. Rouault, pose comme un de ses objectifs la consti- tution d'une GRF capable notamment d'automatiser (au moins partiellement) la phase d'analyse linguistique de l'AAD.

2. Il serait intéressant de comparer systématiquement le graphe de l'analyse AAD en énoncés élémentaires et celui que peut produire l'analyseur syntaxique de M. Sal- koff, qui applique au français la méthode proposée par S. Z. Harris dans String Analysis. Cf. Salkoff (1973).

3. F. Bugniet (1971-1972).

34

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 30: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

(susceptible d'une étude statistique) qu'une structure munie de caracté- ristiques formelles permettant un calcul algorithmique non trivial.

- La phase d'« analyse linguistique » que nécessite l'application de l'AAD a été décrite de manière plus ou moins complète dans Pêcheux, 1969 et surtout dans le Manuel (Haroche-Pêcheux, 1972). Nous ne repren- drons donc pas le détail de la procédure d'analyse syntaxique propre à cette phase, d'autant plus qu'un travail spécifiquement linguistique est en cours d'élaboration sur ce point.

Toutefois, il nous a paru nécessaire de rappeler brièvement les carac- tères principaux de la phase linguistique de l'AAD, qui s'apparente pour l'essentiel aux perspectives de S. Z. Harris. On pourrait résumer en disant que la procédure (conçue comme susceptible d'une application algorith- mique) consiste à produire, étant donné une séquence linguistique de lon- gueur variable, une représentation de cette séquence sous la forme d'un graphe connexe , valué et à une seule racine dont les points sont constitués par des énoncés élémentaires de dimension « canonique » et dont les arcs sont des relations connectant deux à deux certains énoncés, ces relations pouvant prendre différentes valeurs (de détermination, comme dans le cas de la relative, de l'adjectivale ou du complément de nom ; de subordination- coordination dans le cas des différents rapports temporels et/ou logiques qui peuvent affecter un couple d'énoncés).

Exemple :

',

„ Les énoncés , „ Les énoncés élémentaires , sont • # ici désignés par la suite des entiers / naturels, et la valuation des arcs les J l N. reliant est marquée par des lettres t6 7 grecques. . * * •

8 / ' 9

etc...

Si l'on tente de caractériser la spécificité de cette procédure, il semble important d'insister sur deux aspects qui sont les suivants : a) à la diffé- rence des arbres, arborescences ou graphes propres aux grammaires géné-

35

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 31: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

ratives-transformationnelles de Harris ou de Chomsky, les nœuds (ou points) ne sont pas ici des catégories syntaxiques préterminales ou terminales (du type GN ou DET, etc.) ou des unités lexicales, mais des sortes de relations-points, ou, si l'on veut, des sous-graphes réduits à un point au niveau de la structure du graphe représentant l'ensemble de la séquence. Cela revient à dire qu'il y a deux systèmes imbriqués l'un dans l'autre : le système des énoncés et celui des relations inter -énoncés, de telle sorte que les objets du premier système servent d'éléments pour la construction des objets du second. Signalons que, dans le cadre des théories générati ves, la structure de ce sous-graphe 1 pourrait être représentée de la manière suivante :

E

? SSSSSSSHN

GN, GV

/' ' / '

/

/

'

'

/YXX

VA GP / ' VA GP

DETj Ni Y ADV DET2 N2

avec :

E : énoncé élémentaire. SHN : schéma-noyau, sur lequel s'exerce une série de déterminations

verbales, par l'intermédiaire de F. F : forme de l'énoncé, contenant des indications morpho-syntaxiques

sur la voix, le statut, le mode et le temps grammaticaux de l'énoncé. SHN - GN1 + GV. GN1 : groupe nominal sujet, formé d'un déterminant (éventuellement

vide) et d'un substantif. GV : formé d'une part du composé V + ADV (verbe + adverbe = VA)

et d'autre part du groupe nominal objet GN2, éventuellement introduit par une préposition P (relevant alors avec lui du symbole GP).

1. Soulignons bien qu'il s'agit ici de la représentation adoptée dans le texte de Pêcheux, 1969 : on verra plus loin (cf. p. 45 sqq.) les modifications actuellement envi- sagées.

36

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 32: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

Ajoutons que DET2 peut lui aussi être vide, spécialement dans le cas où GN2 est adjectival, et que Ton choisit conventionnellement de représen- ter la préposition vide introduisant le « complément d'objet direct » par *, le vide devant F « attribut » par « a » 1 et la copule sous-entendue dans la détermination adjectivale 2, etc., par « E ». On voit facilement que ces dispositions permettent de reconstruire les « schémas-noyaux » suivants :

1) GN1 GV 0 0 Pierre dort 2) GN1 GV * GN2 Pierre mange le steak 3) GN1 GV P GN2 Pierre s'appuie à la fenêtre 4) GN1 GV a A Pierre semble stupéfait 5) GN1 E a A le chapeau est beau -> le beau chapeau 6) GN1 E P GN2 le chapeau est à Pierre -> le chapeau de Pierre 7) GN1 GV a GN2 Pierre est instituteur 8) GN1 GV P' GN3 Pierre mange avec une fourchette

Nous pouvons désormais préciser ce que nous entendions à l'instant en parlant de Y imbrication de deux systèmes . Soient en effet les phénomènes syntaxiques classiquement connus depuis les grammaires génératives- transformationnelles sous le nom d'« emboîtement » ou d'« imbrication » (récursivité) : dans la perspective de ces grammaires, l'emboîtement est représenté comme une complexification du graphe de l'énoncé (cf. p. 35), de sorte que, de proche en proche, V énoncé est la matrice de la phrase comme une forme abstraite et dépouillée est le squelette du corps achevé. En d'autres termes, moins imagés, on peut dire que V imbrication (et de façon plus générale la récursivité) est la condition qui assure l'homogénéité théo- rique et méthodologique entre l'énoncé et toute formation plus complexe, de telle sorte que toutes les relations s'effectuent dans un même système , ce qui se marque par l'enchâssement du graphe de l'énoncé déterminant dans le graphe de l'énoncé matrice. Dans le cas de la procédure que nous exposons, tout au contraire, la décision de ne pas réintroduire d'énoncé à l'intérieur de l'énoncé suppose que la question de la récursivité soit réglée autrement (à savoir par le passage du premier système, intra-énoncé, au second système, des relations entre énoncés). C'est poser du même coup qu'un énoncé El peut en déterminer un autre E2 par une relation dissymétrique qui équivaut à une imbrication de El dans E2, et plus généralement qu'une portion de graphe organisant plusieurs énoncés peut équivaloir à un point

1. Ce point a été introduit depuis la publication du Manuel 1972. 2. La question de la détermination adjectivale soulève des problèmes analogues à

ceux que nous relevions à propos des relatives, et au moins aussi difficiles à résoudre, car on rencontre non seulement la distinction entre adjectivation déterminative et non déterminative (la voiture noire/la neige blanche ), mais aussi des oppositions d'un autre type comme : un simple soldat/ un vrai démocrate , ou encore : l'allure martiale de X¡la cour martiale , etc.

37

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 33: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

du graphe général ; ceci constitue en fait le deuxième point caractéristique que nous voudrions présenter avec quelques détails.

b) Ce deuxième point concerne les rapports entre énoncés comme rapports de dominance. Soit la phrase suivante : « Il me semble que l'Eglise reste dans les nuages et qu'elle oublie les difficultés et les problèmes de la vie. » On voit qu'on peut en extraire les énoncés suivants :

1) Il me semble S (= quelque chose), 2) l'Eglise reste dans les nuages, 3) l'Eglise oublie les difficultés, 4) les difficultés (sont) de la vie, 5) l'Eglise oublie les problèmes, 6) les problèmes (sont) de la vie.

Si, en outre, on pose les connecteurs QUE, ET et DT (ce dernier connec- teur servant à la détermination d'un énoncé sur le N d'un autre énoncé), il est clair qu'on peut représenter la séquence initiale de la façon suivante :

séquence = 1 QUE /A/ /A/ = 2 ET /B/ /B/ = /CI ET /D/ /G/ =3 DT 4 /D/ = 5 DT 6

où l'on constate que des énoncés sont mis en rapport avec des constructions d'énoncés, indiquées ici par des majuscules /A/, /B/, etc., s'imbriquant les unes dans les autres.

Il est cependant possible de représenter ces dépendances par un schéma ne comportant que des énoncés et des relations entre énoncés c'est-à-dire où les constructions intermédiaires /A/, /B/, etc., n'apparaissent plus comme telles, ce qui constitue, à nos yeux, une condition indispensable de la phase 3 de traitement informatique, dont nous parlerons plus loin.

Ce schéma, de forme « combinatoire », est le suivant :

3 ► 4

f QUE 2 - ET ET

' t 5- - ». g

DT

On remarquera que l'écriture parenthétique ci-dessous est strictement équivalente :

1 QUE (2 ET ((3 DT 4) ET (5 DT 6)))

38

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 34: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

Nous reprendrons lors du commentaire de la phase 3 la question de savoir si une procédure algorithmique de comparaison pourrait s'effectuer sur des représentations de ce type ; contentons-nous pour l'instant d'expo- ser le système de transformations par lequel on passe de la représentation ci-dessus à un graphe d'énoncés reliés par des relations binaires, comme il a été annoncé plus haut.

Soient les deux conditions suivantes :

a) ► assssässtssss^

|

»

b) ^

» »ssrssasrrrs^ , »

On voiïTque si on les applique le schéma devient :

1 1 QUE 2 ¿ 3 3DT 4 2 ¿ » ! ■ »

BT ! I J ET

5 PT % 6

Une constatation s'impose alors, à savoir que le caractère distributif du « QUE » à l'égard des énoncés de la construction /A/ a disparu ; il est donc nécessaire de rétablir les liens existant entre 1 et 3 d'une part, 1 et 5 d'autre part. (Rappelons que ces liens rétablis ainsi portent le nom de « saturations »). On aboutit de cette^manière au graphe saturé suivant :

2 ' »-3 - fr-4 EX '

et et QUESw

Xi r i r 5

DT * 6

Les données d'entrée de la phase 3 sont donc en définitive :

a) la liste des énoncés élémentaires, chacun étant, comme il a été

1. Cf. Haroche-Pêcheux, 1972, p. 40

39

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 35: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

dit, une suite de¿8 « catégories morpho-syntaxiques » munies de leur valeur respective, soit :

F D ETI NI V ADV P DET2 N2

1) 0000 0 S SEMBLER 0 A 0 EGO 2) 0000 L EGLISE RESTER 0 DANS LS NUAGE 3) 0000 R EGLISE OUBLIER 0 * LS DIFFICULTÉ 4) 0040 1 R DIFFICULTÉ E 0 DE L VIE 5) 0000 R EGLISE OUBLIER 0 * LS PROBLÈME 6) 0040 1 R PROBLÈME E 0 DE L VIE

d'une part et

b) la liste des relations binaires d'autre part :

1 QUE 2 1 QUE 3 2 ET 3 1 QUE 5 3 DT 4 5 DT 6

Remarque : on aura noté, dans la colonne DET1, la présence de la forme « R », qui signifie la reprise d'une détermination précédente.

2.2. Critique de la phase ď analyse linguistique de VA AD.

Ayant rappelé ce qu'étaient, selon nous, les objectifs de la phase d'ana- lyse linguistique du discours et la manière globale dont, pour l'instant, nous tentions de les réaliser, nous pouvons désormais exposer les différentes critiques formulées sur ce point, sans craindre de confondre une critique justifiée , de notre propre point de vue (critique dont il peut être vital pour l'analyse du discours de tenir compte dans sa théorie et dans sa pratique), et une « critique » qui camoufle en réalité une régression théorique en deçà de la théorie du discours .

Cette question se pose évidemment surtout en ce qui concerne les critiques d'ordre général, visant l'ensemble de la procédure d'analyse ; c'est, aussi bien, par ce type de critique que nous commencerons et plus précisément par la question de la manipulation implicite du texte , avec des considérations sémantiques dissimulées ; ce point apparaît indépendamment, sous des formes assez voisines, chez différents commentateurs, en particulier chez A. Trognon, S. Fisher, E. Veron et Borillo-Virbel. Nous distin- guerons ici deux niveaux de critique, en montrant pourquoi l'un nous semble recevable, et l'autre non : le premier niveau de critique consiste à souligner que dans l'analyse dite « morpho-syntaxique » telle qu'elle a été présentée interviennent inévitablement des considérations que l'on

1. L'introduction d'une nouvelle valeur de mode correspondant à Tinasserté lié au rétablissement de E a été effectuée depuis la publication du Manuel (Haroche, Pêcheux, 1972).

40

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 36: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

appelle d'habitude « sémantiques », et que ces considérations restant impli- cites, il y a de grandes chances pour que toute l'analyse s'en trouve affectée, sous la forme d'incohérences dissimulant des phénomènes ou au contraire produisant des artefacts qui auront leurs fâcheuses conséquences dans les phases ultérieures de traitement AAD. Disons clairement que nous reconnaissons cette critique comme parfaitement justifiée : elle concerne bien notre problématique, et en un point vital qui a été énoncé précédemment comme la première condition à remplir par une grammaire de reconnais- sance : si, en effet, interviennent dans l'analyse des « opérations sémantiques non définies» (Fisher-Veron, 1973, p. 167) la cohérence et la stabilité des résultats s'en trouvent du même coup atteintes de sorte que la reproduc- tibilité de la représentation associée à une séquence donnée n'est pas assu- rée, ce qui, par voie de conséquence, met en cause la condition de bi-univocité exprimée par la première condition. En ce sens, nous sommes absolument d'accord avec la critique de Fisher-Veron : « si la méthode (d'analyse linguistique) empêche de repérer certaines propriétés, celles-ci ne seront jamais récupérées » (art. cit., p. 167), autrement dit, un simple « codage » sténographique de la surface, filtrant ce qui est important à retenir et ce qui peut être laissé de côté ne saurait satisfaire à la « première condition » : et il faut reconnaître qu'en effet, certaines questions de théorie linguistique non résolues affectent l'analyse, et cela non pas périphériquement , mais au principe même de la procédure, comme nous le montrerons dans un instant.

Nous nous estimons, dans ces conditions, d'autant plus fondés à cri- tiquer la critique qui nous est faite à un deuxième niveau, qui est celui du rapport entre la sémantique et la linguistique et que nous avons déjà rencontré ci-dessus à propos de la double « catégorisation » (dans la terminologie de Borillo-Virbel). Lorsque, à leur tour, S. Fisher et E. Veron disqua- lifient notre perspective par le fait qu'elle est « toujours associée à la pré- tendue différence entre syntaxe et sémantique » (1973, p. 167 nous soulignons) ils font comme si c'était un acquis récent et décisif de la linguistique contem- poraine d'avoir réinscrit la sémantique dans le champ de la linguistique, au point d'en faire une réalité intra-linguistique. Sur ce point *, nous ne pouvons évidemment pas accepter les critiques qui nous sont faites ; nous ne pouvons que renvoyer à ce qui a déjà été dit ici même, p. 13-14.

Revenons donc à ce que nous avons appelé « le premier niveau de critique », qui nous paraît entièrement justifié, de notre propre point de vue, avec l'intention de déterminer de quoi il s'agit pour éventuellement définir les principes permettant de remédier aux difficultés reconnues. Certes, nous serons d'accord avec G. Provost-Chauveau pour reconnaître l'hété-

1. Qui conduit logiquement les commentateurs à nous accuser d'effectuer un véri- table « tour de passe-passe » (Cf. A. Trognon, 1971) entre les données et les résultats, dans la mesure où leur position leur interdit de distinguer entre la sémantique « lin- guistique » qui intervient implicitement dans l'analyse syntaxique et les processus sémantiques-discursifs dont la trace est repérée par la phase 3 du traitement AAD.

41

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 37: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

rogénéité des références linguistiques qui traduit l'absence d'une réflexion théorique globale sur les phénomènes syntaxiques. Gomme nous le rappe- lions en commençant, nous sommes allés au plus pressé , avec les moyens dont nous disposions, et en sachant bien que les « solutions » linguistiques que nous proposions étaient autant de « provocations » adressées aux « purs linguistes » pour qu'ils en effectuent une critique transformatrice. Nous soulignons toutefois que cette hétérogénéité théorique, génératrice d'incohé- rences et d'artefacts, faisant que toutes les « solutions » n'ont pas le même « âge théorique », ne doit pas être confondue avec l'inévitable combinaison de caractéristiques morphologiques et syntaxiques pas plus qu'avec la coexis- tence, dans la représentation, de termes lexicaux et de « méta-termes » tels que *, S, X, E, etc... (il faudrait, en effet, ignorer que la langue est « sa propre méta-langue » pour s'en étonner ! Disons donc une fois pour toutes que les critiques portant sur l'apparition d'un « verbe » (E) non attesté en surface, tout autant que les lectures hâtives qui mettent sur le même plan des opé- rations de lemmatisation (voire de réduction orthographique) et des trans- formations syntaxiques ne nous semblent pas recevables).

Il va de soi, par ailleurs, que le dispositif d'analyse syntaxique est encore pour longtemps en évolution (ce qui veut dire que sa réalisation sous la forme d'un automate serait probablement du type « à apprentis- sage »), de sorte que certaines incohérences « locales » sont progressivement éliminées : à cet égard, nous donnerons comme exemple la confusion entre les connecteurs « parce que » et « puisque » qui est relevée indépendamment par Borillo-Virbel et par Fisher-Veron à propos d'un texte paru en 1971, et qui disparaît dans le nouvel état de la liste des connecteurs, publiée dans Haroche-Pêcheux, 1972 ' Cependant, nous sommes loin de penser

1. L'impression d'une critique un peu hâtive, où l'accidentel se mêle à l'essentiel, est renforcée par l'exemple d'application de l'analyse linguistique AAD que proposent S. Fisher et E. Veron dans l'article déjà cité. Ayant choisi comme séquence à analy- ser le texte publicitaire ci-dessous assez particulier quant à sa forme rhétorique :

« Baranne est une crème, C'est parce que Baranne est une crème Que Baranne pénètre le cuir si profondément C'est parce que Baranne pénètre le cuir si profondément Que Baranne nourrit le cuir. Tous les cuirs. »

dont nous nous serions, quant à nous, bien gardé de prétendre effectuer l'analyse, les auteurs exécutent à son propos (et dans tous les sens du terme) « la méthode de Pêcheux », c'est-à-dire qu'ils la déforment en l'appliquant pour en faire la critique.

Que les auteurs ne se soient pas souciés de respecter les conventions ayant trait à l'enregistrement des verbes (à l'infinitif) et des substantifs (au singulier), qu'ils ignorent par ailleurs la distinction entre absence de préposition (0) et la place vide de la préposi- tion devant le SN2 (*) n'a, bien entendu, que peu d'effet sur leur démonstration.

Par contre, le fait qu'ils aient oublié de reconstruire l'ordre canonique à l'intérieur de la séquence (cf. « Manuel », p. 17) les conduit à proposer avec désinvolture des solu- tions dont nous leur laissons l'entière responsabilité, en particulier l'étrange énoncé

« 0000 0 C est 0 0 0 0 » Avec toutes les précautions dues à la particularité de ce texte, indiquons ci-dessous

à quoi aurait conduit l'application de la procédure décrite dans le Manuel 72, et en tenant compte de la distinction entre * et a (cf. ici-même, p. 36) intervenue après la publication du « Manuel ».

Le rétablissement de 1'« ordre canonique » aurait conduit à la reformulation sui- vante : « Baranne est une crème. Baranne pénètre le cuir si profondément parce que

42

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 38: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

que cette hétérogénéité se résorbera ainsi progressivement, par une sorte de « réformisme » grignotant patiemment le champ des problèmes restés en suspens ; nous pensons au contraire que les difficultés que nous rencon- trons (et que rencontrent tous les projets d'analyse syntaxique) constituent

Baranne est une crème. Baranne nourrit le cuir, Baranne nourrit tous les cuirs parce que Baranne pénètre le cuir si profondément. »

Les énoncés élémentaires seraient alors les suivants : 1 0000 0 Baranne être 0 a U crème 2 0000 0 Baranne pénétrer profondément * L cuir 3 0000 0 Baranne être 0 a U crème 4 0000 0 Baranne nourrir 0 * L cuir 5 0000 0 Baranne nourrir 0 * TLS cuir 6 0000 0 Baranne pénétrer profondément * L cuir

réunis par le graphe ci-dessous :

1

1

2 - *"3

i

parce que

* '■ parce que if ®

parce que ' f 5

Remarques : a) Le « si » de « si profondément » n'a pas pu être pris en considération. b ) Le problème du « c'est... que » et de la permutation que représente cette cons-

truction par rapport à l'ordre canonique pourrait être traité soit par une marque intra- énoncé affectant la forme F, soit par une réflexion de certaines relations du graphe, ce qui aurait en même temps pour effet de supprimer la répétition du contenu des énon- cés 2 et 4 par les énoncés 3 et 6. Pour cette deuxième possibilité, nous nous contentons de suggérer le graphe suivant :

1

parce que •

/ý2'' / / ' parce que / / ' ' parce que

Rien ne prouve que, dans les conditions normales d'utilisation de l'AAD (suppo- sant entre autres l'existence d'un corpus de séquences discursives), les erreurs que nous venons de signaler seraient restées sans conséquence. De toute manière le fait qu'une partie des critiques générales que les auteurs adressent à la procédure syntaxique proposée reste valable ne les dispensait pas, selon nous, d'appliquer cette analyse consciencieusement.

43

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 39: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

un bloc tenace et consistant fondé en grande partie sur ce que l'on peut appeler la domination théorique de la phrase. A cet égard il ne suffît pas simplement d'un acte de bonne volonté théorique accédant à une « approche sans préjugés » (Fisher-Veron, p. 169), mais d'une transformation de l'objet même de la linguistique : dans le texte de 1969, la nécessité d'une étude sérieuse de V inter -phrase était plutôt évoquée que réellement engagée (cf. AAD 69 p. 44 sqq). Le développement actuel des recherches linguis- tiques, et le lien qui s'établit progressivement entre l'inter-phrase et la paraphrase dans le cadre des « linguistiques du texte » qui se font jour permettent de penser que la linguistique est aujourd'hui sur la voie de la solution à ce problème, qui, comme nous l'avons dit, en commande un grand nombre d'autres. A cet aspect se rattache également la difficile ques- tion des anaphores , qui met nécessairement en jeu des phénomènes syntac- tico-sémantiques complexes combinant le repérage des liaisons entre pro- noms et substantifs, la prise en compte de glissements et d'oppositions lexicales, la construction de l'image d'une proposition (représentée par « S »), etc... Or les exemples d'anaphorisation donnés dans le Manuel de 1972 ne constituent qu'un cas relativement privilégié du phénomène, en raison de leur simplicité : il est assez facile de montrer des cas d'anapho- risation qui posent des problèmes difficilement solubles de rétablissement automatique. Citons par exemple :

- un substantif anaphorisé par un nouveau terme lexical, - une proposition entière anaphorisée par un nouveau terme lexical, - l'anaphorisation par apposition (ex : « le meurtrier, Jean Dupont »), - l'anaphorisation « vide », mais supportée par une opération de

détermination supplémentaire, comme dans « les étudiants étaient réunis. Certains . . . / ceux qui . . . / Les uns ... 1 ».

Sans sous-estimer l'importance des difficultés qui viennent d'être mentionnées, nous pensons cependant que nous n'avons pas encore atteint, avec elles, le point central qui entraîne à sa suite toutes les autres difficul- tés : or ce point central, dans lequel s'exerce « la domination théorique de la phrase », n'est autre, selon nous, que le présupposé théorique qui relie phrase , proposition et énoncé . C'est, à juste titre nous semble-t-il, sur ce point que les critiques ont été les plus nombreuses et les plus pertinentes : elles consistent, dans leur principe, à souligner que cette phase de l'analyse syntaxique coïncide très exactement avec celle d'une « analyse logique » traditionnelle, comme l'indique d'ailleurs explicitement la partie corres- pondante du « Manuel » : elle repose de fait sur l'idée d'une organisation à la fois hiérarchisée (principale/subordonnée) et séquentielle (coordination) de la phrase en propositions. Cette conception qui prend appui sur la notion d'un tissu formé de nœuds constituant autant de « grains d'énonciation » aboutit, dans la pratique, à des « cas de conscience » de l'analyste, liés au

1. Cf. en particulier : M. Gross (1973).

44

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 40: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

caractère arbitraire du découpage, oscillant entre le désir de représenter fidèlement la réalité linguistique et la nécessité de « coups de pouce » qui peuvent aboutir à des « énoncés élémentaires » inénonçables, inassertables, voire tout simplement ininterprétables. Signalons pour mémoire le cas classique des prédicats à plus de deux arguments obligatoires, qui attend encore une solution satisfaisante.

Cette domination théorique de la phrase ne reste évidemment pas sans conséquences au niveau même des constituants de V énoncé : nous retien- drons les cas de ADV, P, DET et F, sans d'ailleurs vouloir signifier par là que les autres « catégories morpho-syntaxiques » ne posent pas de pro- blèmes !

- ADV : cette catégorie est explicitement présentée comme provi- soire ; il est clair en effet qu'on ne saurait attribuer aux adverbes un mode de traitement unique : il semble nécessaire de distinguer entre les « adverbes » qui fonctionnent comme des qualificateurs de marque ď arrêt et ceux qui s'appliquent à un énoncé dans son ensemble ou encore au prédicat ou à un adjectif. Cette simple considération impose, pour un traitement correct de l'adverbe, de mettre en rapport son fonctionnement d'une part avec les connecteurs, et d'autre part avec les modalités 1. Par ailleurs, il faudra évidemment tenir compte du double statut morphologique de l'adverbe, qui renvoie à la fois à une classe fermée et à une dérivation adjectivale par l'intermédiaire du suffixe « - ment ».

- P : la solution actuellement adoptée consiste à traiter différemment le « complément prépositionnel obligatoire lié au fonctionnement syntaxique du verbe et le complément circonstantiel, dans le cas où la construction syntaxique autoriserait sa suppression » (Manuel p. 34). Une telle position ne va pas, dans la pratique, sans quelque difficulté, la frontière entre les deux types de compléments prépositionnels n'étant pas toujours bien tranchée, et l'échappatoire consistant à enregistrer les deux constructions dans les cas d'ambiguïté ne résout pas fondamentalement la difficulté 2.

- DET : dans l'état actuel de la procédure, il s'agit en très grande partie d'un codage de surface, qui laisse complètement à l'écart la question cruciale de la référence dans le discours. Il est à signaler qu'une tentative visant précisément à dépasser ce stade a fait l'objet d'un article publié en 1970 (C. Fuchs, et M. Pêcheux in : Considérations théoriques à propos du traitement formel du langage. Documents de linguistique quantitative n° 7, Dunod) dont nous parlerons plus loin. Les difficultés d'application pratique des solutions proposées dans cet article ont tenu, entre autres,

1. Cf. le problème des compositions du type « c'est certainement déjà un peu trop chaud ».

2. Il conviendra également de pouvoir traiter le cas où une même préposition en surface peut renvoyer à des interprétations sémantiques différentes ; cf. par exemple la polysémie de la préposition « de » : « il vient de Paris » « le chapeau de Pierre ».

45

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 41: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

aux problèmes liés à la construction, à partir de la séquence analysée, de l'objet d'arrivée appelé « lexis ».

- F : de nombreuses critiques ont été également adressées à la « caté- gorie » de Forme dans la mesure où elle regroupe des éléments morpholo- giques, syntaxiques et sémantiques très disparates. Par ailleurs, le lien qui apparaît de plus en plus évident avec le système des déterminants n'est pas pris en considération ; enfin, toutes les « formes » sont à un niveau homogène par rapport au système des énoncés, ce qui exclut toute hiérarchi- sation et toute imbrication ou composition de celles-ci, dans une perspective qui tiendrait compte des relations de « profondeur structurale » 1 entre les énoncés.

La « domination théorique de la phrase » (et de la théorie implicite de l'énoncé qu'elle sous-tend) a enfin des conséquences non négligeables sur les rapports inter-énoncés : sur ce point, la distinction établie entre les connecteurs de détermination (de type « delta ») et les connecteurs de coordi- nation-subordination (de type « phi ») semble devoir être remise en cause, dans la mesure où des transformations permettent de passer d'un connecteur à l'autre, en particulier par l'intermédiaire de la préposition. Il en résulte une hétérogénéité de niveau qui traduit le fait que les « 8 » recouvrent sans les différencier des relations syntaxiques relativement différenciées au niveau des « 9 ». Inversement des relations sont posées dans les « 8 » qui ne sont pas considérées dans les connexions verbales 2.

2.3. Perspectives ď avenir.

Les critiques qui viennent d'être formulées renvoyent « en creux » à une conception de la pratique linguistique qui serait débarrassée de ce que nous avons appelé la philosophie spontanée de la grammaire, c'est-à-dire de ce qu'il est convenu d'appeler la « grammaire traditionnelle » par oppo- sition à un état de modernité scientifique supposé réalisé dans les recherches linguistiques actuelles.

Nous pensons qu'à bien des égards la « modernité » linguistique, avant tout caractérisée par la référence au formalisme mathématique, ne s'est débarrassée qu'en apparence de cette dépendance à l'égard de la « tradition ». La référence de Chomsky à la linguistique de Port-Royal est à ce sujet parfaitement éclairante. Autrement dit, il n'y a pas selon nous de gram- maire « traditionnelle », parce que nous sommes encore dans cette tradition.

1. La profondeur structurale renvoie au problème des différences de niveau entre les énoncés, traduites par le parenthésage (op. cit., p. 40). On envisage plus loin (op. cit., p. 78) le moyen de tenir compte directement de ces phénomènes dans la procédure de comparaison. Cf. également les tentatives de différenciation des composantes de F dans la comparaison des énoncés (Del Vigna et Dupraz, 1974).

2. Mentionnons enfin le problème non-résolu posé par les relatives du type : « Fècole est l'endroit où les enfants apprennent la lecture », «l'homme dont j'ai rencontré le fils », « la maison sur le toit de laquelle les cigognes ont fait leur nid ».

46

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 42: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

Cependant, il nous paraît possible de formuler un certain nombre de dépasse- ments théoriques susceptibles de mettre en perspective les critiques que nous venons de relever et d'ébaucher des directions nouvelles capables de débou- cher sur une nouvelle conception de la grammaire de reconnaissance du français. Bien entendu, il ne s'agit pas ici de proposer directement des solu- tions opératoirement utilisables. Néanmoins, nous pensons que les remarques théoriques qui vont suivre sont de nature à faciliter le passage d'un repérage des marques morpho-syntaxiques à un niveau de représentation qui tout à la fois permette une articulation avec les processus d'énonciation et regroupe en un même formalisme cohérent l'ensemble des phénomènes analysés, en se libérant du caractère monographique et parcellaire des tentatives de description-théorisation de phénomènes locaux.

Nous articulerons nos propositions de dépassement théorique autour de deux points principaux :

1) une reconfiguration de l'énoncé élémentaire distinguant schéma morpho-syntaxique et schéma d'énoncé.

2) la définition des principes d'un calcul portant à partir du schéma morpho-syntaxique sur le schéma ď énoncé, avec la possibilité d'interpréter les résultats de ce dernier calcul en termes de processus énonciatifs liés à l'oubli n° 2.

1) Reconfiguration de V énoncé élémentaire 1 tel qu'il est utilisé dans l'état actuel de l'AAD. Indiquons pour commencer deux éliminations qui paraissent s'imposer. La première élimination porte sur la case préposition (cette catégorie pouvant, sur la base de critères de fonctionnements syn- taxiques, soit être intégrée au verbe, soit constituer elle-même le nouveau verbe d'un nouvel énoncé élémentaire, soit encore l'équivalent d'un connec- teur inter-énoncés).

Donnons des exemples illustrant chacune des trois possibilités :

a) La préposition intégrée au verbe correspondrait au cas que l'on appelle traditionnellement « complément fortement régi ». Exemple : « Elle pense à lui » « elle va à Paris », Ces deux exemples ne doivent pas susciter l'idée qu'il s'agit uniquement de verbes n'introduisant pas de complément direct. Soit en effet le cas de la phrase : « elle donne un livre à Pierre », le complément « à Pierre » sera traité de la même façon que « à lui » et « à Paris » dans les exemples ci-dessus, à ceci près que la présence de deux compléments oblige à dupliquer le schéma d'où :

schéma 1 : elle donner livre. schéma 2 : elle donner à Pierre. Cette duplication pose un problème théorique par les artefacts qu'elle

risque d'induire si on ne distingue pas, comme nous proposons de le faire plus loin, « schéma morpho-syntaxique » et « schéma d'énoncé »

1. Nous entendons ici par « énoncé élémentaire » le bloc des huit cases morpho- syntaxiques : F, dl, NI, Y, ADV, P, d2, N2 présenté plus haut.

47

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 43: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

b) La préposition devenant le verbe d'un nouveau schéma correspon- drait au cas que l'on appelle traditionnellement « complément circonstan- ciel ». Exemple : « Elle viendra à trois heures », ce qu'on pourrait représenter à l'aide de deux schémas :

schéma 1 : Elle venir 0

avec 0 désignant l'absence de complément fortement régi schéma 2 : schéma 1 eioc trois heures

où eioc est un méta-verbe introduisant un repérage de localisation, en l'occurrence temporelle.

Cette représentation aurait l'avantage de tenir compte du lien avec la nominalisation du schéma 1 sous la forme : « Sa venue aura lieu à trois heures ».

c) La préposition transformée en un connecteur inter-énoncé corres- pondrait au cas particulier du chevauchement entre préposition et conjonc- tion dû au fait que la préposition introduit en réalité un substantif nomina- lisant une proposition. Exemple : « Il s'est habillé à cause de sa venue » correspondant à : « Il s'est habillé parce qu'elle est venue ».

Cette présentation ne doit pas faire oublier que l'absence de préposi- tion ne désigne pas nécessairement un complément « d'objet direct». Il faut une analyse contextuelle fine pour retrouver le circonstanciel dans : « il boit le matin » ou même dans « il aime la nuit » (ambigu).

D'autre part les références à la terminologie classique sous la forme d'expressions comme : « complément fortement régi », « complément cir- constanciel », « préposition-conjonction », ne doivent pas masquer le fait qu'elles sont inutilisables comme telles. Ce que nous proposons en réalité, c'est de définir les trois fonctionnements syntaxiques dont nous venons de donner des exemples à partir, d'une part d'une étude des types de verbes (dans la perspective des recherches de M. Gross , 1968) et d'autre part d'une théorie des rangs de compléments (cf. l'élaboration théorique proposée par A. Culioli, à propos des pronoms du français, Culioli, 1968, p. 116 *).

1. « On trouve dans ce passage l'esquisse d'une théorie syntaxique des rangs de compléments du verbe, fondée sur des tests de paraphrasage syntaxique. En français, le système des compléments du verbe se présenterait schématiquement de la manière suivante (la paraphrase étant établie sur la base de la troisième personne du singulier) :

- est complément de rang zéro , tout groupe susceptible d'être paraphrasé par « il », - est complément de rang 1, tout groupe paraphrasable par : « le, la », - est complément de rang 2 , tout groupe paraphrasable par : « lui », - est complément de rang 3 , tout groupe paraphrasable par : « y » (au sens d'une localisation, avec ou sans mouvement, ex. : « j'y vais », « j'y reste » ; ou d'un substitut de proposition, ex. : « j'y pense »), - est complément de rang 4 , tout groupe paraphrasable par « en » (ex. : « j'en viens », « il l'en frappe »).

A ces cinq rangs de compléments, s'ajoutent des emplois que l'on peut qualifier de « mixtes », intermédiaires entre deux rangs : ex. : « y » combinant les valeurs de 1 et de 2 dans l'emploi familier « j'y donne = je le lui donne ».

48

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 44: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

Une étude combinant ces deux perspectives est actuellement en cours dans l'équipe TAL (Traitement automatique des langues, C. N. R. S.) de Grenoble.

La seconde élimination concerne les deux cases déterminants (il existe en effet des raisons théoriques de traiter les déterminants comme des traces de repérage énonciatifs au même titre que par exemple les aspects ou les modalités).

Par ailleurs, on a déjà souligné plus haut le caractère insatisfaisant de la case « adverbe ». Nous supposerons ici que les problèmes qui lui sont liés ont été résolus et que cette case a elle aussi disparu comme telle. On voit dès lors que, en conservant la terminologie de départ, la reconfiguration aboutit à réduire « l'énoncé élémentaire » à une suite de trois éléments NI, V et N2 (avec N2 facultatif) et à lui associer un groupe F, Dl, D2. D'où la représentation :

(F di d2) + (NI V N2)

dans laquelle NI Y N2 constitue le « schéma morpho-syntaxique » et F dl d2 le relevé des formes morpho-syntaxiques déterminant ce schéma (quant à la voix, le statut, le mode et le temps pour le verbe, et quant aux déterminants pour les substantifs)

Considérons maintenant les trois objets NI, Y, N2. Leur dénomination (N et Y) renvoie clairement à une catégorisation morpho-syntaxique, c'est-à-dire à des classes d'objets auxquelles sont associés biunivoquement des paradigmes de variations morphologiques (tels que désinences de conjugaisons ou affixes de nombre) et des fonctions syntaxiques (sujet, verbe, objet) ; or, si le recours à une telle catégorisation est indispensable dans la première étape de la reconnaissance, elle ne se justifie plus au niveau d'une représentation visant à rendre compte des phénomènes d'énonciation. On peut même dire que cette catégorisation trahit ici, par sa persistance théoriquement injustifiée, l'effet de ce que nous avons appelé plus haut la « philosophie spontanée de la grammaire » ; elle repose en effet sur l'idée d'une construction hiérarchisée allant de la phrase à la proposition, et de la proposition aux fonctions syntaxiques. Or les notions de « phrase » et de « proposition », qui se réfèrent en fait à des considérations sémantiques non formulées, ne sont pas autrement justifiées que par une description de leurs constituants : « la phrase se décompose en ... », « la proposition se décompose en . . . ». Prenons plus précisément la notion de proposition ; les fonctions syntaxiques qui la caractérisent sont : le verbe (centre de la proposition), le sujet (constituant en général obligatoire), le ou les complé- ment^) (constituant(s) plus ou moins facultatif(s)). Cette catégorisation syntaxique semble doublée d'une catégorisation morphologique telle que sujet et compléments correspondent à la catégorie « nom ». Or ceci revient

1. On peut remarquer que le groupe F dl d2, que nous isolons ainsi, correspond assez précisément à ce que A. Martinet désigne par le terme de « modalité », à ceci près qu'il en exclut la voix , traitée directement comme « fonction du prédicat ».

49 LANGAGES N° 37 4

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 45: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

à jouer d'une part sur le double statut du verbe (fonction syntaxique et catégorie morphologique) et d'autre part sur le fait que, dans la plupart des langues indo-européennes, c'est ce même élément « verbe » qui joue le rôle sémantiquement privilégié de centre de la proposition. Mais, si l'on considère d'autres langues (comme par exemple certaines langues africaines), on s'aperçoit qu'il existe des propositions nominales et des propositions adjectivales c'est-à-dire que la correspondance entre catégorie morpho- logique, fonction syntaxique et rôle sémantique ne joue plus ; le rôle séman- tique de centre, garant de la bonne formation de la proposition, et de sa possibilité d'être assertée, revient en effet à un élément parfois qualifié de « prédicatif » ; autrement dit, l'organisation morpho-syntaxique de la proposition, propre à une langue donnée, est distincte du phénomène de la proposition proprement dit, en tant que constitution d'une unité pouvant être assertée de façon indépendante. Plus précisément, le schéma morpho- syntaxique NI (sujet) V (verbe) N2 (objet) ne constitue qu'un cas parti- culier parmi l'ensemble des modes de réalisation de la proposition. S'il en est ainsi, et si l'on admet que ce que nous avons appelé « phénomène de la proposition » en tant qu'unité indépendante énonçable relève des pro- cessus d'énonciation, alors il est clair qu'une grammaire de reconnaissance d'une langue (le français en ce qui nous concerne) doit se donner deux niveaux distincts d'analyse : le niveau morpho-syntaxique où est carac- térisé le mode d'organisation propre à la langue considérée et un niveau qui détermine l'unité minimale d'énonciation ainsi que les opérations d'énonciation qu'elle supporte. Compte tenu des remarques qui précèdent, nous n'emploierons pas le terme « profond » pour désigner ce niveau, en raison du cortège de métaphores que ce terme véhicule. Nous parlerons, ainsi que nous l'avons déjà annoncé (cf. p. 18) de niveau « sémantique- formel » en reprenant les termes de A. Culioli qui parle de «sémantique formelle ».

Dans cette expression, le terme « sémantique » rappelle qu'il s'agit d'un niveau qui n'est plus celui des catégories morpho-syntaxiques, et où les unités se définissent comme supports des opérations d'énonciation ; le terme « formelle », quant à lui, indique d'une part que ce niveau peut être atteint par des procédures formelles en remontant à partir de la sur- face, et d'autre part que les opérations d'énonciation en jeu présentent un caractère de systématicité qui les rend elles aussi passibles d'un trai- tement formel. Précisons bien encore une fois qu'il ne s'agit pas de séman- tique au sens génératif-transformationnel du terme et donc pas d'une composante interprétative de la syntaxe, mais d'un effet résultant de la combinaison de la syntaxe à elle-même (syntaxe X syntaxe) sous la forme de couplages entre des fonctionnements syntaxiques ce qu'on pourrait appeler « l'effet d'hyper-syntaxe », qui est pour nous strictement identique à l'effet sémantique-formel.

Ainsi la notion de proposition se trouve éclater en : « schéma morpho- syntaxique » d'une part et d'autre part en ce que nous appellerons schéma -

50

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 46: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

ď énoncé *, qui se situe au niveau de Fhyper-syntaxe (ou niveau sémantique- formel) que nous venons d'évoquer.

Précisons à présent que nous caractérisons le schéma d'énoncé comme une relation orientée (case centrale du schéma, notée R), mettant en rapport un domaine de départ - ou source de la relation - (case de gauche notée D) et un domaine d'arrivée - ou cible de la relation - (case de droite notée A). Soulignons bien que les places du schéma ne correspondent pas à des catégories morpho-syntaxiques (substantif, verbe, substantif), ni à des fonctions syntaxiques (sujet, verbe, objet) 2. Bien entendu l'objectif d'une grammaire de reconnaissance du français impose que les chemine- ments d'un niveau à l'autre soient réglés par une procédure effective.

2) Définition des principes ďun calcul .

Une fois défini le schéma d'énoncé (DRA) que nous avons dérivé (et non pas décalqué) du schéma morpho-syntaxique (NI V N2) - après avoir réglé comme on l'a vu le cas de ADV et P - il reste à définir ce qui porte sur le schéma d'énoncé DRA, c'est-à-dire le correspondant pour DRA de ce que représente le contenu de la liste F dl et d2 par rapport à NI V N2. Nous passons ainsi de la description de listes à un calcul. Dans l'état actuel des recherches, il n'est évidemment pas possible de préciser dans le détail l'enchaînement des étapes par lesquelles on passera d'une catégorisation morpho-syntaxique de départ (p. ex. : article défini singulier, passé composé,...) à des formules de calcul portant sur le schéma d'énoncé. Nous pensons seulement indiquer de quelle manière il nous semble possible de représenter un calcul décrivant la « syntaxe » de ces opérations par rapport au schéma d'énoncé. Le schéma d'énoncé, tel que nous l'avons présenté, est comparable à la notion de « lexis » développée par A. Culioli 3. On trouvera une présentation détaillée de cette notion dans : Culioli, Fuchs, Pêcheux (1970), pp. 19-25. Disons simplement ici que cette notion désigne la donnée d'un triplet orienté où deux prédicats unaires (ex : « être- garçon », « être-pomme ») sont mis en relation par l'intermédiaire d'un prédicat binaire (ex : « manger »). En associant à des unités de surface

1. Nous préférons cette expression à celle, plus fréquente, de « schéma prédicatif », en raison des connotations logicistes de cette dernière. 2. On peut fournir des exemples dans lesquels l'élément occupant la place centrale

peut aussi bien correspondre à ce qui, en surface, se réalise par une préposition, qu'à un verbe ou encore à un substantif résultant d'une nominalisation. 3. Nous sommes conscients du fait que, ce faisant, nous prenons une certaine

position à l'intérieur de la philosophie du langage, ce que d'ailleurs nul ne peut éviter. Les recherches de A. Culioli se réfèrent implicitement ou explicitement aux positions de Guillaume et de Benveniste, et nous avons fourni plus haut les justifications théoriques de nos réserves. Il reste que la mise en cause, par A. Culioli, du logi- cisme qui cohabite souvent avec les thèses génératrices-transformationnelles - voir à ce sujet les développements récents de la sémantique générative - est théoriquement lourde de conséquences, comme d'ailleurs la reconnaissance de l'inconscient analy- tique, ce qui n'est pas si fréquent parmi les linguistes.

51

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 47: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

(comme par exemple les auxiliaires ou les modaux) des méta-opérateurs *, il devrait être possible d'établir des formules ayant pour effet d'associer à chacun des termes du schéma d'énoncé des valeurs de variables 2, (étant donné que les termes ont, à l'intérieur de ce schéma, un statut de variables) 3. Ces valeurs de variables correspondent à des valeurs d'opérations comme par exemple celles qui peuvent s'associer aux opérations d'aspect, de moda- lités, de thématisation, . . . Les déterminants et les personnes font également partie de ces opérations 4.

Nous prenons ainsi en compte le travail effectué dans le domaine de la représentation formelle de ces opérations sur la base des thèses de A. Culioli, depuis la publication de « Analyse automatique du dis- cours » (1969) où le terme de « lexis » était simplement mentionné (p. 85), dans une perspective de développement critique qu'amorçait l'Annexe de C. Fuchs : « Etude des marques de détermination dans F » ( ibidem pp. 128-134).

Le terme de « lexis » se retrouve également dans une présentation de 1970 (« Lexis et Méta-lexis », in Culioli, Fuchs, Pêcheux (1970), où nous tentions comme nous l'avons dit plus haut de proposer un mode de traitement du problème des déterminants dans la perspective d'une théorie de la lexis. Cela constituait déjà un essai pour passer des huit cases de l'énoncé élémentaire aux trois places de la lexis. Nous y introduisions la notion de « métalexis » (schéma à trois places - un prédicat et deux argu- ments - c'est-à-dire formellement comparable à la lexis mais ayant pour particularité d'avoir deux places sur trois instanciées à l'aide de méta- termes : en premier argument le sujet énonciateur - noté Z - et en prédi- cat la désignation d'une opération de détermination portant sur un terme lexical assigné en place de deuxième argument). Ceci visait à introduire explicitement dans la représentation le sujet énonciateur comme support de l'opération de détermination et à sortir les déterminants de l'énoncé de manière à ce qu'ils portent sur cet énoncé. La lexis représentant l'énoncé de surface comportant le terme lexical déterminé était reliée par le connec- teur 8 (cf. op . c¿£., pp. 35-36) à la méta-lexis désignant l'opération de détermination.

Cette tentative qui visait donc en fait à résoudre à la fois deux difficiles problèmes, était criticable à bien des égards :

- Premièrement, au niveau théorique où elle se plaçait, la représen-

1. Ces méta-opérateurs constituent autant de traces de repérages énonciatifs, c'est-à-dire de relations qualifiées entre le schéma d'énoncé et le sujet énonciateur au moment de son énonciation.

2. Il nous semble important de souligner que les valeurs de variables que nous introduisons ainsi ne s'inscrivent pas dans une logique binaire (0/1), mais dans un sys- tème en réseau (à quatre valeurs : 0/1 /♦/co) dont un des exemples peut être trouvé dans le schéma de « came » présenté par A. Culioli, 1968, p. 115).

3. On trouvera des exemples de tels calculs dans G. Fuchs et J. Kouault (1972 et 1973).

4. Sur les problèmes d'aspect et de voix, voir A. Culioli, 1971.

52

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 48: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

tation proposée n'était pas explicative, en ce sens qu'elle consistait en un simple codage des unités de surface (articles possessifs, indéfinis . . . ) à l'aide d'un nom ďopération (comme : « extraction », « fléchage », « parcours »), et non pas en une caractérisation formelle de l'enchaînement des étapes que constitue en fait l'opération que supporte l'unité lexicale (par ex. : partir d'une notion, définie en compréhension, à laquelle on associe une classe, passer en extension, effectuer le prélèvement quantifié ou non d'une sous-classe,...). Ceci revient à dire que du point de vue formel, il n'existait ni opérateurs ni calcul. Pour cela il aurait fallu mener une analyse linguistique beaucoup plus fine établissant quelles valeurs de détermination sont possibles ou impossibles en fonction à la fois du contexte (ex : présence de relatives ou d'adjectifs, nature des déterminations sur le verbe...) et des types de substantifs 1. De plus, cette représentation avait le défaut de court-circuiter les deux étapes que nous présentons ici sous le nom respectivement de « calcul sur le schéma d'énoncé » et de « processus énonciatif » qui, comme nous le verrons, concerne le repérage de l'énoncé par rapport au sujet énonciateur, à la situation...

- Deuxièmement, sur le plan pratique, et compte tenu du caractère partiel de cette étude (les déterminations du verbe n'étaient pas représen- tées) ce mode de représentation n'a pas pu être repris ultérieurement, ni intégré comme tel dans une grammaire de reconnaissance, faute de pouvoir établir les règles permettant de passer de la surface à ce type de représen- tation.

Dans la perspective qui est actuellement la nôtre, nous pensons que deux possibilités se présentent à la suite du calcul des valeurs de variables que nous avons présenté plus haut :

1) intégrer, dans les représentations soumises à la phase 3 du traitement AAD, les résultats de ce calcul, sans les interpréter auparavant d'une manière ou d'une autre.

2) considérer les valeurs de variables ainsi calculées comme des traces d'opérations d'énonciation et représenter, dans les données d'entrée de la phase 3, ces opérations d'énonciation sous la forme d'un système de repé- rages du schéma d'énoncé par rapport au « moi-ici-maintenant » de l'énon- ciateur, intervenant explicitement comme origines des repérages, comme points d'ancrage de l'énoncé.

Nous ne sommes pas, à l'heure actuelle, en mesure de trancher entre

1. On a signalé plus haut le caractère inadéquat d'une conception du lexique indépendant des fonctionnements syntaxiques. Sans aborder ici l'examen des condi- tions permettant de résoudre ce problème, nous remarquerons au passage que l'effet du lexique ne s'épuise pas à travers l'analyse morphologique de 1'« unité lexicale », mais que le lexique s'articule sur le niveau syntaxique (dans la mesure en perticulier où l'on peut établir des classes lexicales - classes de verbes, d'adjectifs, de substan- tifs, ... - sur la base de fonctionnements syntaxiques), ce qui a des retentissements au niveau que nous avons caractérisé comme « sémantique-formel ».

53

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 49: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

ces deux possibilités. D'ailleurs, le fait d'aller plus ou moins loin dans la voie que nous indiquons dépendra largement du type d'objectif qui pourra, dans cette nouvelle perspective, être assigné à une analyse A AD. Il se peut que la deuxième possibilité présente un intérêt spécialement à l'égard de la problématique des « oublis » introduite plus haut.

Nous récapitulerons les niveaux d'analyse proposés par le tableau suivant :

Niveau morpho- (F dl d2) + (NI V N2) syntaxique groupe modalisateur schéma morpho-syntaxique

Niveau sémantique- (traces de repé- (D R A) formel rages énonciatifs) schéma d'énoncé i. e. : application des traces de repérages énonciatifs au schéma d'énoncé, à l'aide de méta-opérateurs permettant de calculer les valeurs de variables associées à D, R et A.

Niveau énonciatif (DRA) repéré par rapport au « moi-ici maintenant » i.e.: processus énonciatifs.

Enfin, nous ne pouvons pas développer ici les perspectives qu'im- pliquent les critiques formulées plus haut concernant la « domination théo- rique de la phrase » ; nous nous limiterons à désigner quelques aspects.

Tout d'abord, il semble nécessaire, on l'a déjà mentionné, de développer l'étude des couplages de fonctionnements reliant le système des détermi- nants, celui des prépositions et celui de ce qu'on appelle classiquement les « conjonctions » entre eux d'une part, et d'autre part avec le système des marques de modalités, aspects, thématisation qui sont le plus souvent véhiculées en français par le système verbal.

Mais le propre de cette étude paraît être en même temps que le carac- tère systématique et fermé de son objet s'articule nécessairement sur un autre type de classification, portant sur la liste ouverte des verbes en tant qu'unités lexicales, et débouchant sur une typologie fondée sur les « rangs de compléments ». Ce travail doit selon nous prendre appui sur les résultats obtenus dans ce domaine par M. Gross (1968) et ses collaborateurs, et c'est, aussi bien, la direction suivie actuellement dans le domaine linguis- tique, en particulier par l'équipe TAL de Grenoble.

Le propre de cette tentative est, à notre avis, de ne pas limiter son investigation au cadre de la « proposition » sous prétexte qu'elle contient « un verbe » à un mode personnel, mais de déterminer et d'étudier (expé- rimentalement pourrait-on dire) pour chaque complexe syntaxique cons- titué d'un lexème verbal et des différents systèmes énumérés plus haut la zone textuelle dans laquelle se manifestent les répercussions de ce complexe syntaxique , c'est-à-dire : la portion de séquence qui est liée à ce complexe par des possibilités de reformulation et de paraphrase syntaxique, portion de séquence que l'on désignera sous le nom de « centre syntaxique » ; et on voit clairement qu'il n'y a aucune raison, à ce niveau, pour que cette zone

54

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 50: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

coïncide nécessairement avec les marques que «l'analyse logique» (c'est- à-dire en fait grammaticale) utilise pour découper les « propositions ». Mais c'est dire du même coup que, dans cette perspective, les phénomènes de paraphrase sont par nature reliés à ceux de ce qu'on appelle l'inter- phrase (avec non seulement les questions d'anaphore déjà signalées, y compris les différentes formes de nominalisation, mais aussi toute la ques- tion des « attaques de phrases »).

Nous pensons que le point désigné ici constitue ainsi un point fonda- mental d'articulation entre linguistique et théorie du discours 11 dans l'exacte mesure où les rapports paradigmatiques de substitution para- phrastique s* articulent, se combinent et s'échangent nécessairement avec les rapports syntagmatiques inhérents à la séquence linguistique-textuelle.

Cette direction nous paraît actuellement le seul moyen d'avancer dans l'éclaircissement de la question, difficilement soluble au seul niveau lin- guistique-grammatical, de l'autonomisation des énoncés. En effet, sauf à convoquer l'appareil logico-philosophique du jugement pour fonder cette autonomie de l'énoncé tout en lui donnant l'apparence d'un critère « pure- ment linguistique », on voit mal comment on peut désormais méconnaître que le degré d'autonomie d'un énoncé par rapport à son « contexte » ne se résorbe pas entièrement dans un pur effet de langue mais s'articule néces- sairement sur la discursivité.

3) L'analyse du processus discursif. La troisième phase concerne, ainsi que nous l'avons indiqué plus haut,

l'ensemble des opérations de « désyntagmatisation » discursive, la délinéa- risation linguistique ayant été effectuée auparavant c'est-à-dire par les opérations de la phase 2.

Nous commencerons par rappeler les aspects principaux de cette phase, sous la forme où elle s'exécute actuellement dans le programme de calcul qui la réalise 2. Nous signalerons ensuite les différentes critiques qui ont été formulées à l'égard de cette procédure, en suggérant diverses pos- sibilités susceptibles d'y remédier au moins partiellement. Nous poserons enfin la question plus générale du rapport entre les phases 2 et 3, pour examiner si les deux conditions que nous avons posées précédemment (cf. p. 34) trouvent leur réalisation dans des dispositions à la fois nécessaires et suffisantes, et quelles solutions nouvelles s'offrent à nous dans le cas d'une réponse négative à cette question.

3.1. Aspects principaux de la procédure de désyntagmatisation discursive , dite « phase 3 ».

Nous considérons que la phase 1 ayant déterminé les conditions de production du (ou, de préférence on l'a vu, des) corpus, et les ayant maté-

1. C'est-à-dire, dans la présente terminologie, à l'articulation et à Tinter-détermi- nation entre les phases 2 et 3. Cf. ci-dessous, p. 79-80.

2. Cf. Bibliographie, II, 4.

55

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 51: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

riellement réalisés sous la forme d'une famille de « surfaces linguistiques », et la phase 2 ayant à son tour fait correspondre à chacune de ces séquences inguistiques sa représentation désuper ficialisée, nous sommes en présence de n corpus susceptibles de constituer des « entrées » de la phase 3, dans la mesure où chacun de ces corpus est composé de deux listes, à savoir la liste des « énoncés élémentaires » (EN) et la liste des « relations binaires » (RB) 1 correspondant à l'ensemble des graphes constituant le corpùs. En laissant de côté toutes les précautions à prendre pour que les données EN et RB ne contiennent pas d'erreur 2 (traitement de normalisation purement mécanographique des données, renumérotation des n° d'énoncés par exemple), nous nous contenterons d'exposer les deux parties fondamentales de ce traitement , à savoir :

- une comparaison des structures « graphes » introduites en données par un balayage « point par point », destiné à munir chacun de ces points de comparaison d'une caractéristique mathématique exprimant le résultat de la comparaison,

- une procédure de reconstruction de sous-structures, à partir de l'information obtenue dans la première partie du traitement. Décrivons successivement ces deux sous-phases :

a) La première consiste à effectuer une comparaison systématique point par point, en prenant la relation binaire comme unité de comparaison ; il est à souligner que ce balayage peut en fait prendre plusieurs formes, en fonction des conditions préalables que l'on introduit : outre le cas, en effet, où toutes les relations binaires du corpus sont comparées entre elles, il est apparu intéressant de restreindre la comparaison de deux manières qui peuvent d'ailleurs s'associer. La première restriction consiste à n'effec- tuer la comparaison que d'un discours à Vautre , ce qui constitue en fait la décision opposée à celle de Harris qui, on le sait, a défini la procédure d'analyse de discours en référence à un seul texte , c'est-à-dire en référence à un fonctionnement intra-textuel ; en procédant de la sorte, Harris se règle sur l'hypothèse implicite selon laquelle un texte se répète, reproduit syn- tagmatiquement des structures qui peuvent être superposées par l'opération d'analyse, revenant à les paradigmatiser. Ceci explique pourquoi Harris accorde une importance méthodologiquement privilégiée aux textes de propagande ou de publicité, et, en général, aux formes « stéréotypées » de la discursivité : cela correspond à la nécessité, dans sa perspective, que le texte soit son propre dictionnaire , alors que, dans la perspective que nous

1. La liste des RB est en fait la liste des arcs du graphe, munis de leur valuation qui est un connecteur. Le graphe ayant pour sommets les énoncés élémentaires, il définit une relation binaire sur l'ensemble des énoncés. Par abus de langage, on a appelé « relations binaires » un couple d'énoncés élémentaires en relation, et muni du connec- teur qui lui est attaché.

2. Un programme préliminaire de détection d'erreurs dans les données a été réalisé par J. Léon dans le cadre du Service Calcul Sciences Humaines CNRS.

56

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 52: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

décrivons actuellement (et dont la filiation, évidente, avec les recherches de Harris a été plusieurs fois soulignée), c'est le corpus qui joue ce rôle ď auto-dictionnaire : et c'est en effet dans le passage de l'intra- à l'inter- répétitivité que la désubjectivisation de la discursivité, préparée par le travail de Harris, trouve ses véritables conditions de réalisation. Le sens méthodologique de la restriction que nous exposons ici est donc de permettre d'étudier l'effet de la différence entre une comparaison inter-discours dans laquelle un discours n'est comparé à lui-même qu'indirectement, c'est-à-dire dans la mesure où deux sous-séquences lui appartenant se trouvent rappro- chées par l'intermédiaire d'une autre sous-séquence appartenant à un autre discours, et une comparaison dans laquelle ce rapprochement entre les deux sous-séquences considérées est opéré directement. On peut d'ailleurs rechercher les conditions auxquelles doit répondre un corpus pour que le choix de l'une ou l'autre des deux options signalées n'ait aucune influence sur les résultats : c'est, semble-t-il, dans cette direction que s'orientent en partie les travaux de M. Dupraz et G. Del Vigna (1974) ; cette recherche devrait permettre de préciser certains aspects formels caractérisant l'autonomie d'un processus discursif, par différence entre son inter- et son intra-répé- titivité 1.

La deuxième restriction que nous avons mentionnée à l'égard de la procédure de comparaison « point par point » entre relations binaires concerne la nature des connecteurs des deux relations considérées : il est actuellement possible, soit d'effectuer toutes les comparaisons entre RB (dans les limites de la première restriction, évidemment) soit de restreindre cette comparaison aux couples de RB présentant un connecteur identique : cette dernière option, qui correspond aux dispositions décrites dans AAD 69 (construction des « psi-classes ») et qui était obligatoire dans la version initiale du programme FORTRAN (Paris) et dans sa version ALGOL W (Gre- noble), a fait l'objet de critiques dans la mesure où le traitement particulier des connecteurs les excluait en fait de la procédure de comparaison, puisque la distance entre deux connecteurs ne pouvait être considérée que comme nulle dans le cas de l'identité pure et simple des connecteurs, ou trop grande a priori pour conserver un intérêt quelconque à la comparaison entre les deux RB, qui n'était pas effectuée dans le cas de connecteurs différents.

Nous pouvons maintenant rappeler brièvement en quoi consiste la comparaison « point par point ». Plaçons-nous dans les conditions où les deux ordres de restriction sur le balayage ne jouent pas : on voit facilement que si la liste des RB contient n relations binaires, il y aura n(n - l)/2 compa- raisons, en tenant compte du fait qu'on ne compare pas une RB à elle-même (ce qui n'exclut pas évidemment de comparer deux RB identiques entre elles !), et d'autre part que le résultat de la comparaison C(RBi/RBj) est

1. Cette procédure pourrait s'appliquer à l'étude des conditions de clôture d'un corpus, en considérant qu'il est toujours possible d'obtenir cette clôture en dupliquant le corpus.

57

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 53: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

identique à celui de C(RBj/RBi). Notons que chacun de ces points de comparaison aura la forme

Em Ki En Ep Kj Eq

Rappelons enfin que la proximité caractérisant un point de comparaison se calcule actuellement de la manière suivante :

Soient les deux énoncés gauches (Em/Ep) d'une part, et les deux énon- cés droits d'autre part (En/Eq) : à chacun de ces deux couples d'énoncés peut être associé un vecteur booléen exprimant par une succession de 0 et de 1 le résultat de la comparaison colonne par colonne des contenus littéraux des deux énoncés du couple avec 1 pour l'identité et 0 pour la différence. A ces deux vecteurs s'ajoute, dans le cas le plus général, une valeur 1 ou 0 exprimant l'identité ou la non-identité entre Ki et Kj.

Chacun des deux vecteurs énoncés est multiplié par un vecteur affectant un certain poids (positif ou nul) à l'identité des contenus pour chaque catégorie, et de même pour le vecteur-connecteur à un élément. La somme arithmétique des valeurs pondérées ainsi calculées exprime « la proximité » entre les deux RB constituant le point de comparaison. Le rapport entre « proximité » et « distance » s'exprime par la relation suivante :

d(RBi/RBj) = Max - p(RBi/RBj)

où d désigne la « distance », Max la valeur prise par la somme dans le cas où les vecteurs ne contiennent que des 1, et p la somme arithmétique calculée comme il est indiqué plus haut.

On peut montrer que l'application ainsi définie possède toutes les propriétés mathématiques d'une distance sauf une ; la propriété que cette application ne vérifie pas pourrait s'énoncer ainsi : « si la distance entre deux objets est nulle, alors ces deux objets sont égaux ». Par abus de langage, nous continuerons cependant à parler de « distance ».

A l'issue de cette première phase du traitement informatique, nous avons muni les n(n - l)/2 points de comparaison d'une valeur arithmétique. La procédure actuelle (on indiquera plus loin des possibilités de modifica- tions sur ce point) consiste à comparer cette valeur arithmétique, caracté- ristique du « point de comparaison », à une valeur introduite en données (au même titre que le système de pondérations précédemment mentionné) et à effectuer la partition de l'ensemble des « points de comparaison » en deux sous-ensembles, dont l'un contient tous les points de comparaison munis ďune valeur arithmétique supérieure ou égale à la valeur introduite en don- nées. Dans la terminologie du programme Fortran, cet ensemble constitue le tableau des quadruplets (= vecteurs de 4 énoncés), et le tableau des chaînes de longueur 1 dans celle du programme élaboré à Grenoble en Algol W.

b) Construction des « domaines sémantiques ». La deuxième phase du traitement informatique que nous décrivons

58

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 54: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

ici consiste en une procédure de reconstruction de sous-structures carac- téristiques du corpus analysé. Indiquons tout de suite que cette procédure repose, dans son principe, sur l'idée de combiner les relations syntagma- tiques et les relations paradigmatiques implicitement contenues dans le « tableau des quadruplets » défini ci-dessus. Nous suivrons dans notre description la voie qui a été suivie par le programme FORTRAN (Paris), tout en rappelant que le programme élaboré par le groupe de recherches de Grenoble aboutit aux mêmes résultats par un autre cheminement 1. Pour la clarté de l'exposition, nous commencerons par rappeler d'une part les types d'objets avec lesquels s'opère la reconstruction, et d'autre part les lois qui y président.

Il importe tout d'abord de souligner que la procédure utilisée suppose la mise en jeu de trois types iï objets , à savoir les quadruplets , les chaînes et les domaines. Nous préciserons dans un instant les moyens par lesquels chaque type d'objet est construit à partir du type d'objet qui lui préexiste ; il importe toutefois, avant tout, de bien mettre en évidence le caractère « constructiviste » de ces moyens : les objets de rang supérieur aux quadru- plets (i. e. « Chaînes » et « domaines ») sont en effet définis par la manière dont ils sont construits . Par ailleurs, et ceci constitue une autre loi qui préside à cette construction, les objets de rang n sur lesquels les lois de construction d'objets n + 1 sont restées sans effet deviennent eux-mêmes des objets de rang n + 1. En d'autres termes les quadruplets « résiduels » deviennent des chaînes à l'issue du traitement des quadruplets, et de la même façon, les chaînes « résiduelles » deviennent des domaines à l'issue de la formation des domaines.

Précisons dès lors ce que recouvrent ces trois niveaux d'objets : - Les quadruplets ont été définis ci-dessus, au cours de la première

phase sur laquelle nous ne revenons pas. - Les chaînes correspondent à la phase syntagmatique de la recons-

truction : leur procédure de formation est la suivante. Soit le tableau des « quadruplets », chacun d'eux comportant deux énoncés « gauches » et deux énoncés « droits ». On dira que deux quadruplets amorcent la formation d'une chaîne si les deux énoncés de gauche de l'un sont identiques (portent les mêmes numéros d'ordre dans la liste des énoncés) aux deux énoncés de droite de l'autre.

Exemple : Em En En Es Em En Es

K + K' K K' Ep Et Et Ev Ep Et Ev quadruplet 1 quadruplet 2 amorce de chaîne

1. La différence entre les deux programmes réside essentiellement dans l'ordre selon lequel ils effectuent les opérations : disons simplement que le programme ALGOL W suit plus littéralement le texte AAD 1969, en particulier concernant la notion de « ̂ -classes », et de manière plus générale traite tous les rapports paradigmatiques avant d'aborder les enchaînements syntagmatiques inter-énoncés, ce qui n'est pas le cas dans la version parisienne.

59

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 55: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

On génère ainsi un « tableau des chaînes » à partir du tableau des quadruplets. Rappelons encore une fois que les quadruplets résiduels restés « célibataires » sont intégrés, à l'issue de cette opération, à l'ensemble des chaînes (au titre de « chaînes de longueur 1 » dans la terminologie du pro- gramme réalisé à Grenoble).

- Les domaines correspondent à la phase paradigmatique de la recons- truction : la règle de leur formation suppose la définition intermédiaire de la « séquence » comme demi-chaîne : ainsi, dans la chaîne ci-dessus, on distinguera les deux séquences « Em, En, Es » d'une part et « Ep, Et, Ev » d'autre part. Cette définition intermédiaire étant rappelée, on dira que deux chaînes appartiennent à un même domaine si elles ont une séquence en commun. En appliquant cette règle, on voit que l'on peut rapprocher dans un même domaine des séquences qui n'avaient pas directement formé de quadruplet. On dira alors que ce rapprochement s'effectue par transi- tivité, en se souvenant bien que cette transitivité est imposée par la règle de formation des domaines, et nullement constatée comme une propriété « démontrable » de V objet-domaine. Enfin, il va évidemment de soi que, comme précédemment, les chaînes qui ne se sont pas associées à une autre chaîne pour former un domaine sont intégrées au « tableau des domaines », à l'issue de cette étape du traitement. De cette manière, il n'est pas rare qu'un quadruplet (objet de rang 1) resté syntagmatiquement et para- digmatiquement isolé devienne une chaîne de longueur 1 c'est-à-dire un objet de rang 2, puis un domaine formé de deux séquences , autrement dit, un objet de rang 3.

c) Mentionnons un dernier aspect de la procédure actuelle, avant de revenir sur le résultat central de celle-ci, à savoir la représentation du pro- cessus discursif par ces « domaines sémantiques » dont nous venons d'expo- ser le mode de génération : il s'agit de la constitution d'un « tableau des relations entre domaines » dont nous rappellerons seulement les deux types d'information qu'il fournit, qu'on pourrait désigner respectivement corr ne des relations paradigmatiques définissant des relations d'intersection et d'inclusion entre domaines, et des relations syntagmatiques caractérisant les cheminements propres au processus discursif du corpus. Disons simple- ment que les premières relations conduisent à la construction de regroupe- ments de domaines (ou « hyper-domaines »), cependant que les secondes permettent de tracer le graphe du processus discursif , graphe connexe non valué dont les nœuds sont constitués par des domaines ou des hyper- domaines.

Reprenons donc la question que nous venons de laisser en suspens, c'est-à-dire la question des « domaines » en tant qu'éléments de base par lesquels est obtenue une représentation du processus discursif : on constate que sous la forme actuelle des résultats, les « domaines sémantiques » se présentent comme des regroupements de n sous-séquences extraites de discours du corpus, à travers la délinéarisation syntaxique qu'en a fourni la deuxième phase. Ces n objets sont par construction dans un rapport de substi-

60

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 56: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

tution dont la procédure que nous venons de décrire ne précise pas davantage la nature. Nous avions pensé au début (Pêcheux, 1969) que ces substitutions étaient nécessairement des indices d'équivalence, en d'autres termes que les n séquences d'un domaine constituaient n formes sémantiques équiva- lentes ďune même proposition , au sens logique du terme *.

Dès la publication du Manuel, nous avons attiré l'attention sur le fait que les relations de substitution auxquelles on aboutissait ainsi ne semblaient pas pouvoir se ramener à la simple équivalence ; c'est alors que nous avons été amenés à distinguer deux types fondamentaux de substitution, à savoir :

1) Les substitutions « symétriques » telles que, étant donné deux substituables (morphèmes, syntagmes ou énoncés) A et B, le chemin condui- sant de A à B est identique à celui qui conduit de B à A, ce qui suppose une équivalence A = B de type dictionnaire ou un effet contextuel équivalent. Dans ce premier cas, A est contextuellement synonyme de B, ou bien il en est une métaphore adéquate (et réciproquement pour B à l'égard de A), dans le cas où cette équivalence est produite dans le processus lui-même, sans être référable à un effet de type dictionnaire.

2) Les substitutions « orientées », c'est-à-dire telles que le chemin de A à B n'est pas identique au chemin de B à A. Dans ce dernier cas, les substituables ne sont pas équivalents, mais l'on peut passer de l'un à l'autre, « déduire » l'un de l'autre. En d'autres termes, A et B sont dans une relation qu'on peut qualifier, à son niveau le plus général, de métonymique . L'exis- tence de ce « rapport non symétrique de déductibilité » entre A et B renvoie selon nous (cf. Haroche-Pêcheux, 1972, pp. 47-49) à la possibilité d'une syntagmatisation A + R + B (ou B + IV + A), où R (et R') renvoient à l'existence d'une relation syntaxique entre les deux éléments A et B. Ainsi, étant donné le résultat brut suivant {ibid. p. 47) :

A - une catastrophe se produit ,, . , , . ^ , '-¿A r ,, ouverture . de , , la porte r

. ^ B = , les personnes evitent '-¿A r

nous faisons Vhypothèse d'une syntagmatisation implicite entre A et B, du type : « c'est parce que une catastrophe se produit dès X que les personnes évitent X », dont on doit supposer selon nous qu'elle est formulée quelque part (pas nécessairement dans le corpus étudié), ce qui conduit à poser la question de ce qui, dans 1'« extérieur spécifique » d'un corpus donné, inter- vient sur les substitutions qui s'y produisent, pour les orienter 2. Le résultat est alors conventionnellement représenté ainsi :

A g l'ouverture de la porte.

1. Cf. Pêcheux 1969, pp. 35-38. 2. Dans l'article déjà cité, S. Fisher et E. Veron font allusion à cet exemple. A

ce propos, ils critiquent la représentation ci-dessus comme « laissant de côté l'apparition en surface de l'expression : « c'est parce que... que » trouvée dans la phrase ». (art. cit., p. 166). En somme, les auteurs ont distraitement pris cette connexion syntaxique hypothétique pour une phrase du corpus analysé , si bien qu'ils critiquent la segmentation syntaxique de cette phrase en deux éléments, segmentation qui n'a jamais eu lieu, et pour cause !

61

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 57: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

Tous ces points seront repris et développés dans un travail actuellement en cours de rédaction portant sur le rapport entre sémantique et processus discursif

Nous terminerons ce commentaire de la procédure actuelle de désyn- tagmatisation discursive en rappelant la signification de plusieurs « options » plus ou moins récemment introduites :

- la procédure dite de « compactage », qui permet de soumettre à l'analyse le corpus (A + B) après avoir effectué l'analyse distincte de A d'une part et de B d'autre part, et donc d'étudier systématiquement les différences entre les deux corpus, et en particulier de déterminer les domaines qui appartiennent spécifiquement à A d'une part et à B d'autre part, ceux qui résultent de l'agglomération de domaines de A et de B, ceux enfin qui sont produits par le compactage A + B ;

- la distinction entre les deux modalités de comparaison des RB (inter-discours seulement ou inter- et intra-discours) ouvre, semble-t-il, la voie à des recherches importantes pour la caractérisation de la répéti- tivité, de la stéréotypie d'un corpus, en étudiant dans quelle mesure il se reproduit partiellement lui-même. Il n'est pas exclu que cette probléma- tique ait un lien avec le discours de Vautre à l'intérieur même du discours du locuteur ;

- l'intégration des connecteurs dans le calcul de la distance entre deux relations binaires lève, nous l'avons dit, une difficulté souvent signalée. Il reste que le rapport entre les différents types de connecteurs n'a pas encore été étudié du point de vue de leur substituabilité ; une telle étude aurait éventuellement des effets en retour sur cette mesure, en permettant d'associer une valeur à chaque couple de connecteurs se trouvant en co-occurrence. Cela supposerait une table cartésienne des connecteurs, intégrant les valeurs pour chaque couple, les relations de compatibilité et de permutabilité (telles que Ea Ri Eb ->• Eb Rj Ea).

3.2. Critique de la procédure actuelle , sur la base des entrées EN-RB.

Nous reprendrons pour l'exposé de ces critiques le même plan que celui que nous avons suivi dans le précédent paragraphe, en mentionnant d'abord que, de manière générale, c'est le caractère relativement arbitraire des procédures effectuées qui a été le plus souvent critiqué. Dans leur récent article déjà cité, Borillo et Virbel remarquent que nombre d'opérations « sont considérées comme naturelles » alors qu'on pourrait les repérer à l'intérieur d'une famille d'opérations, ce qui obligerait à motiver le choix de telle ou telle opération. A. Trognon formule pour sa part la nature théorique de la déviation qu'il critique en parlant d'un mixte ď empirisme et de formalisme .

1. M. Pêcheux, 1975.

62

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 58: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

Disons clairement que le principe de ces critiques nous paraît pleine- ment valide, dans la mesure même où le travail de modélisation mathé- matique, permettant de repérer les points de « choix » dans la procédure, et de les motiver, n'a pas encore été effectué 1.

Examinons maintenant successivement les deux étapes de la procédure que nous avons exposée du point de vue des critiques qu'elles suscitent, en mentionnant, chaque fois que cela sera possible, la direction dans laquelle nous suggérons d'aller pour les éviter.

- Le problème de la valeur affectée à la comparaison entre deux RB.

Nous relèverons trois remarques d'importance variable qui ont été formulées sur ce point.

La première constatation consiste à remarquer que la définition même des « points de comparaison », présentée comme naturelle, est en fait assez arbitraire : il serait faux, en effet, de penser que cette procédure, sous prétexte qu'elle s'effectue point par point, envisage toutes les comparaisons possibles. Il n'en est rien, ainsi qu'on peut aisément s'en rendre compte par le cas de l'incise d'un énoncé dans une séquence , au sens que nous venons de donner à ce terme au paragraphe 3. Soit en effet le quadruplet :

Ea Eb K

Em En

Si l'on admet que les distances calculées sur ces composants conduisent à une valeur arithmétique supérieure au seuil, on voit que les séquences Ea K Eb et Em K En seront dans un même domaine. Supposons main- tenant que, à la place de la séquence Em K En, on ait la séquence Em K/ Ep K" En : on voit que Y interpolation de V énoncé Ep empêche la comparaison que nous avons posée au début comme conduisant à un résultat positif. Il apparaît pratiquement assez difficile de pallier cet inconvénient, si l'on ne pose pas en même temps des « heuristiques » permettant de limiter le champ d'extension de cette procédure consistant à « sauter » des énoncés dans la séquence, et donc à ne plus se contenter de comparer des relations binaires entre elles.

- La deuxième remarque critique est d'une plus grande portée immé- diate : elle consiste à relever le caractère à la fois empirique et arbitraire de la distance (quelle que soit par ailleurs sa zone d'application) : il s'agit du système de pondération (le « pattern » dans la terminologie des pro- grammes réalisés) par lequel on multiplie le vecteur booléen obtenu à l'issue de la comparaison colonne par colonne de deux énoncés. On peut dire qu'il s'agit là d'un double arbitraire , dans la mesure où ni linguistiquement, ni mathématiquement (d'un point de vue statistique) la signification du

1. Un travail sur ce point est actuellement en cours (cf. introduction, p. 4).

63

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 59: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

principe de cette pondération, et encore moins la signification des diffé- rences de « poids » entre les catégories du vecteur-énoncé, n'a été clairement définie. La question se pose en particulier de savoir si l'identité ou la non- identité entre deux « contenus » doit revêtir la même signification, quels que soient ces contenus 1 : il ne s'agit pas, bien entendu de revenir sur le principe même de l'AAD, qui, on le sait, interdit la constitution a priori de classes de morphèmes, de syntagmes ou d'énoncés, mais de s'interroger d'un point de vue linguistique sur la différence de fonctionnement, à cet égard, de ce qu'on appelle habituellement les « classes fermées », par oppo- sition aux « classes ouvertes » : dans le compte-rendu qu'elle fait dans « La Pensée » (n° 161, juin 70) de l'AAD 69, G. Provost-Chauveau commente cet aspect de la procédure en disant, à propos de la valeur attri- buée à chaque catégorie : « la détermination approximative de cette valeur fait appel (actuellement) aux notions de probabilité : ainsi Di qui est « choisi » dans un ensemble restreint de termes (articles, démonstratifs...) a la valeur 2, tandis que Ni où le choix des lexèmes s'effectue dans un ensemble beaucoup plus vaste a la valeur 5. En disant cela, G. Provost- Chauveau « dépassait notre pensée » telle que celle-ci s'exprimait dans AAD 69, où il n'était aucunement mention de probabilités, mais elle la dépassait dans la direction qu'il nous semble aujourd'hui utile de prendre , à condition de lever certaines ambiguïtés. Nous soumettons ainsi à la discussion l'idée suivante : plutôt que de traiter de manière homogène chaque co-occurrence quelle que soit la catégorie morpho-syntaxique où elle apparaît, ne conviendrait-il pas de distinguer deux traitements fon- damentalement différents de la co-occurrence, en fonction du caractère « fermé » ou « ouvert » de la catégorie où cette co-occurrence apparaît ? On pourrait, assez facilement semble-t-il, envisager pour l'ensemble des catégories DET (1 et 2), F, P et CONNECTEUR un traitement de la co-occurrence dans lequel tout couple d'éléments (y compris, bien entendu, le couple d'éléments identiques) serait muni a priori d'une valeur à intégrer dans le calcul général de la distance.

Quant aux « classes ouvertes » (essentiellement N, V et ADJ), on peut envisager soit de maintenir la procédure actuelle, soit d'instaurer un système à apprentissage dans lequel les substitutions déjà repérées seraient ré-injec- tées dans les données sous la forme d'un méta-terme prenant la place des deux substituables. Ainsi se constituerait progressivement un « auto- dictionnaire » enregistrant des équivalences de niveau n en vue d'en repérer d'autres au niveau n + 1. (On remarquera que cette suggestion, se rapproche beaucoup de la procédure harrissienne.) Ajoutons qu'il serait par ailleurs possible de combiner cette procédure avec la détermination a priori de « mots-clés » (à partir de mesures statistiques préalables) affectant la valeur accordée à leur co-occurrence.

1. Cf. les phénomènes d'homonymie, comme le cas de « comprendre » (contenir # saisir par la pensée), récemment mentionné dans le commentaire de résultats AAD (Michel Morin, 1973, p. III, 12).

64

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 60: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

- La troisième remarque dont nous avons à rendre compte porte sur l'utilisation qui est faite de la mesure de distance ainsi calculée : nous avons montré précédemment que cette étape revenait en définitive à asso- cier une valeur numérique à chacun des n(n -l)/2 points de comparaison. Or la question se pose de savoir si cette distribution des valeurs affectant les points de comparaison ne présente pas un intérêt au-delà de la simple opération de dichotomisation à laquelle son utilité se réduit actuellement. On sait en effet que la procédure s'effectue ici par tout ou rien : un point de comparaison est , ou non, enregistré dans le « tableau des quadruplets ». Ainsi est perdue une série d'informations qui permettraient de distribuer les quadruplets réalisés en fonction de la valeur de la « borne P alpha » (notée PAL dans la terminologie des programmes réalisés). Il n'est pas interdit de penser que l'étude d'une telle distribution, pour chaque corpus, pourrait fournir d'intéressantes informations à son sujet, y compris, peut- être une estimation de la valeur optimum de la borne P alpha pour le corpus considéré. Notons par ailleurs que cette distribution permettrait de sérier les substitutions selon qu'elles affectent un morphème (une seule catégorie comporte un 0), un syntagme ou un énoncé. Ceci pourrait présenter un grand intérêt pour la réalisation de l'algorithme « du contexte maximum », dont il sera fait mention plus loin. Ajoutons enfin, pour clore provisoirement cette question de la définition de la distance entre deux objets (nous nous plaçons toujours dans le cas où il s'agit de relations binaires), que l'on peut bien entendu envisager d'autres types de mesure que la moyenne arithmé- tique actuellement utilisée. A signaler d'autre part les travaux de Lerman 1 sur ces problèmes, et l'ensemble des méthodes de classification automatique, qui font toutes appel à une mesure de distance. Ce sera un des aspects de la modélisation mathématique dont nous parlions tout à l'heure que de situer les exigences spécifiques de l'analyse AAD à l'intérieur de la famille des solutions formellement possibles.

- Le problème de la construction des domaines .

La question à nos yeux centrale a été abordée de manière indépen- dante par G. Provost-Chauveau et par A. Trognon. Elle concerne la référence à la sémantique qui est impliquée par l'expression de « domaines sémantiques ». G. Provost-Chauveau pose la question de savoir s'il est justifié ou non de poser que « les substitutions ne changent pas le sens » ce qui n'est 'pas sans désigner le lien entre notre problématique et celle de la paraphrase dans le cadre d'une théorie transformationnelle ; A. Trognon, quant à lui, met en question l'affirmation de AAD 69 selon laquelle « deux séquences appartenant à un même domaine ont une interprétation séman- tique identique ». Sans avoir l'expérience des résultats, dans lesquels nous avons effectivement constaté des rapprochements incongrus et des artefacts

1. I. Lerman (1970).

65 langages n° 37 5

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 61: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

dus au caractère formel (formaliste) de notre procédure, A. Trognon avait en son temps pressenti la difficulté. Faut-il aller jusqu'à dire que les rapports mis en jeu ne concernent que la proximité phrastique, à l'exclusion de tout « effet de sens » ? Nous pensons en fait aujourd'hui que la question est plus complexe, dans la mesure où il convient de discerner les purs arte- facts syntaxiques qui seraient en principe éliminables par une correction de l'analyse syntaxique et/ou une modification du système de pondération qui a fourni la co-occurrence contenant cet artefact, et les phénomènes sémantiques de substitution, lesquels ainsi que nous avons déjà eu l'occa- sion de le dire, ne se réduisent pas, en tout état de cause, à une « identité de l'interprétation sémantique » : nous avons en effet distingué deux types de fonctionnements qui méritent, à notre sens, tout autant l'un que l'autre d'être qualifiés de sémantiques, à savoir la relation de substitution-équi- valence d'une part, qui renvoie à la stabilité logique d'un système formel méta-linguistique, et la substitution-orientée d'autre part, qui, si l'on nous a bien compris, constituerait la condition de possibilité d'une équivalence ultérieure, ou si l'on veut, une équivalence « à l'état naissant ». Gela revien- drait à dire que l'équivalence résulte de la disparition, oubli ou effacement d'une orientation, ce qui ferait de la paraphrase logique (sauvegardant le sens) un cas particulier du fonctionnement des effets de sens. En d'autres termes encore, nous dirons que toute métonymie (liée à une orientation syntagmatique) tend à se « dégrader » en synonymie, par effacement de la syntagmatisation, ce qui n'exclut évidemment pas que des synonymies (ou des métaphores) soient à nouveau « suturées » par de nouvelles relations syntagmatiques.

Nous considérons dans ces conditions que la difficulté principale vient non pas de la nécessité de justifier ici l'usage du terme de sémantique, mais du fait que ces deux types de relations ne sont pas dans l'état actuel de la procédure produits par un algorithme automatisable, ainsi qu'on le voit clairement sur les deux schémas ci-contre :

Indiquons toutefois que la réalisation d'un tel algorithme implique deux conditions :

- tout d'abord, il est nécessaire que les zones de substitution soient identifiées par une procédure automatique, ce qui n'est actuellement pas le cas,

- d'autre part, l'orientation doit être définie par le repérage de syntagmatisations, attestées dans d'autres domaines appartenant aux résultats, ou dans le corpus des données, ou même dans 1'« inter-discours » du corpus ou du système de corpus étudié.

Nous n'en dirons pas davantage sur cette dernière condition, faute d'éléments permettant d'aborder ce problème. Nous donnerons par contre quelques précisions sur la première condition énoncée :

Soit en effet un « domaine sémantique » tel que le programme actuel est capable de le calculer : on peut le considérer comme une liste de séquences

66

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 62: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

eq -53 a a> g C/3 r tj C/3 « 2 r H ë s C $ S £ W « s C rj W +J .%o> '¿.H 0) g «PH 0 '¿.H 0) «PH ^ *-< ^ WW c/> o C/3 +7 4-> Cfl HH +7 ^ CJ •S g 3S g

w „ <i £ o %

la w S3 3

„ <i £ o % §§

^ £ S £ W ^ £ 5® 8 MU p S ^ £ £ W > ^ £ 3 "£ S3 M W S g S a w

> S £.1

3 â S3 M

a Q W ••S'ö g

Ä" PQ PC PC PQ 'S ^ ta -

f ^ 3 2 3 2 § s e «w «

2 ^ 7! M W co g M W W W S H H ^ S Q Û Q Q 'S

j td J ti § -Q Q, ö j td J ti -Q ^ ^ ^ ^ jg O mg S s wwwwc-s £ £ a 5 ££££, c3 oO 1. 2

££££, 2 2 2 ' I" tí

oO 2S

S tí «os -s

! ££££ §| I 3 < < < <¡ o o a; o ■3 &«&«&«& Ö W W W W g S - Š PC PC PC PC ^ ^ ► Q rsj C'| u- CCÄDSÄ rsj o> a> S § OOOO HH--0 g oooo WW ^ I §§88

«gwg|| I § § i S d § S g 1 ¡1 ~ SJEJS-sÍ , o o oí o) wMonW-S § §, 1 W wMonW-S

¡o h « h £ s o? »3 •S W S « g P Oh^CL,'-«.« g

¡o h Z g

« h Z s £ o? »3 •S S PQ P P Oh^CL,'-«.« 3 <¡ W W ^ 1 ^ 0 <¡ S W T T ri ^

a H T H T S ri -i - »■ u ID a d R to ř-i 2 aWW§ J • E-> • •S M S S ^ « « 1 ® «> ® «. ® • •§ a] fl A ct « *> go PC D W

j WW g ^ j ^ ^ ^ WW

H ° § w W W W £ H ^ ZZZZ SswK

..2222 £ w s u žgEĚĚ .si w 2 z z S ! g g w 3 ^ pL, Ph Ph Ph -a 3 ^ § Ë ^ W W W W -a * ^ ¡Í n 2 | PC PC PC PC §

* X W O u f £ PC PC £ ! SI la Ä PC £ b oooo £ g OOOO g g £ b OOOO o OOOO g- OOOO oooo g*

o OOOO © OOOO o © © Ç OOOO (M ^ OOOO ij T^th^-ho m t S? ]EÎ » 23 Ì2 £ ij

I S T^th^-ho

g S? S; £ m

| t ç S? ]EÎ » s 23 s Ì2

67

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 63: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

de même longueur, supposées présenter entre elles des rapports de substi- tution ; la première opération à effectuer est de reconstituer ces zones de substitution (ou, mieux, d'éviter la perte d'information qui se produit au moment de la dichotomisation de l'ensemble des « quadruplets pos- sibles »). Pour cela, il semble utile de définir le « contexte maximum » d'un domaine comme l'ensemble des n éléments appartenant à au moins deux séquences d'un même domaine et placés dans la même position, tel que n soit maximum pour le domaine considéré. Le complémentaire de ce contexte maximum, c'est, pour le domaine considéré, une zone de commu- tation contenant au minimum deux éléments.

L'algorithme envisagé consiste, dans le cas où le contexte maximum est unique, à remplacer par un méta-terme indicié la zone de commutation, à considérer les séquences (au moins deux) comme une seule, et à réeffectuer l'algorithme. Dans le cas où plusieurs contextes maxima apparaîtraient simultanément, on conviendra d'effectuer l'union des résultats successive- ment obtenus ainsi déterminés. Il va de soi que, comme nous l'indiquions plus haut, l'information produite lors du calcul des distances dont l'ensemble des points de comparaison est muni contribuerait sans doute largement à la réalisation pratique de cet algorithme, qui fournirait ainsi les questions pertinentes servant de base à la recherche des relations de syntagmatisa- tion, qui constitue ce que nous avons appelé ici la deuxième condition 1.

- les autres remarques concernant la construction des domaines portent en général soit sur la validité statistique des résultats obtenus, soit sur leur présentation .

Pour ce qui est de la validité statistique des résultats obtenus sous la forme de domaines et de relations entre domaines, nous nous contenterons de rappeler que le principe de l'AAD est, pris en lui-même, extérieur à toute considération statistique. Gela n'exclut cependant pas que soient effectuées certaines investigations statistiques, dont nous mentionnerons rapidement les plus utiles.

1) Sur les données sous leur forme EN, RB • calcul de la fréquence relative des items lexicaux dans chaque

catégorie morphosyntaxique des énoncés, y compris la « forme de l'énoncé ». • repérage des couples Nx X N2 sur une matrice d'incidence. • analyse de la structure du graphe : fréquence relative des connec-

teurs, des relations de saturation, longueur moyenne et complexité des séquences latérales et de la séquence centrale.

Cette investigation devrait, selon nous, être effectuée dans la double perspective de la définition des propriétés statistiques communes à tout corpus et de propriétés différentielles entre corpus.

1. Soulignons par ailleurs le rapport évident entre l'algori thme du contexte maxi- mum et la procédure dite de « ré-injection » évoquée p. 64.

68

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 64: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

D'autre part, il apparaîtrait opportun d'examiner les rapprochements éventuels entre ces résultats et ceux qui peuvent être effectués sur un corpus de discours dans leur état « naturel ».

2) Sur les résultats obtenus par le traitement A AD.

En rapportant les résultats au nombre d'énoncés, de relations et de discours nous proposons d'étudier :

- la distribution des valeurs de distance paradigmatique, en fonction de la borne Pa et du pattern, la densité (rapport du nombre de quadruplets retenus sur le nombre de quadruplets possibles),

- le nombre de quadruplets, chaînes et domaines, - la structure des domaines (nombre de discours intervenant dans

leur constitution, discours « facultatifs », i. e. n'intervenant dans aucun domaine) et la structure des dépendances entre domaines.

3) Signalons enfin que la confrontation de caractéristiques d'un corpus (sous sa forme « naturelle » et comme ensemble d'objets discursifs) avec les caractéristiques des résultats obtenus par le traitement peut conduire à la construction d'une procédure ď évaluation préalable permettant de «prédire» si un traitement AAD est ou non applicable à un corpus donné. En ce qui concerne, enfin, la présentation des résultats, il semble que la principale critique porte sur le « tableau des relations entre les domaines » qui nécessite un travail manuel ultérieur assez aisément automatisable, puisqu'il consiste à regrouper les domaines liés entre eux par des intersections ou des inclusions en « hyper-domaines », et à reconstituer le graphe représentant les chemi- nements entre domaines et hyperdomaines appartenant au corpus. Il est à noter que l'une des conséquences théoriques de la constitution des hyper- domaines serait de permettre le regroupement de séquences de longueur inégale, ce qui pourrait éventuellement conduire à renouveler la probléma- tique de la substitution.

3.3. Vers une transformation des entrées de la phase 3.

A l'issue de cet examen, il nous paraît souhaitable de revenir un instant sur la question générale du rapport entre la phase 2 et la phase 3 : rappelons que ce rapport s'articule autour d'une double exigence, à savoir (cf. p. 33-34) que la représentation de la surface linguistique doit

1) restituer la non-linéarité des structures syntaxiques, et d'une manière générale présenter les garanties de stabilité et de cohérence que nous avons exposées antérieurement,

2) autoriser par sa structure l'effectuation d'un calcul de comparaison- reconstruction du type de celui que nous venons de considérer dans la phase 3.

Or il semble que la représentation actuellement utilisée, et que nous désignerons par « représentation EN-RB », présente le grave défaut de ne

69

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 65: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

pas respecter pleinement la première condition tout en se chargeant d'exi- gences qui ne sont en fait pas imposées par la deuxième condition : en d'autres termes, il ne semble pas que cette 2e condition impose la transfor- mation de la forme « combinatoire » (cf. p. 39) du graphe en sa forme « EN- RB» ; par contre, il semble bien que, comme le remarque M. Dupraz (1974), la représentation actuellement entrée en données pour la phase 3 ne garde pas la trace des rapports de hiérarchie structurale entre les énoncés, ce qui pourrait en effet expliquer l'apparition d'un certain type d'artefact caractérisé par l'hétérogénéité du niveau structural des énoncés constituant les « séquences » d'un domaine. Dans cette perspective, deux solutions étalées dans le temps nous paraissent envisageables : à relativement court terme, il semble possible de tenter d'améliorer la représentation « EN-RB » de manière à ce que les connecteurs intègrent les relations de parenthésage existant entre les énoncés.

A plus long terme, l'objectif serait de transformer la phase 3 de manière à permettre le traitement des graphes (sous leur forme combinatoire), ce qui serait en fait le prélude à des changements plus radicaux encore, dans la mesure où il s'agirait de comparer entre elles des structures conte- nant des « lexis ».

Conclusion

Dans son compte-rendu déjà cité, G. Provost-Chauveau relève à juste titre qu'une des conditions pour que notre entreprise ait un sens est qu'il soit « possible, dans un contexte donné, d'opérer certaines substi- tutions entre deux termes x et y sans changer « l'interprétation sémantique » de l'énoncé » (art. cit., pp. 136-137).

Nous partirons de cette remarque pour aborder les problèmes théo- riques que soulève actuellement la phase dite « d'interprétation des résul- tats » dans laquelle, comme nous avons déjà eu l'occasion de le signaler, les différents types de substitution existant entre les séquences d'un même domaine sont reconstruits par l'analyste. Pour désigner toute la portée de ce problème, autour duquel se joue en fait la validité et les possibilités de développement théorique ultérieur de l'analyse du discours dans cette voie, nous reviendrons un instant sur le présupposé qui était le nôtre lors de la rédaction de AAD 69, afin de liquider pour nous mêmes et, pensons- nous, aussi pour le lecteur, une illusion concernant la structure des processus sémantiques. L'idée centrale du texte que nous évoquons était, sur ce point, que « les substitutions ne changent pas le sens », à condition d'assurer une identité minimum de contexte. En ce sens, nous pensions aller jusqu'au bout des possibilités ouvertes par le travail de Harris, en fournissant une interprétation plus stricte des « classes d'équivalence » qu'il introduit dans sa procédure d'analyse, et à propos desquelles il reste étrangement vague : « Les résultats formels obtenus par ce genre d'analyse font plus que définir

70

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 66: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

la distribution des classes, la structure des segments ou même la distribution des types de segments. Ils peuvent aussi révéler des particularités à l'intérieur de la structure, par rapport au reste de la structure. Ils peuvent montrer en quoi certaines structures ressemblent à d'autres, et en quoi elles en diffèrent. Ils peuvent conduire à de nombreuses conclusions concernant le texte.

Tout ceci cependant est encore distinct de V interprétation des résultats (ici c'est Harris qui souligne), qui doit tenir compte du sens des morphèmes et poser la question de savoir ce que l'auteur voulait faire quand il a écrit ce texte. Cette interprétation est bien entendu tout à fait distincte des résul- tats formels , bien qu'elle puisse les suivre étroitement dans les voies quHls ouvrent ». (Harris, 1969, pp. 43-44. Sauf indication contraire, c'est nous qui soulignons.)

Or nous avions pensé que, l'identité du contexte étant assurée non seulement par la construction du matériel dans la mesure où celle-ci impo- sait une répétition du texte sous la forme d'un corpus homogène quant à ses conditions de production, mais également par les dispositions internes de comparaison entre les éléments du corpus, nous pouvions lever la réticence que manifeste ici Harris, réticence qui s'accompagne évidemment d'un abandon à une sorte de sémantique intuitive du sujet parlant et de ses intentions (ce que l'auteur voulait faire...) que nous critiquions et que nous continuons à critiquer radicalement. En parlant de réticence, nous voulons dire que tout conduit, selon-nous, Harris à poser que les « résultats for- mels » qu'il obtient constituent en vérité tout ce qu'une analyse non-sub- jective est capable de fournir, sous réserves d'éventuelles réélaborations tout aussi « formelles » que les précédentes. Et, de fait, nous continuons à penser que, entre ce que D. Leeman (1973) appelle une « sémantique forte » qui serait « l'étude des relations entre les énoncés et la réalité extra- linguistique » d'une part, et une « sémantique faible » caractérisée par le fait qu'elle « renvoie à une équivalence entre les énoncés, sans que l'on se pose la question de savoir ce que signifient ces deux énoncés » la solution correcte est à rechercher dans la deuxième direction. Si l'on ajoute enfin que, comme le remarque également D. Leemaň, la paraphrase est un « concept fondamental de la sémantique faible » (p. 85, loc. cit.), on peut dire que la « réticence » de Harris consiste dans le fait qu'il hésite à relier directement paraphrase , substituabilité et synonymie. Ce lien, quant à nous, nous semblait devoir être inévitablement posé pour aller jusqu'au bout des intuitions linguistiques et logiques de Harris, caractérisées avant tout par le refus de toute analyse extra-linguistique du « sens » : ce lien nous a en fait conduit en 1969 à l'idée de V invariant propositionnel sous -

jacent à une famille paraphr astique, dans une perspective qui, pour des motifs théoriques fort éloignés des siens, recoupe celle de Paul Gochet, (1972). Notre objectif 1 était bien, en effet, d'atteindre, par la procédure

1. Dans cette mesure, la perspective que nous avons tenté de développer est, à certains égards, voisine de celle de I. A. Mel'Cuk, en particulier sur la question de la paraphrase et du rapport entre sens et texte, dans Zolkovskij-Mel'Guk (1971).

71

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 67: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

d'analyse proposée, à ces « nexus sémantiques » qui constituent le contenu commun à un ensemble de propositions et qu'on peut encore appeler « pro- position de base » 1.

Dans cette perspective, que nous pensons nécessaire d'exposer avec quelque détail, ne serait-ce que parce qu'il n'est pas actuellement possible de déterminer si elle n'a pas, dans certaines limites, sa validité, l'aboutisse- ment de l'analyse serait dès lors un graphe connexe non-valué dont les nœuds seraient constitués par des « propositions de base » : à partir de ce moment, on serait en fait ramené à un problème de logique formelle, qui pourrait être formulé comme suit : étant donné un graphe reliant entre elles des « propositions de base », l'ensemble étant associé à un corpus dis- cursif déterminé, définir les règles permettant

1) de construire, à partir d'un lexique de prédicats et d'arguments, l'ensemble des propositions de base, et elles seules,

2) de construire le graphe reliant entre elles les propositions de base ainsi définies. Un tel système de règles constituerait en réalité ce qu'on pourrait à bon droit appeler le « processus de production » du discours correspondant au corpus analysé.

Sans abandonner complètement cette perspective (nous verrons tout à l'heure pourquoi, cf. p. 77), il nous paraît nécessaire de faire deux remarques : la première réside dans une simple constatation, dont le caractère de généralité ne peut, comme tel, être garanti : il s'agit du fait, déjà signalé, que les « domaines sémantiques » effectivement obtenus par la procédure AAD ne se réduisent pas à une famille d'énoncés inter-paraphrasables par une seule et même proposition de base, de sorte que nous avons été amenés à distinguer deux types de relations de substitution (cf. ici même p. 61). La deuxième remarque prend appui sur la première, et tente d'en saisir les causes à partir de la distinction entre sémantiques « forte » et « faible », en mettant en évidence le fait que, prenant son départ dans une « sémantique faible », notre perspective tentait en réalité de reconstituer, à partir de ce point, les éléments d'une « sémantique forte » : on remarquera en effet que l'idée d'une correspondance entre un invariant (la proposition de base) et une série de variations le représentant est homologue à la distinction entre « structure profonde » et « structure de surface », ces deux distinctions se fondant d'ailleurs sur une troisième qui les englobe, à savoir la distinction

1. Soit par exemple le domaine sémantique suivant : X I donner I

I assurer | un minimum vital l'Etat assure

On peut, dans ce cas particulier, lui faire correspondre la proposition : H (A, B)

avec R = donner, assurer, ... A = X, l'Etat, ... B = minimum vital, ...

72

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 68: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

entre « information objective », dénotation, domaine auquel s'appliquent les valeurs de vérité etc... d'une part, et caractère subjectif du message, connotations, domaine de 1'« expression » d'autre part. (On remarquera au passage que cette distinction permet également d'assurer la théorie rhétorique de 1'« écart à la norme », qui devient, dans une « sémantique faible », l'écart par rapport à l'invariant.) A l'encontre de ce que nous avions pourtant posé dès le début, à savoir que la métaphore est première et cons- titutive, et non pas seconde et dérivée, une telle perspective, abandonnée à elle-même, aboutit nécessairement à reléguer le fonctionnement de la métaphore dans la catégorie des « phénomènes de surface » qui accompagnent le sens, ce qui présuppose que celui-ci est déjà constitué 1. A la limite, la question se pose de savoir si une telle « sémantique faible », menée jusqu'au bout dans cette perspective, est encore discernable d'une « sémantique forte » : le système d'oppositions que nous venons de rappeler suppose en effet fondamentalement que le sens existe comme un objet , de sorte que la stabilité de l'objet (objet réel ou objet-référent) est première, et que les proces- sus sont à concevoir comme des objets mis en mouvement, déplacés à travers la représentation qui en est donnée.

Que si, tout au contraire, on accepte la thèse matérialiste selon laquelle les « objets » ne sont pas des invariants premiers, mais des points de stabi- lisation de processus, on voit alors que la perspective se modifie nota- blement, en particulier en ce qui concerne le principe selon lequel « les substitutions ne changent pas le sens ». Pas plus que le principe correspon- dant appliqué aux transformations (« les transformations ne changent pas le sens »), il apparaît que ce principe ne peut être valablement posé dans V universel : son exercice suppose en fait un champ plus vaste dans lequel rien ne garantit a priori que les substitutions et les transformations ne changent pas le sens.

Ceci nous conduit évidemment à préciser à nouveau ce qu'il convient d'entendre par « paraphrase », en reliant ce concept à celui de substitution et de synonymie d'une part, et à celui de transformation (linguistique) d'autre part.

Dans le travail déjà cité, D. Leeman retrace l'évolution des conceptions de Harris et la résume ainsi : « on a donc dans un premier temps un ensemble non-ordonné de transformations définies en termes de co-oc- currences et toutes paraphrastiques, sans que le terme de paraphrase

1. La question de la métaphore et de l'effet métaphorique (cf. Pêcheux, 1969, p. 29) est à notre sens décisive : en disant que la métaphore est première et non dérivée , nous ne voulons pas renverser le rapport entre sens propre (noyau de sens, dénotation, fondement de la proposition logique) et sens figuré (périphérie du sens, manière de parler, connotation et ressort du « style »), en laissant entendre que tout sens est figuré et périphérique, ce qu'invite à croire la perspective des « lectures plurielles ». Il s'agit au contraire de liquider le couple noyau/périphérie lui-même, en considérant la méta- phore comme le transport entre deux signifiants, constitutif de leur sens, et l'orientation inégalisante de ce rapport comme la condition d'apparition de ce qui, dans chaque cas, pourra fonctionner comme « sens propre » ou comme « sens figuré ».

73

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 69: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

n'apparaisse... (dans un deuxième temps) on aboutit à deux types d'opé- rateurs, ayant chacun des caractéristiques descriptibles dans la grammaire : les opérateurs incrémentiels et les opérateurs paraphrastiques » (Leeman, 1973, p. 42).

La caractéristique des transformations paraphrastiques , c'est « qu'elles ne déterminent en général aucun changement de sens sur leur opérande, (qu') elles n'apportent pas d'information supplémentaire sur leur opérande » (ibid. p. 43).

Le second type de transformations se caractérise au contraire par ce qu'elles « apportent une certaine information de sorte qu'elles peuvent pour cette raison être interprétées comme étant prédicatives » (ibid. p. 51). Nous pensons que cette distinction correspond, dans une formulation qui n'est pas cependant dépourvue d'ambiguïté, à la distinction introduite plus haut entre substitution-équivalence et substitution « orientée ». Si nous parlons d'ambiguïté à propos de la formulation de Harris, c'est parce qu'elle n'est pas sans rappeler les présupposés de la « sémantique forte », la distinction entre objectif et subjectif en particulier, et ses consé- quences linguistiques sous la forme de la distinction langue/parole ; c'est-à- dire comme on le sait, la distinction entre un système et des actes qui, tout à la fois, lui préexistent, le constituent et se « perdent en lui ». On jugera de la pertinence de ce rapprochement à la lumière du texte ci-dessous :

« La différence entre le système incrémentiel et le système de T para- phrastiques est en gros comparable à celle entre les activités directes de la vie et l'appareil institutionnel qui les canalise. Comme les institutions sociales, la structure du système de T facilite, infléchit et pétrifie les activités entrant dans l'usage du système /I/, et ce système est inflexible, conventionnel et en partie historiquement accidentel... » (Z. S. Harris, ibid., p. 68). Dans ces conditions, dira-t-on, il ne semble pas que l'acquis soit appréciable, puisque la nouvelle distinction nous reconduit aux présupposés auxquels nous voulions échapper. Nous nous proposons de montrer qu'en fait cette distinction ouvre la voie à une conception nouvelle plus conforme aux requisits théoriques que nous avons formulés, mais à la condition de dis- tinguer non pas deux , mais trois types de transformations , tel que le troisième type soit susceptible de s"* absorber dans les deux autres , à certaines conditions que nous allons préciser.

Nous distinguerons donc pour notre part trois types de transformations (ou relations entre couples de séquences) :

1) Les transformations à unités lexicales constantes. La recherche linguistique actuelle repose pour une grande part sur l'hypothèse de telles transformations (Par exemple : « Les Romains ont décidé de détruire Car- thage » -> « La destruction de Carthage a été décidée par les Romains »). Il s'agit de ce qu'on pourrait appeler des transformations syntaxiques pures, des transformations-substitutions qui ne changeraient en principe pas le sens dans la mesure où elles constitueraient des conversions d'une

74

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 70: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

séquence de phonèmes en une autre. Nous conservons cette désignation, au moins à titre de cas-limite, en restant circonspects sur le fond de cette hypothèse, (qui repose en définitive sur un présupposé logiciste par l'inter- médiaire de l'opposition compétence/performance nécessairement liée à cette conception) quant à sa compatibilité avec une conception de l'énon- ciation telle que celle qui a été esquissée plus haut.

2) Les transformations-substitutions qui « changent le sens », dans la mesure où il est impossible de considérer les substituables comme équiva- lents : il s'agit des substitutions que nous avons appelées « orientées », c'est-à-dire avec changement lexical et mettant en jeu une relation de syntagmatisation entre les commutables. Elles correspondent aux trans- formations « incrémentielles » de Harris.

3) Enfin, et c'est à nos yeux ce qui constitue le point décisif, nous proposons d'introduire un troisième type de relation, à savoir la substitution non-orientée avec changements lexicaux. Il s'agit de la relation de synony- mie, , dont D. Leeman souligne qu'elle est « une relation d'équivalence entre phrases, différente de la relation transformationnelle : la constatation de la similitude sémantique est immédiate et non empirique ; autrement dit, on n'a pas trouvé le moyen linguistique de dériver la synonymie d'une opération linguistique» (loc. cit. p. 49). Nous avancerons l'hypothèse que les difficultés soulevées par l'analyse linguistique de la synonymie proviennent du fait que celle-ci est pensée en référence à la première catégorie de trans- formations (celle des paraphrases « syntaxiques »), comme une équivalence atténuée, et non pas en référence à la deuxième catégorie, parce qu'elle semble antithétique de la notion même de synonymie. C'est pourtant dans cette perspective, qui conçoit la synonymie comme un effacement de V orien- tation (et non pas comme une extension lexicale de l'équivalence syntaxique) qu'il nous paraît fécond d'orienter les recherches.

Si nous revenons désormais aux problèmes concrets soulevés par l'interprétation des domaines sémantiques produits par l'analyse AAD, nous pouvons dire, à la lueur de ce qui précède, que le problème le plus urgent est celui des critères permettant de repérer les « orientations » entre commutables : on sait que le principe de ce repérage consiste dans la recherche de constructions reliant les commutables par une syntagma- tisation en quelque sorte perpendiculaire à l'axe des séquences en commu- tation ; il est d'ailleurs à noter que ces constructions peuvent recouvrir aussi bien des enchaînements temporels de type narratif que des relations logiques, telle que la déductibilité. Il reste que la réalisation concrète de ce repérage se heurte à l'obstacle des frontières du corpus : rien ne prouve, et toutes les recherches sur la présupposition semblent bien prouver le contraire, que le type d'information que nous cherchons ainsi à repérer soit diseur sivement homogène à la zone dans laquelle s'établissent les commu- tations. Cette question nous reconduit ainsi à un problème théorique, qui est celui du rapport d'un processus discursif avec « l'inter-discours »,

75

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 71: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

c'est-à-dire l'ensemble des autres processus qui interviennent sur lui pour le constituer (en lui fournissant ses « préconstruits » *) et pour « l'orienter » (en jouant par rapport à lui le rôle de discours transverse, ou, comme nous disions à l'instant, perpendiculaire).

Cette question renvoie directement, on le voit, à la problématique des deux oublis que nous avions présentée en commençant ce travail : on voit en effet que ce que nous avons désigné comme « oubli n° 2 », analogiquement référé au PCS-CS, et qui concerne le point d'articulation de la linguistique et de la théorie du discours, correspond avant tout au fonctionnement des paraphrases « syntaxiques » et des synonymies linguistiquement « natu» relies », c'est-à-dire dont l'orientation a été l'objet d'un effacement. Tout le système de l' auto-paraphrase qui conduit tout discours à s'expliciter en séparant ce qui pourrait être dit de ce qui est consciemment rejeté, c'est-à-dire, en grande partie, la présence de l'autre, avec un a, dans le discours du locuteur renvoie donc aux transformations-substitutions de type 1) et 3).

Quant à la relation de type 2), il n'est pas exclu qu'elle renvoie en partie, elle aussi, à 1'« oubli n° 2 », dans l'exacte mesure où le locuteur lui-même est capable de convoquer les processus discursifs permettant d'orienter les substitutions. En définitive donc, ce que nous avons appelé 1'« oubli n° 1 » se caractériserait par V inaccessibilité pour le locuteur-sujet des processus constituant les discours transverses et les préconstruits de son propre discours , autrement dit, ce que désigne l'expression déjà introduite (cf. p. 21) de « discours de l'Autre » (avec un A) 2. Dans ces conditions, on

1. Sur ces points voir le travail de P. Henry (1974) et Pêcheux (1975). 2. Les « actes du sujet parlant », dans une « situation » et en présence d « inter-

locuteurs » donnés - c'est-à-dire l'illusion subjective que certaines théories de l'énon- ciation prennent, on l'a vu, pour argent comptant - sont donc en réalité l'effet de rap- ports entre processus discursifs . En particulier, le fait que telle séquence (phonique ou graphique) matériellement spécifiée - et non pas telle autre - soit à chaque instant « filtrée », « sélectionnée », n'est nullement le résultat d'un choix du locuteur , mais traduit l'intervention, dans une formation discursive donnée (avec ses fonctionnements para- phrastiques propres), d'autres formations qui inégalisent les uns par rapport aux autres les éléments entrant en jeu dans ces fonctionnements, et donc les ordonnent de telle sorte que l'un d'entre eux reçoive à chaque instant le « privilège » d'apparaître comme le mot, l'expression etc... « justes ». Dans le domaine de ce qu'il est convenu d'appeler la littérature, ce « privilège » prend la forme de l'évidente impossibilité de paraphraser le texte « génial » (c'est-à-dire « on ne pouvait pas le dire autrement »). Ce point, que nous ne pouvons ici qu'esquisser, nous semble de nature à renverser la problématique du « sens propre » conçu comme un lien naturel entre « le langage et la pensée », et, par voie de conséquence, à remettre en cause les théories littéraires du style conçu comme écart : ce qu'on désigne habituellement comme le caractère unique de la séquence littéraire (l'irremplaçabilité des mots, expressions et tournures), où l'on croit souvent discerner la volonté, plus ou moins « géniale » dans son unicité, d'un écart tenu (c'est-à- dire prolongé, comme on parle d'une note tenue) serait, dans ces conditions, le produit surdéterminé du rapport contradictoire et inégal entre des formations discursives : la matérialité phonologique et morpho-syntaxique de la séquence (le Signifiant) serait dès lors déterminée comme unique parmi les multiplicités paraphrastiques qui en sup- portent « le sens », de la même manière que l'existence d'un jeu de mots impose dans sa littéralité telle formulation (et non telle ou telle paraphrase logiquement équivalente) pour que le « compromis » entre deux formations discursives soit maintenu, c'est-à-dire pour que soit réalisé ce que nous désignons ici comme une surdétermination.

76

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 72: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

peut aisément faire l'hypothèse que les domaines sémantiques actuellement identifiés par la procédure AAD ne sont pas homogènes eu égard à la distinc- tion entre les deux « oublis » ; la question reste par ailleurs ouverte de savoir si cette mixité n'est pas redoublée par une autre hétérogénéité, due à la non-dissociation de processus combinés.

Toutefois, en l'état actuel des sorties, la comparaison dans un plan de traitement de résultats issus de corpus différents devrait ne pas être effectuée de la même manière selon que la différence entre les corpus relève de manière dominante soit de la zone d'oubli n° 1, soit au contraire de la zone d'oubli n° 2.

Finalement, la question des critères permettant de repérer l'autonomie d'un processus, et les frontières de cette autonomie, reste elle aussi non- résolue : tant que cette question n'aura pas trouvé sa solution, l'incertitude subsistera sur le rapport possible entre substitutions orientées et combinaison de processus ; nous n'abandonnons en effet pas l'idée selon laquelle l'orien- tation serait à concevoir comme l'effet de l'articulation entre processus différents, avec des rapports d'effacement, de subordination et d'asser- vissement : dans cette dernière hypothèse, l'autonomie d'un processus se marquerait bien, en définitive, par l'existence de familles inter-para- phrastiques où toute « orientation » est effacée et la nature des résultats actuellement obtenus proviendrait du fait que nous ne sommes pas encore parvenus à isoler un processus ; dans ces conditions, on pourrait penser obtenir ce résultat en augmentant, peut-être assez considérablement, la dimension du corpus (qui serait actuellement en dessous de la « masse critique »), et en élevant la borne P alpha , qui fixe la proximité minimum retenue entre les séquences comparées.

Nous reviendrons pour terminer sur le problème du rapport entre sémantique et syntaxe, qui est en réalité le fond même de tout le débat critique dont nous avons retracé les axes principaux : il semble que l'on puisse actuellement formuler trois hypothèses sur cette question.

A) TV' appartient à la linguistique que le domaine des faits de syntaxe (en prolongement de la phonologie et de la morphologie), qui renvoie à des fonctionnements calculables ; la sémantique au contraire relève du domaine subjectif du sens. Cette hypothèse repose à l'origine sur un postulat d'indépendance de la syntaxe par rapport à la sémantique, elle s'inscrit dans la ligne du structuralisme qui vise à caractériser un système de formes. Cette solution a été adoptée à la fois par le behaviourisme et par les théori- ciens du distributionnalisme et du fonctionnalisme. C'est également le point de vue qui fut adopté initialement par Chomsky dans Structures syntaxiques.

B) La sémantique appartient tout entière au champ de la linguistique . Cette seconde hypothèse est, paradoxalement, héritière de la première. L'étude de la sémantique apparaît comme prolongement naturel des faits

77

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 73: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

de syntaxe, elle vise à les expliquer (les méthodes distributionnalistes ayant montré leurs limites). C'est là, entre autres, la position de Chomsky dans Aspects , où la composante sémantique vient interpréter la syntaxe. Il est à remarquer que l'intégration de la sémantique dans ce modèle du langage se fait à partir d'un postulat en grande partie implicite selon lequel le sens est un fait de langue ; du point de vue méthodologique, la procédure d'ana- lyse sémantique des unités est comparable à celle utilisée par la phonologie (décomposition en traits, cf. Katz et Fodor). Cette solution repose sur une théorie qui est à la fois une « théorie de la connaissance » et une psychologie du sujet humain - une construction du monde référé à un sujet neutre et idéal.

Malgré le ton polémique qu'a revêtu la discussion entre Chomsky et les tenants de la sémantique générative, ce second courant s'apparente lui aussi à l'hypothèse B) présentée ici : en dernier ressort, tout ce qui est sémantique relève d'une étude linguistique, même si, contrairement à Chomsky, la sémantique n'est pas dissociée de la syntaxe (cf. les struc- tures sous-jacentes « logico-sémantico-syntaxiques ») et si certains des phénomènes sémantiques (par exemple les « présupposés ») sont traités dans le cadre d'une « théorie des mondes » qui vise à faire éclater l'unicité du sujet. Pourtant ces sujets sont encore des sujets neutres, sources du sens, et non référés à des déterminations objectives ; c'est pourquoi la sémantique générative peut être considérée comme « un pas de plus » dans la voie de la confusion entre idéologie, discours et langage.

C) Seule une partie des faits sémantiques relève ďune étude linguistique . Cette troisième hypothèse peut donner naissance à deux types de solutions mutuellement exclusives (le terme d'« énonciation » auquel elles se réfèrent toutes deux pouvant de ce point de vue prêter à confusion) :

Cl) La solution de Benveniste qui, à l'intérieur du processus de signification, distingue « le sens » et « la référence » (ou « désignation »). L'interprétation la plus immédiate de cette distinction consiste à y voir une opposition entre une sémantique linguistique et une sémantique extra- linguistique. Tel semble être le cas, tant que l'on en reste à l'étude de la langue conçue comme système structuré et hiérarchisé de signes : « le sens d'une unité est le fait qu'elle a un sens (...) ce qui équivaut à l'identifier par sa capacité à remplir une « fonction propositionnelle » » (Problèmes, p. 127) ; ceci relève d'une analyse linguistique. Au contraire, la référence du signe renvoie « au monde des objets généraux ou particuliers, pris dans l'expérience ou forgés par la communauté linguistique » ( ibidem , p. 128). Mais, pour Benveniste, la langue n'est pas seulement un système de signes, c'est aussi « un instrument de communication, dont l'expression est le discours » ( ibidem , p. 130). Système de signes et discours constituent « deux univers différents, bien qu'ils embrassent la même réalité, et ils donnent lieu à deux linguistiques différentes » ( ibidem , p. 130). L'articula- tion de ces deux linguistiques s'opère au niveau de la phrase, et là, l'étude

78

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 74: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

de la référence se trouve réintroduite dans le champ de la linguistique ; en effet, le sens de la phrase (sa fonction de prédicat) se décrit en analysant les relations entre les signes qui la composent, la référence de la phrase (c.-à-d. des «situations concrètes eťempiriques » (ibidem, p. 128) relève de la linguistique discursive (théorie de l'énonciation). Cette deuxième direc- tion ouvre la voie à l'idée de discours-parole en tant que lieu de la création individuelle : ainsi les modalités de phrase traduisent pour Benveniste trois fonctions « interhumaines » caractéristiques du discours, chacune correspondant à une « attitude du locuteur », à savoir « transmettre un élément de connaissance, demander une information, intimer un ordre » (ibidem, p. 130). La caractéristique de cette solution réside, selon nous, en ce qu'elle ne peut échapper à la dualité idéologique joignant système (de signes) et créativité (individuelle) : le « discours » n'y est pas autre chose qu'un nouvel avatar de la « parole ».

C2) La solution selon laquelle la frontière entre le linguistique et le non-linguistique se situe à l'intérieur des phénomènes sémantiques, préci- sément là où s'opposent une « sémantique formelle » et une sémantique dis- cursive. Nous retrouvons bien 1'« énonciation », mais définie cette fois comme la théorie de l'illusion subjective de la parole (théorie du « corps verbal »), et non comme sa répétition. Tout ce qui précède montre à l'évi- dence que nous avons constamment tenté de nous placer dans ce cadre (hypothèse G2), ce qui ne signifie pas, bien entendu, que les différents aspects de la procédure AAD ne puissent pas, précisément, faire l'objet de critiques de ce point de vue.

Sans doute peut-on constater que des phénomènes comme la nomi- nalisation, le « vidage » des DET ou du SN, le « préconstruit », etc... sont d'ores et déjà identifiés au niveau des résultats il reste cependant que

1. Nous donnons ci-dessous quelques exemples tirés de l'étude sur S. Mansholt (à paraître) de phénomènes linguistiques repérables dans les résultats actuellement obtenus par l'AAD. PRÉCONSTRUITS :

minimum vital développement culturel répartition des biens épanouissement des hommes

MODALITÉS il faudra... /l'action de l'État devra...

INSTANGIATION - VIDAGE

^ I donner I I assurer | un minimum vital

l'État assure recul du bien-être de ! chacun I

I l'individu I ( suite de la note page suivante).

79

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions

Page 75: Analyse du discours langue et idéologies || Mises au point et perspectives à propos de l'analyse automatique du discours

toutes les critiques que nous avons rappelées ou formulées à l'égard des modalités actuelles de l'analyse morpho-syntaxique restent valables et appellent de profonds changements. Nous voudrions, sur ce point, poser pour finir la question même du rapport entre les phases 2 (« linguistique ») et 3 (comparative-discursive) ; ne peut-on concevoir que, au lieu de se juxtaposer séquentiellement, ces deux phases se co-déterminent, de sorte qu'il y aurait un « effet en retour » de la phase 3 sur la phase d'analyse syntaxique ; rien n'interdit de penser la réalisation d'une lecture à plusieurs niveaux qui, partant d'un système morpho-syntaxique minimum, réintégre- rait ensuite progressivement les « informations » sémantiques repérées à la suite de cette première lecture et de ses effets au niveau de la phase 2.

On peut penser, en particulier, que les résultats intermédiaires obtenus concernant les relations de synonymie, de paraphrase « syntaxique » et de syntagmatisation entre commutables puissent être ré-investis dans une analyse morpho-syntaxique de niveau plus élevé, spécialement sur la détermination des phénomènes d'inter-phrase, liés à la fois à l'identification des « centres syntaxiques » (cf. p. 54), et à celle des relations de syntagma- tisation. C'est dans cette direction que nous comptons, à long terme, engager les recherches concernant l'articulation entre linguistique et théorie du discours.

DÉTERMINANTS « On espère une »/« la » stabilisation Les Etats/l'État

NOMINALISATIONS I l'humanité connaît un I , I matières premières I I l'humanité risque de

connaît un I I man<Iue de ,

I I biens matières premières I

I nous manquons I pénurie |

restriction de limitation biens de consommation répartition

,, I problème

80

This content downloaded from 147.26.11.80 on Mon, 9 Sep 2013 16:32:29 PMAll use subject to JSTOR Terms and Conditions