La base lexicographique du Dictionnaire de l'Académie française (1694-1992): quelques mesures

Abstract

The assertion made by N. Catach (CHWP B.21), that the various editions of the Dictionnaire de l'Académie française constitute a single, essentially unchanging lexicographical base, is tested on a sample corpus of computerized entries from the point of view of text forms, headwords, examples, semantic description and lexicographical discourse. Indeed, from the first edition to the eighth, the stock of lexical items changes little, the metalanguage scarcely evolves, and only in the ninth (in progress) is a seriously revised description of the lexical material — much of it still dating back to 1694 — being undertaken. The eight complete editions, each in two volumes, form a remarkably homogeneous, and eminently computerizable, corpus.

How to Cite

Wooldridge, T. R. (1996). La base lexicographique du Dictionnaire de l'Académie française (1694-1992): quelques mesures. Digital Studies/le Champ Numérique, (4). DOI: http://doi.org/10.16995/dscn.212

Download

Download HTML

443

Views

104

Downloads

1

Citations

[NDLR: L'articulation différente des pièces de l'article -- texte et figures sur écrans indépendants à la place des pages composites de l'imprimé -- a nécessité quelques modifications de formulation; par ailleurs, les données de la figure 3 ont été corrigées.]


Introduction

Je voudrais tenter ici quelques mesures partielles de l'affirmation de N. Catach, selon laquelle: "Les Dictionnaires de l'Académie française [...] constituent sur trois siècles une seule et même base lexicographique, avec le même contenu, modifié mais jamais fondamentalement remanié, où l'on retrouve encore de nombreuses traces de la conception première (1694)."[1]

1. Caractères et mots de texte

En termes de dimensions physiques, les neuf éditions peuvent être quantifiées d'après le nombre de caractères, ou octets, et le nombre de mots de texte (Figure 1). Les calculs sont basés sur l'échantillonnage suivant: les articles ÂME, DOUAIRE à DOUZIL, GAGNER, LOIN à LOISIR, QUE, TIGE à TINTOUIN (échantillonnage 'ADGLQT').[2]

Ces chiffres indiquent qu'alors que les 3e et 7e éditions n'ajoutent presque rien, les 6e et 9e augmentent le texte de façon considérable, la dernière après une réduction importante effectuée par la 8e.

On peut examiner les mots de texte d'un peu plus près, toujours en termes purement formels, en calculant le pourcentage des mots-formes qui passent d'une édition à l'autre. Seront considérées comme identiques (mots gardés) les variantes graphiques (type ame --> âme, estre --> être), comme différents (non gardés) les mots qui changent de nombre (type eau --> eaux) (Figure 2). Les calculs sont basés cette fois sur l'échantillonnage réduit ÂME, DOUX, GAGNER, LOIN, QUE, TIMBRE cette fois (échantillonnage 'adglqt').

De façon générale, les chiffres de la Figure 2 viennent conforter ceux de la Figure 1: les 3e, 4e et 7e éditions sont presque les mêmes que celles qui les précèdent; les 2e et 5e innovent peu; la 6e ajoute beaucoup, en délaissant ou en modifiant une proportion non négligeable (11,62%) des mots-formes de la 5e édition; dans la 8e édition, les pourcentages de réduction globale (15,31%) et de non-maintien de mots-formes (19,82%) sont sensiblement les mêmes. Seuls les chiffres de la 9e édition présentent une anomalie apparente: tandis que le renouvellement du vocabulaire (53,83%) correspond au taux d'augmentation estimé dans la Figure 1, le nombre de mots de texte dans les articles ÂME et DOUX diminue d'un tiers. Il est donc temps de regarder le contenu du texte.

2. Unités de macrostructure

Le comptage des unités de macrostructure -- les vedettes -- pose quelques problèmes pour la 1e édition. Alors que dans les autres éditions mots simples et dérivés sont présentés comme vedettes (grandes capitales) dans un seul ordre alphabétique, la 1e édition pratique deux classifications: 1) réunion des mots d'une même famille étymologique sous un mot de base, chef de famille (mésostructure); 2) classement alphabétique des mots de base (macrostructure). Seront considérées ici comme vedettes de la 1e édition: et les vedettes de macro-article (mots en grandes capitales à l'exception des renvois) et les sous-vedettes de micro-article (mots en petites capitales en début d'alinéa à l'exception des répétitions, des syntagmes et des participes: la 1e édition confond sous une même présentation typographique ce qui, du point de vue fonctionnel, revient soit à des sous-vedettes de macro-article, soit à des sous-adresses de micro-article). L'ajout (ou la suppression) d'une unité de macrostructure ne correspond pas nécessairement à l'ajout (ou suppression) d'une unité lexicale: par ex., double "espèce de monnaie" est présent dans les sept premières éditions, mais n'est article à part que dans les 2e et 3e. La distribution chiffrée, pour l'échantillonnage 'ADGLQT', des vedettes d'article est donnée dans la Figure 3.

Sur le plan de la nomenclature donc, les 2e (+4), 3e (+4) et 7e (+3) ne font qu'ajouter quelques mots, la 5e (-2, +4) révise la nomenclature un petit peu, alors que les 4e (-4, +15), 6e (-2, +10) et 8e (-11, +12) la renouvelle bien davantage. Ce n'est pourtant que la 9e édition qui effectue une transformation réelle, en augmentant la nomenclature de l'échantillonnage 'AD' de 50% (-1, +27). La liste de départ résiste bien aux révisions diverses: sur les 64 lemmes de 1694, 60 se retrouvent dans le dernier recensement (1992 pour 'AD', 1932-5 pour 'GLQT'). Quelques unités subordonnées, voire supprimées, à un moment donné peuvent réapparaître par la suite: le substantif DOUILLETTE, vedette dans les 6e, 7e et 9e éditions, est subordonné à DOUILLET (adj.) dans la 8e; DOUZAIN (A1-4), supprimé par la 5e édition, refait surface dans la 9e.

3. Exemples d'emploi

Outre les mots-vedettes, le corpus lexical du dictionnaire comprend les exemples d'emploi. Dans quelle mesure le répertoire de ceux-ci évolue-t-il? La Figure 4 indique pour les articles ÂME et DOUX le nombre d'exemples de chaque édition (N, colonne a), le nombre (col. d) de ceux qui passent sans (=, col. b) ou avec (±, col. c) modification d'une édition à l'autre et le pourcentage des exemples hérités par rapport au nombre total de l'édition qui les garde (col. e).

Dans ces deux articles, le corpus des exemples change assez peu, même si la 6e et la 9e éditions en ajoutent beaucoup et que les 2e, 8e et 9e en suppriment bon nombre. 57 des exemples d'âme et 78 de ceux de doux sont employés par au moins sept éditions, dont respectivement 52 et 73 depuis la première. De 1694 à 1992, l'âme est noble, grande, généreuse ou faible, basse; le lait, le miel, le sucre sont doux, l'orange, l'amande sont douces. Si de 1694 à 1762 et de 1835 à 1878 on peut aimer Dieu de toute son âme, en 1798 il faut aimer Dieu de toute son âme; en 1932 on fait des choses non précisées de toute son âme; en 1992 les choses ont changé: on est musicienne dans l'âme ou on peut se donner à un travail corps et âme. Comme c'est le cas des mots-vedettes, des exemples peuvent être supprimés et réapparaître ultérieurement; en voici une liste pour les articles ÂME et DOUX:

  • A1 estre touché jusqu'au fonds de l'ame; A6-8 j'en suis ému jusqu'au fond de l'âme; A9 être ému jusqu'au fond de l'âme
  • A1 jurer en son ame; A6-7 il jure en son âme et conscience que la chose est ainsi; A8 jurer en son âme et conscience
  • A1 c'est son ame, sa chere ame; A7-8 ma chère âme, mon âme; A9 mon âme, ma chère âme
  • A1-6, 9 l'âme du monde
  • A2-6, 9 âme végétative, âme sensitive
  • A1-7, 9 les fonctions de l'âme
  • A6-7 bénéfice à charge d'âmes, avec charge d'âmes; A9 avoir charge d'âme(s)
  • A1-3, 6-7 médecin d'eau douce
  • A1-5 senteur douce; A9 de douces senteurs

4. Le traitement sémantique

En fait, plutôt que le fonds lexical lui-même -- les vedettes et les exemples --, ce sont l'organisation des matériaux et le traitement sémantique qui varient et évoluent d'une édition à l'autre. Lime douce, entre citron doux et orange douce dans les trois premières éditions, de fruit deviendrait outil dans les 4e et 5e où il suit cela est doux au toucher; il est technique dans la 6e et la 7e (entre purgatif doux et gravure en taille-douce), terme de métallurgie dans la 9e; entre-temps il a été donné comme extension de sens de doux "qui fait une impression agréable sur les sens" dans la 8e édition. Esprit doux, associé à humeur douce et à naturel doux dans les cinq premières éditions, devient terme de grammaire grecque à partir de la sixième.

Il faudrait une étude plus détaillée que celle-ci pour montrer comment, par le choix et l'organisation des exemples, par la sélection et la définition des sens, le contenu conceptuel d'un mot évolue à l'intérieur du discours dictionnairique de l'Académie. Je me contenterai ici de mentionner deux exemples. Dans l'article ÂME, l'exemple corps sans âme est dans toutes les éditions sauf la dernière, alors que celle-ci est la seule à donner corps et âme. Le mot loisir semble avoir donné du fil à retordre aux rédacteurs; en voici les définitions successives: A1 "L'estat d'une personne qui est dans l'oisiveté, ou qui n'a rien à faire qui l'empesche de disposer de son temps comme il luy plaist."; A2-3 "Estat où on n'a rien à faire, et où on peut disposer de son temps comme on veut."; A4 "Temps où l'on n'a rien à faire."; A5 "Temps dont on peut disposer, où l'on fait ce qu'on veut."; puis A6-8 "Temps dont on peut disposer sans manquer à ses devoirs."

Comme exemple de mot dont les sens évoluent beaucoup, on peut citer timbre. La Figure 5 en donne l'article composite (moins les exemples) d'après les huit premières éditions. Le sens de "son" s'introduit et s'enrichit peu à peu; au sens de "tête", timbre perd son autonomie pour ne subsister que dans l'expression avoir le timbre fêlé; l'abreuvoir cède la place à la justice, puis à l'administration en général, dans laquelle les postes prennent une importance grandissante, et au commerce.

5. La métalangue de base

Finalement, après les mots-formes, la nomenclature, les exemples et le traitement sémantique, sera examinée ici la métalangue de base, autrement dit l'articulation des informations et les formules utilisées à ce propos. Les formulations varient peu d'un article à l'autre, quelle que soit la nature du mot traité. Prenons encore une fois l'article ÂME. Les formules et l'articulation en paragraphes varient assez peu de la première à la huitième édition; celles de la 1e, 8e et 9e peuvent se schématiser comme suit:[3]

A1 [1] [signifie]   [2] On dit...   [3] Se dit particulierement en parlant de... et signifie...   [4] On dit fig. que...   [5] [On dit fig.] que...   [6] On dit que...   [7] On dit aussi que...   [8] On dit que...   [9] On appelle prov....   [10] On appelle...   [11] On appelle...   [12] Par rapport à...   [13] Par rapport à...   [14] /sème/   [15] On appelle...   [16] Se dit quelquefois pour...   [17] Dans ce sens on dit par raillerie de...   [18] Se dit pour...

A8 [1] [signifie]... C'est dans ce sens qu'on dit familièrement...   [2] Il signifie aussi...   [3] Fig. et fam....  se dit de...   [4] Il signifie aussi, d'une manière générale,...   [5] Absolument... On dit aussi...   [6] Fam....   [7] S'emploie aussi comme terme de tendresse...   [8]  [signifie]   [9]  forme de serment, d'affirmation... On dit de même...   [10] Signifie, dans certains cas,... On dit plutôt aujourd'hui...   [11] Il se dit encore de...   [12] Se dit figurément de...   [13] Prov. et fig.... Il se dit aussi de...   [14] Il se dit aussi figurément de...   [15] Fig....   [16] Fig....   [17] Fig.... On dit de même... On dit aussi...   [18] Fig....   [19] Fig. et fam....   [20] S'emploie par extension, par une sorte d'analogie, pour désigner... Ainsi on dit...   [21] ...    [22] ... Â... Il se dit également de...   [23] ...    [24] ...    [25] Signifie encore figurément...

A9 [1] 1. PHIL. et RELIG. [signifie]... Fig. et fam....   [2] Spécialt....   [3] 2. [signifie]... Par méton., en parlant de... Fam....   [4] Expr. et loc.... Fam....   [5] Spécialt. fig....   [6] 3. Par anal....   [7] Fig....   [8] 4. [signifie]... HÉRALD....

De la première édition à la huitième, le discours articulateur renferme un mélange de copules d'énumération (on appelle, se dit aussi, signifie encore, etc.), d'ordonnateurs de dépendance sémantique ou syntaxique (fig., particulièrement, par extension, absolument...) et de marques d'usage (prov., fam., aujourd'hui, etc.). La neuvième se distingue par une réduction sérieuse du nombre des copules de simple énumération, une systématisation des formules d'abréviation et surtout le regroupement des items en paragraphes complexes logiquement ordonnés et numérotés.

Une étude adéquate des copules, ordonnateurs et marques ne peut être faite ici; elle devra tenir compte des préfaces et des listes d'abréviations liminaires du dictionnaire, des divers suppléments, compléments et dictionnaires techniques de l'Académie. Elle montrera dans le degré d'analyse nécessaire la distribution assez régulière et complémentaire de certaines formules telles que on dit / se dit, l'extension d'emploi depuis la première édition de copules de dépendance telles que absolument, l'introduction d'autres formules telles que par extension (à partir de la 6e édition), le développement et la codification progressive des marques d'usage technique allant de pair avec une certaine technicisation du vocabulaire (par exemple, A1 en termes de Musique --> A6 T. de Musiq. / en Musiq. --> A9 MUS. / MUSIQUE; A2 en termes de guerre --> A7 en termes militaires --> A9 MILIT.; A1 "On appelle, l'Ame d'une devise" --> A2 "En parlant de Devise, on appelle Ame" --> A9 "HÉRALD. L'âme d'une devise").

Conclusion

Au terme de cet examen assez rapide, il est pourtant clair que les chiffres viennent appuyer la déclaration liminaire de N. Catach. Le fonds lexical -- adresses et exemples -- est en grande partie le même de la première à la dernière édition (dans les échantillonnages étudiés, 92% des vedettes de 1694 se retrouvent dans les éditions du XXe siècle et 70% des exemples de départ y sont encore à la fin du XIXe). Le discours lexicographique ne change de façon sensible que dans la dernière édition; pourtant celle-ci utilise encore la formule caractéristique on dit. Les huit éditions complètes, en deux volumes chacune, forment un corpus remarquablement homogène et éminemment informatisable.


Notes

[1] Voir N. Catach, CHWP, B.21. Les neuf éditions du Dictionnaire de l'Académie française: 1e éd., Paris: Coignard, 1694; 2e éd., Paris: Coignard, 1718; 3e éd., Paris: Coignard, 1740; 4e éd., Paris: Brunet, 1762; 5e éd., Paris: Smits, [1798]; 6e éd., Paris: Firmin-Didot, 1835; 7e éd., Paris: Firmin-Didot, 1878; 8e éd., Paris: Hachette, 1932-5; 9e éd., Paris: Imprimerie Nationale, 1986- (fasc. 1, 1986; vol. 1, 1992).

[2] Pour la neuvième édition (en cours), je n'en ai pu utiliser que la partie 'AD'.

[3] "[1]", "[2]", etc., = numéro d'ordre des paragraphes; "[signifie]" = copule implicite; "/sème/" = précision sémique (il s'agit, en l'occurrence, de "Ame, Séparée du corps."); "Â" représente un syntagme contenant le mot-adresse âme.

Share

Authors

T Russon Wooldridge (Department of French, University of Toronto)

Download

Issue

Dates

Licence

Creative Commons Attribution 4.0

Identifiers

File Checksums (MD5)

  • HTML: 2a2be2ddece17dd5be4c9153b5fdb876