Comment un mot entre-t-il dans le dictionnaire ?
Le passage d’une année à l’autre est l’occasion de bilans et de listes. Les médias dressent parfois le palmarès des mots ou expressions qui ont marqué l’année qui s’achève. Ainsi, l’an 2020, touché par la pandémie que l’on sait, a vu proliférer des termes comme coronavirus et COVID-19. Le premier, qui désigne une catégorie de virus, n’est pas une création millésimée 2020 (le mot est âgé d’au moins un demi-siècle), mais, au cours des derniers mois, ce terme spécialisé est sorti des laboratoires pour se diffuser massivement dans les médias et dans la langue courante. Quant à COVID-19, maladie causée par un coronavirus apparu à la fin de 2019, son acte de baptême date bien de 2020.
Néologismes
Les linguistes appellent néologismes les mots qui sont nouvellement apparus et qui enrichissent le lexique d’une langue. Le processus de formation de ces nouvelles unités lexicales est quant à lui appelé néologie. On inclut aussi parmi les néologismes les nouveaux sens donnés à des mots déjà existants. Par exemple, à l’époque où fut inventé un certain dispositif de pointage pour ordinateur, on lui a donné dans plusieurs langues le nom déjà existant de l’animal avec lequel il présentait une certaine ressemblance, soit, en français, souris.
Chaque jour qui passe apporte son lot de créations lexicales orales ou écrites plus ou moins anonymes et plus ou moins éphémères. Devant le potentiel quasi infini de la créativité lexicale, les gens qui élaborent les dictionnaires, les lexicographes, doivent forcément procéder à une sélection.
Comment un mot entre-t-il dans le dictionnaire ? Ainsi formulée, la question est réductrice, en laissant entendre qu’il existerait quelque part « le » dictionnaire qui contiendrait tous les mots et tous les sens de mots permis, avec le corolaire que tel mot « n’existe pas parce qu’il n’est pas dans le dictionnaire ». C’est une vue de l’esprit (comme la réponse à la question « combien y a-t-il de mots dans telle langue ? »). Non seulement parce que le lexique est en constante évolution, mais aussi parce qu’il existe autant de dictionnaires que de publics visés.
Il peut y avoir plusieurs raisons pour lesquelles un mot légitime ne figure pas dans un dictionnaire donné. La nomenclature (ensemble des mots d’un dictionnaire qui font l’objet d’un article) peut varier en fonction de plusieurs facteurs, dont voici quelques-uns :
• taille et format de l’ouvrage (papier ou électronique) ;
• taille de la nomenclature (nombre de mots décrits) ;
• degré de développement de la description de chaque mot ;
• place accordée à des mots ou à des sens disparus, ou en voie de disparition ;
• place accordée aux différents registres de langue, aux régionalismes, etc. ;
• public visé (grand public, spécialistes, étudiants, écrivains, locuteurs étrangers, etc.) ;
• orientation descriptive ou prescriptive de l’ouvrage.
Par exemple, pour un même format donné, certains ouvrages préfèreront contenir un grand nombre d’articles relativement courts, alors que d’autres privilégieront des articles moins nombreux, mais plus étoffés.
Vocabulaire spécialisé
Chaque domaine de la connaissance possède son vocabulaire technique propre qui peut facilement compter des milliers de termes si l’on creuse un peu le niveau de spécialisation. Des domaines se prêtent à de longues nomenclatures (listes de noms d’espèces animales ou végétales, listes de noms de composés chimiques, de médicaments, etc.). Les dictionnaires qui s’adressent au grand public, comme ceux d’Antidote, ne peuvent recenser tout le vocabulaire spécialisé et retiennent parmi la terminologie spécialisée les mots et locutions qui sont les plus susceptibles de se retrouver dans des textes didactiques ou de vulgarisation1.
Anglicismes et autres emprunts
L’anglais étant la langue internationale de fait dans plusieurs secteurs d’activité, c’est souvent dans cette langue que sont d’abord baptisées de nouvelles réalités, ce qui pose pour les dictionnaires français la question de la place à accorder aux anglicismes et aux termes français équivalents proposés avec plus ou moins de succès, notamment ceux qui le sont par des organismes terminologiques. Différents critères déterminent l’acceptabilité des emprunts à l’anglais :
• l’adaptation au système phonétique, graphique et morphologique du français ;
• l’utilité par rapport aux équivalents français disponibles ;
• l’implantation réelle dans l’usage ;
• la fréquence d’utilisation ;
• la diffusion dans la francophonie.
Ces critères valent pour les emprunts à d’autres langues que l’anglais.
Dans le cas d’Antidote, l’outil correcteur qui détecte dans un texte un anglicisme de ce genre proposera des équivalents français que le rédacteur est libre d’accepter ou non.
Noms propres
Les noms propres, qui constituent des unités lexicales particulières, dont la description relève plutôt des encyclopédies, sont généralement absents des dictionnaires de langue au sens strict, qu’on oppose parfois aux dictionnaires encyclopédiques, qui accordent une certaine place aux noms propres à côté des mots de la langue. C’est le cas d’Antidote, qui recense et tient à jour un nombre important de noms propres, sans bien sûr avoir aucune prétention à l’exhaustivité. Mais, si l’on soumet à ses dictionnaires un nom propre qui lui est inconnu, Antidote fournira un lien vers l’entrée correspondante de la riche encyclopédie en ligne Wikipédia.
Veille lexicologique
Même si les dictionnaires électroniques comme ceux d’Antidote se prêtent plus facilement que leurs équivalents de papier à une mise à jour fréquente, ils ne peuvent évidemment pas enregistrer en temps réel toutes les naissances de néologismes. Et il en est bien ainsi, car il est toujours utile de prendre un certain recul temporel devant ce qui est tout nouveau, tout beau. Bien des néologismes ont une existence éphémère, correspondant à des modes passagères ou à des techniques rapidement dépassées. C’est pourquoi les lexicographes préfèrent s’assurer de la viabilité d’un nouveau-né lexical avant de lui ouvrir les portes et les pages de leur dictionnaire. Car la durabilité escomptée d’un mot est un important critère d’inclusion. L’équipe lexicographique derrière Antidote est dotée de puissants outils de détection de nouveaux mots et de « veille lexicologique » pour l’aider à suivre dans d’immenses corpus les tendances de l’évolution des mots candidats à la « dictionnarisation » (en voilà justement un).
Dispersion, fréquence, apax
Outre sa fréquence, la dispersion d’un néologisme dans un corpus de textes est d’ailleurs un important facteur à considérer, car il permet de relativiser ce qu’indique un nombre absolu d’occurrences attestées. Par exemple, supposons que nous trouvions :
• un mot X dont on trouve 1 000 occurrences dans un seul et même texte du corpus ;
• un mot Y dont on trouve une seule occurrence dans 1 000 textes différents du corpus.
Même si les deux mots X et Y présentent au total le même nombre d’occurrences, il est raisonnable de conclure que le deuxième est utilisé par un plus grand nombre de locuteurs. Si on le retrouve à la fois dans la presse, dans des articles universitaires, dans des ouvrages de fiction et dans les réseaux sociaux, il présente un plus grand intérêt lexicographique que celui qui est concentré dans un texte isolé ou qui n’est partagé que par une poignée d’initiés.
Un cas extrême de rareté lexicale est ce qu’on appelle un apax (ou hapax). Il s’agit d’un mot ou d’une expression dont on ne trouve qu’une seule occurrence dans les textes, ou du moins dans un corpus donné. Ce sera par exemple un mot créé par une écrivaine et qu’on ne trouve que dans un seul passage de ses œuvres. Citer un exemple d’apax est une entreprise paradoxale, car des puristes pourraient objecter que le seul fait de citer un apax annule son unicité, et donc son « apaxité ». Mais c’est là une interprétation extrême du concept, et disons seulement qu’au moment d’écrire ces lignes, le dernier mot de la précédente phrase serait un exemple d’apax.
Et comment un mot sort-il du dictionnaire ?
Les dictionnaires usuels de papier régulièrement mis à jour, limités par leur format physique, doivent périodiquement supprimer des mots pour laisser la place aux nouveaux venus. C’est l’occasion de se débarrasser de mots qui n’ont pas résisté à l’épreuve du temps. Le problème d’espace se pose moins pour des dictionnaires électroniques comme ceux d’Antidote. Lorsqu’un mot ou un sens se raréfie dans l’usage, la chose est notée par l’ajout d’une marque d’usage comme vieilli ou vieux.
À vous de jouer : suggestions et dictionnaires personnels
Des gens du public attirent parfois l’attention de l’équipe lexicographique d’Antidote sur des mots récemment apparus qui mériteraient une éventuelle entrée au dictionnaire. Ces suggestions sont toujours bienvenues et attentivement examinées.
Les utilisateurs d’Antidote amateurs de néologismes peuvent s’improviser lexicographes en utilisant les dictionnaires personnels qui sont mis à leur disposition. Vous pouvez y consigner et y définir des mots que vous affectionnez, ou dont vous faites grand usage, et qui ne figurent pas (ou pas encore !) dans les dictionnaires « officiels » du logiciel. Les mots ainsi ajoutés seront notamment reconnus par le correcteur d’Antidote la prochaine fois que vous lui soumettrez un texte où figurent vos néologismes.
Joyeux « néols » et bonne fournée 2021 !
-
Pour le domaine médical français, notre partenaire Mysoft propose un riche Glossaire médical conçu pour aider la rédaction et la correction avec Antidote. ↩