Les fautes d’orthographe sont le lot quotidien de tous ceux qui écrivent, a fortiori sur un micro car la frappe au clavier augmente le risque d’erreur mécanique.Fort heureusement, il existe depuis des années un remède plus ou moins efficace à ces défaillances : le correcteur orthographique (aussi appelé vérificateur). Intégré aux programmes bureautiques ou vendu séparément, ce guide du savoir écrire est souvent aussi doué en grammaire. Ainsi, outre les erreurs de graphie des mots, le correcteur peut déceler les fautes de genre, de liaison ou de concordance des temps. Il sert aussi à ajuster la typographie pour la rendre conforme aux usages.Pour l’orthographe des mots, les correcteurs ont recours à des dictionnaires très riches, spécifiquement conçus pour la correction informatisée. Alors qu’un dictionnaire imprimé ordinaire répertorie de 50 000 à 60 000 mots, celui de Word 2000, par exemple, contient 82 000 formes canoniques (qui correspondent à 550 000 mots dérivés) plus 30 000 noms propres. Dans ce type de dictionnaire, les mots sont choisis pour leur fréquence d’utilisation dans des textes aussi bien classiques que contemporains.
Des algorithmes pour corriger l’orthographe
Au début d’une vérification, le logiciel commence par contrôler si le mot visé est dans le dictionnaire. Si ce n’est pas le cas, le mot est considéré comme mal orthographié a priori. Tout l’art du vérificateur consiste alors à rechercher pourquoi, c’est-à-dire quelle faute a bien pu être commise. Le moteur de vérification essaye d’abord de trouver un mot dérivé du mot inconnu, qui serait, lui, présent dans le dictionnaire. Pour cela, des algorithmes testent méthodiquement les fautes possibles d’accentuation, d’oubli d’une lettre, d’inversion de deux lettres et d’ajout malencontreux d’une lettre parasite ou d’un espace. Ils recherchent aussi les mots dont la prononciation est proche du mot inconnu (on a orthographié harbitrage pour arbitrage, par exemple), le dictionnaire du logiciel contenant des informations sur la phonétique des mots. Plusieurs fautes pouvant se cumuler, le vérificateur est aussi capable de tester une combinaison de recherches.Si cela ne donne aucun résultat, le vérificateur recherche les mots de graphie voisine, de même longueur et avec le plus grand nombre de lettres en commun. Au final, la recherche n’est pas forcément fructueuse ou heureuse. Ainsi, si le vérificateur propose souvent un ou plusieurs mots de substitution pour corriger le mot inconnu, il peut aussi afficher la mention “aucune suggestion”. Sur un mot cumulant les fautes, la suggestion est parfois surprenante (“Mannequin” pour “Mannivel”, par exemple).
L’orthographe n’est pas la clef de tout
Dans beaucoup de cas, la correction orthographique permet de supprimer la plupart des fautes d’un texte. Mais l’orthographe n’est pas tout. Les fautes de syntaxe, et plus largement de grammaire, sont indétectables par un vérificateur d’orthographe, qui ne peut pas déceler la faute de genre dans “Cette ami est fidèle” ou savoir que la phrase “Je gentil suis” est incorrectement formée.C’est là qu’entre en scène le correcteur grammatical. Le plus souvent, il est associé au correcteur orthographique, bien qu’il soit fondamentalement différent. Dans Word 2000, par exemple, où il est intégré sous la forme d’un module indépendant, ses fonctions sont couplées à celles du correcteur orthographique dans le menu Outils. De même, les logiciels que l’on trouve dans le commerce corrigent généralement aussi bien l’orthographe que la grammaire.Pour le correcteur grammatical, ce n’est plus l’orthographe des mots isolés qui compte, mais leur morphologie et leur syntaxe dans le contexte de la phrase. Le travail du correcteur consiste en une analyse des phrases pour détecter si elles sont conformes aux règles de grammaire. Pour cela, il décompose le texte en s’aidant de la ponctuation, afin de faire coïncider la phrase avec un schéma syntaxique déjà connu. Au passage, il vérifie la conjugaison des verbes, la concordance des temps, les accords en genre et en nombre ainsi que la typographie. Selon les paramètres définis par l’utilisateur, le correcteur grammatical peut aussi vérifier le style et repérer les mots ou les structures douteuses (comme les pléonasmes). Toutes ces vérifications sont effectuées en appliquant les règles de grammaire de la langue, connues car programmées dans le logiciel.
La sémantique ne casse pas des briques
Les meilleurs correcteurs grammaticaux sont aussi capables d’effectuer une analyse sémantique de la phrase afin de lever certaines ambiguïtés, ce qui leur permet de corriger des fautes qui seraient sinon indétectables. Pour cela, ils référencent les différentes significations de mots ayant plusieurs sens dans un dictionnaire spécialisé. Cette analyse sémantique est toutefois très limitée, car extrêmement complexe à réaliser. En effet, le sens général dépend non seulement de la signification des mots eux-mêmes, mais aussi du sens général de la phrase, ainsi que des relations entre les phrases.Il s’ensuit qu’un correcteur grammatical, même épaulé par un correcteur orthographique performant, aura beaucoup de mal à détecter certaines erreurs dues à des mots fautifs dans le contexte. De même, des phrases convenablement formées, mais à l’évidence mal orthographiées et qui ne veulent rien dire (“La table a été assassinée”), ne pourront pas être identifiées comme erronées. Quant à faire décider par le logiciel quelle était l’intention de l’auteur entre “Ses bras ferment la porte” et “Ses bras fermes la portent”, c’est une autre histoire…
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.