Pour numériser des pages de texte destinées à une reconnaissance optique de caractères, le logiciel de retouche d’images n’est d’aucune utilité. Vous passerez donc par l’interface logicielle simplifiée de votre
scanner.
1. Numérisez la page imprimée
En général, un raccourci pour le logiciel de pilotage simplifié est créé sur le Bureau lors de l’installation du scanner, MP Navigator 3.0 dans notre exemple (voir écran 1). Double-cliquez dessus pour accéder à
l’interface du logiciel. Après avoir placé la page à numériser sur la vitre du scanner, cliquez sur le bouton Numériser/Importer, choisissez Photos/Documents et, dans la liste Type de document, sélectionnez
Texte (OCR) (voir écran 2) ?” le nom de cette option peut varier légèrement d’un scanner à l’autre. Pour lancer la numérisation, cliquez sur Numériser. La page est alors scannée en noir et blanc, à une résolution
élevée, en général 600 p/p. Cette résolution est nécessaire pour avoir suffisamment de détails dans les petits caractères, et ainsi optimiser la reconnaissance optique.
2. Convertissez l’image en texte
La numérisation effectuée, une vignette de la page apparaît dans l’interface de numérisation. Cliquez alors sur le lien Modifier/Convertir, puis sur Convertir en fichier texte, pour basculer sur le
logiciel d’OCR ; il s’agit le plus souvent d’Omnipage SE. Le logiciel d’OCR se lance et affiche la page numérisée dans la fenêtre (voir écran 3). Pour préparer la reconnaissance optique, il est nécessaire d’indiquer à Omnipage
l’ordre de lecture des différents pavés de texte. Pour cela, déroulez le menu situé sous le Bouton n?’ 2 et choisissez l’option définissant le mieux votre document : Colonnes multiples sans tableau, dans notre
exemple (voir écran 4). Puis cliquez sur le Bouton n?’ 2 pour lancer la reconnaissance de caractères. Une fois l’analyse réalisée, Omnipage affiche dans la partie droite de son interface le texte converti. Le logiciel
passe ensuite en revue tous les mots du texte et signale ceux qui lui pose un problème d’interprétation (voir écran 5). Comme c’est le cas pour un traitement de texte, vous avez alors trois options : conserver le mot tel qu’il a
été identifié en cliquant sur Ignorer ; modifier le mot en sélectionnant l’une des suggestions proposées puis cliquer sur Remplacer ; ou, si aucune suggestion ne convient, saisir vous-même le terme correct dans la
fenêtre où le mot apparaît dans son contexte.
3. Vérifiez le résultat
Une fois l’ensemble du texte passé en revue par le dictionnaire d’Omnipage, il est prudent d’effectuer vous-même une relecture de vérification dans la fenêtre d’éditeur de texte (à droite de la fenêtre). Dans la barre
d’outils de la fenêtre, cliquez sur le bouton de paragraphe pour faire apparaître les caractères dits ‘ de contrôle ‘ comme les retours à la ligne, les tabulations… Vous pourrez ainsi vous
assurer qu’il n’y a pas de sauts de ligne en trop. Pour un contrôle visuel plus facile, vous pouvez également changer le mode d’affichage. Par défaut, Omnipage tente de reconstruire une mise en pages se rapprochant le plus possible du document
original (voir écran 6). Mais pour afficher le texte au kilomètre, sans mise en pages, cliquez sur le bouton Mode Texte formaté en bas à gauche de la fenêtre d’éditeur de texte.
4. Enregistrez le fichier texte
Une fois toutes les corrections accomplies, enregistrez le fichier : déroulez le menu situé sous le Bouton n?’ 3, sélectionnez Enregistrer dans un fichier, et cliquez sur le Bouton
n?’ 3. Choisissez un nom de fichier et optez pour un format Doc pour pouvoir ensuite l’ouvrir dans un traitement de texte, et/ou un format RTF pour l’exploiter dans un autre logiciel (courrier électronique, mise en pages Web, etc). Si
vous avez numérisé un tableau, vous pouvez directement l’enregistrer dans un classeur Excel, au format XLS.