Au vu des résultats obtenus avec SimpleOCR 3.1, on peut se demander s’il n’est pas plus rapide d’avoir recours à… la saisie des documents. Il est en effet difficile de trouver une ressemblance entre le document original
et celui obtenu après analyse. SimpleOCR ne conserve rien de la mise en page originale. Il ignore les paragraphes, la taille des caractères, les polices, sans compter les nombreuses erreurs de reconnaissance de lettres qui conduisent à une
déformation du sens des mots.Le summum est atteint avec les tableaux : incapable d’identifier les cellules, il les transforme en une suite illogique de lettres, sigles et chiffres. Et les documents ne peuvent être enregistrés qu’en. txt ou
.doc.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.