Text Mining Tool est un logiciel “freeware” qui vous permet d’extraire en un clin d’oeil la partie textuelle d’un document PDF, d’une aide en ligne CHM, d’une page HTML ou d’un fichier RTF ou DOC. Il suffit de lancer le programme et de lui indiquer le fichier à transcrire pour voir le texte brut s’afficher à l’écran. Libre à vous, alors, d’exporter ce texte ou de le copier/coller…
En pratique, le programme s’avère aussi très pratique pour récupérer le contenu d’un fichier DOC endommagé ou d’un fichier PDF anormal et illisible.
– Commencez par télécharger le logiciel en suivant ce lien.
– Décompactez l’archive Zip dans un dossier.
– Le logiciel n’a pas besoin d’installation. Il suffit de double-cliquer sur l’icône TextMiningTool. Le programme peut donc facilement être utilisé depuis une clé USB, par exemple.
– Cliquez sur l’icône Open pour charger le fichier PDF, CHM, HTML, RTF ou DOC.
– Après quelques secondes d’analyse, la partie textuelle du document dans sa forme brute (sans image, ni style, ni enrichissement, ni code de mise en page) s’affiche.
– Cliquez sur Save pour sauvegarder ce texte au format ASCII directement lisible depuis le bloc-notes par exemple.
– Ou cliquez sur Clipboard pour copier l’intégralité du texte dans le presse-papiers Windows afin de le coller ensuite dans un document Word ou OpenOffice.org sur lequel vous êtes en train de travailler.
Remarques:
* Il arrive au logiciel de ne pas décrypter correctement les accents, notamment sur les documents HTML
* Vous pouvez, dans la fenêtre du logiciel, sélectionner un bloc de texte et utiliser le raccourci [Ctrl]+[C] pour copier cette sélection dans le presse-papiers Windows.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.