Passer au contenu

La sémantique au secours des moteurs de recherche

L’analyse du sens des documents permet de bâtir des index pertinents. CoBrain utilise pour cela des techniques issues du monde industriel.

Trop de temps est perdu à chercher des solutions sur internet. Les moteurs opérant une indexation par mot-clé ont montré leurs limites : le taux de pertinence des pages ou documents renvoyés est généralement assez faible. Pour l’augmenter, il faut comprendre la requête de l’utilisateur. C’est l’objet des moteurs d’analyse sémantique.
Le moteur CoBrain, développé par Invention Machine, s’appuie sur le modèle SAO (Subject Action Object). Ce système repose sur la décomposition des phrases des documents analysés en “sujet-action- objet”, et sur la constitution d’un dictionnaire de synonymes sémantiques. Celui-ci servira ensuite de filtre pour la compréhension des requêtes que pour l’indexation des documents dans la base de connaissances.
Selon le modèle mis en ?”uvre par CoBrain – que l’on peut tester sur le site www.cobrain.com -, l’association “action-objet” constitue alors le problème, et le sujet la solution. Comme on s’y attend, la pertinence des réponses est grandement améliorée. Mais elle dépend, dans ce cas, de l’efficience du dictionnaire de synonymes et de la capacité du moteur à analyser un grand nombre de documents. Invention Machine, qui s’est concentré jusqu’à présent sur les domaines techniques et scientifiques, travaille à la constitution de dictionnaires et de bases de connaissances spécifiques aux marchés du médical, des finances et du marketing. Il lui faut aussi adapter ce logiciel à d’autres langues : seul l’anglais est supporté pour le moment.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Mireille Boris et Pierre Landry