Passer au contenu

Inktomi indexe mieux les sites web

Inktomi révise son robot d’indexation Inktomi Search/Web Service L’indexation des contenus et la mise à jour sont plus rapides

Nous estimons que le web compte de 5 à 6 milliards de pages. La troisième génération d’Inktomi Search/Web Service [utilisé, par exemple, par le site MSN, Ndlr] permet d’établir une classification intelligente, après élimination des pages générées par des robots, des documents familiaux et des images pornographiques. Au final, nous proposons un index de 1,6 milliard de pages “, explique Henrik Hansen, directeur du marketing d’Inktomi. Par intelligence, le constructeur entend une amélioration de la pertinence et la catégorisation automatique des documents. Ainsi Inktomi exploite des algorithmes qui analysent les liens reliant entre elles les pages référencées dans sa base d’index. Ce premier traitement est complété par une mesure des liens les plus populaires, c’est-à-dire une analyse des clics effectués par les internautes.

Un rafraîchissement continu des pages

Suivent des analyses de formats chargées de déterminer le type de document indexé. Ceux-ci sont alors triés dans six SGBD thématiques. “Le robot peut être paramétré en mode réindexation. Cela permet un rafraîchissement continu des pages “, poursuit Henrik Hansen. Cette fonction permettrait de rafraîchir la totalité de l’index en une semaine. Cerise sur le gâteau, des tests régressifs autorisent la qualification de résultats de recherche. Par exemple, un site littéraire privilégiera les documents textuels, un guide de sites web préférera un classement des sites les plus populaires, etc. Quatre versions sont proposées : Inktomi Search/Web pour les portails, Search/Custom pour les sites verticaux, Search/Enterprise pour le marché des intranets et Search/Site pour la classification des contenus d’un site.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Francisco VILLACAMPA, 01net.