Passer au contenu

Les coulisses du web

Demain, les moteurs de recherche devront prendre en compte l’information cachée du web.

Tout ce qui n’est pas accessible par un moteur de recherche classique appartient au domaine du web invisible. Cette masse gigantesque d’information, non référencée par les moteurs traditionnels, se compose de données aux formats disparates (Oracle, PDF, Word, MP3, Powerpoint, etc. ). Sa taille a été estimée à plus de cinq cents fois (*) celle du web indexé par les moteurs les plus connus. Elle est pratiquement inexploitée. Sauf à aller directement sur les moteurs de recherche interne des sites de grande taille.Aucun fournisseur de services sur internet ne peut aujourd’hui se vanter d’indexer correctement cette face cachée du web. Et pourtant, l’enjeu est de taille. En effet, il peut s’agir pour eux de se positionner comme de nouveaux points d’entrée incontournables. Une prouesse réussie par Yahoo! en son temps. Les sites s’adossant à de grosses bases de données génèrent deux fois plus de visites que les autres. Ce sont eux qui constituent la trame du web invisible.Il pourrait donc s’agir de donner aux internautes un accès encore plus exhaustif à l’information, sachant que 85 % d’entre eux utilisent les moteurs de recherche classiques pour trouver ce dont ils ont besoin. Celui qui pourra leur offrir un accès pertinent aux quelque 550 milliards de documents – au lieu des 3 milliards de pages estimées par Cyveillance – décrochera peut-être la timbale.(*) Les chiffres mentionnés ici sont tirés d’une étude de Bright Planet, réalisée en juillet 2000.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Philippe Billard