Passer au contenu

Memex, le moteur de recherche qui explore les recoins les plus sombres du net

Les forces de l’ordre américaines utilisent une nouvelle technologie qui permet de découvrir ce que Google ne peut pas voir. Et a déjà permis de démanteler des réseaux de trafiquants d’être humains.

Il y a quelques mois, un réseau de trafiquants d’êtres humain a été démantelé par les autorités américaines. Leur arme : Memex, un nouveau moteur de recherche de la Darpa, l’agence R&D de l’armée américaine. Présenté en février 2014, cet outil « révolutionnaire » est utilisé depuis plus d’un an par les forces de l’ordre des Etats-Unis pour traquer toutes sortes de criminels. Memex est un moteur de recherche très particulier, qui permet d’inspecter la partie invisible de la Toile, que les autres moteurs de recherche n’indexent pas, ou mal. On appelle cette partie de l’internet le « Deep Web ». Et s’il est impossible de le mesurer avec précision, il serait gigantesque, bien plus vaste que la Toile que l’on peut explorer par le biais d’outils comme Google.

Les moteurs de recherche traditionnels sont basés sur la popularité des sites web, ce qui exclut forcément toutes les pages éphémères et à faible trafic. Or, c’est justement ce type de pages qu’utilisent les trafiquants d’êtres humains pour faire connaître leurs nouveaux « services » en matière de prostitution ou pour attirer de nouvelles victimes dans leur filet. D’après la Darpa, plus de 60 millions de ces pages criminelles ont été publiées ces deux dernières années. Mais comme chacune n’a qu’une courte durée de vie, elles n’apparaissent pas dans le radar de Google, Yahoo ou Bing.

A contrario, Memex peut être configuré pour ne focaliser que sur ces parties sombres du Net. Doté de capacités d’intelligence artificielle et d’outils d’analyse et de visualisation, il peut non seulement capter ces données invisibles, ces signaux faibles, mais aussi créer des liens entre eux et de manière graphique.  Voici des exemples de cartes réalisés à partir de Memex.

Nombre de publicités liées à la prostitution à un instant donné..
Nombre de publicités liées à la prostitution à un instant donné..
Les publicités pour prostitution sont regroupées par email, numéros de téléphone, titres, etc.
Les publicités pour prostitution sont regroupées par email, numéros de téléphone, titres, etc.
Encore une autre manière d'analyser les données.
Encore une autre manière d’analyser les données.

Les scientifiques de la Darpa veulent aller encore plus loin. Car les criminels migrent de plus en plus leurs activités en ligne du « Deep Web » vers le « Dark Web ». Ce dernier, en effet, est encore plus discret : il faut des outils spécialisés tels que Tor ou des logiciels peer-to-peer pour y accéder. C’est pourquoi les chercheurs américains veulent développer un « Dark Web Crawler » qui va indexer les sites qui s’y trouvent, à l’image des robots logiciels de Google qui parcourt l’ensemble du web. La difficulté, ici, ne réside pas dans la quantité d’informations à indexer, mais sur la manière d’y accéder. Selon eux, le Dark Web représente actuellement entre 30.000 et 40.000 pages web.

Lire aussi:

Dark Market: coup de filet transatlantique, plus de 400 sites ont été fermés, le 08/11/2014

Source:

Scientific American

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Gilbert Kallenborn