C’est la plus grosse masse de données jamais publiée sur Wikileaks : 1,7 millions de documents, soit 700 millions de mots. Le site web lanceur d’alerte vient de mettre en ligne les « Kissinger Cables », c’est-à-dire les documents diplomatiques des Etats-Unis de 1973 à 1976. Ce n’est pas une révélation en tant que tel, car ces documents ont été déclassifiés depuis longtemps par les services gouvernementaux. Ce qui est nouveau, en revanche, c’est qu’ils sont désormais accessibles au grand public au travers d’un moteur de recherche plein texte, baptisé « Plus D » et doté de toute une série de filtres (mot-clé, auteur, niveau de classification, etc.).
Les équipes de Wikileaks ont fourni là un travail titanesque, car initialement tous ces documents n’existaient qu’en format scanné PDF. Il fallait donc récupérer tous ces documents numériques et les faire passer par des algorithmes de reconnaissance de caractères pour en faire des fichiers texte, y ajouter des métadonnées et intégrer l’ensemble dans une base de données. Ce qui a nécessité plusieurs mois de labeur.
Le moteur de recherche Plus D intègre, par ailleurs, les télégrammes diplomatiques révélés en 2010, qui portaient principalement sur la guerre en Irak. Ce qui fait au total près de 2 millions de documents diplomatiques en ligne. « Ce sont des trésors cachés qui sont très difficiles d’accès pour le grand public, explique Kristinn Hrafnsson, un porte-parole de Wikileaks, auprès du magazine Forbes. La complexité est une manière de cacher les choses. C’est pourquoi nous avons décidé de fusionner tous ces documents avec notre base existante de télégrammes et de créer une base de données globale facile à utiliser ».
Sources :
Le moteur de recherche Plus D de Wikileaks
L’article de Forbes
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.