Depuis 2007, l’équipe de Bertram Nickolay tente de percer les secrets des archives de la Stasi. Ou ce qu’il en reste : plus de 600 millions de morceaux de papier à analyser et à trier pour reconstituer les fiches de millions de personnes, et retrouver les noms et les activités des Allemands de l’Ouest ayant servi la RDA.
Une tâche herculéenne, impossible à réaliser manuellement. Responsable du département Sécurité de l’institut Fraunhofer de Berlin, Bertram Nickolay a pour cela mis au point un dispositif de numérisation automatique associé à un puissant logiciel. Il a répondu à nos questions.
En quoi consiste votre processus de reconstitution automatique ?
Il suit plusieurs étapes selon la logique d’un puzzle. Les fragments de papier sont lissés pour être numérisés recto verso avec un scanner spécial. Ensuite, l’ordinateur trie les extraits en fonction de différents paramètres comme la couleur, la forme, la texture, mais aussi le fait que cela soit écrit à la main ou à la machine, etc. Une des étapes du partitionnement des données consiste à prétrier de manière électronique les morceaux de papier qui ont des caractéristiques similaires, avant de commencer l’assemblage à partir de la forme proprement dite. L’installation pilote actuelle est capable de traiter deux sacs par jour.
Comment êtes-vous équipés ?
Les algorithmes nécessitent beaucoup de ressources en calcul. C’est pourquoi on utilise un système de serveurs avec une grille de calcul pour la reconstitution des informations. Le matériel informatique est conçu de façon très modulaire pour obtenir une extensibilité optimale du système. Une quinzaine de scientifiques sont occupés au développement de la technologie et une dizaine de collaborateurs s’occupent du process de reconstitution.
Quel type de scanner utilisez-vous ?
Les scanners du marché courant n’étaient pas assez rapides et sensibles. Nous avons dû développer notre propre scanner en coopération avec la société Arvato Services [qui appartient à Bertelsmann AG, NDLR].
Vous avez commencé une phase pilote de 400 sacs en 2007. En êtes-vous satisfait et qu’avez-vous découvert ?
La phase pilote se déroule très bien. Le but est de la clôturer fin 2011. Les difficultés principales concernent la technique pour scanner et l’interprétation des documents. L’ordinateur est capable de distinguer 20 paramètres différents pour reconstituer une page, il faut maintenant qu’il puisse retrouver l’ordre des textes.
[Bertram Nickolay n’est pas habilité à parler du contenu des documents reconstitués, NDLR].
Quelles sont les applications possibles dans d’autres domaines ?
Il y a trois grands domaines d’application : la sécurité, le patrimoine culturel mondial et l’archéologie. Nous avons ainsi assemblé des documents déchirés à la main ou détruits par des broyeurs pour les autorités financières et criminelles.
On nous a également sollicité après l’effondrement de la maison des archives municipales de Cologne en 2009, qui contenait de véritables trésors comme des manuscrits du XIVe siècle. Les documents ont été numérisés et reconstitués. Et nous travaillons actuellement à la transposition en 3D de la technologie de reconstruction d’objets cassés en archéologie. Nous sommes amenés à travailler dans tous ces domaines avec de nombreux pays de l’Union européenne, mais aussi d’Amérique latine et des ex-pays de l’Est comme l’Ukraine.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.