Initié en 2007 et partiellement financé par l’Union européenne, à hauteur de 8,4 millions d’euros sur 12,3 millions au total, le projet Shaman vient de publier son rapport final, après avoir atteint son objectif à la fin de l’année 2011. Son but était de résoudre le problème de la perte de mémoire informatique grâce à une « structure qui fait de la conservation numérique une réalité pour quasiment n’importe quel format de données ». Non seulement les données seront donc préservées mais elles seront « lisibles, accessibles et utilisables par les générations futures », précise Ruben Riestra, le coordinateur du projet.
Structuration
Le projet Shaman adopte une approche holistique, globale, du problème de conservation des données, ce qui permettra entre autres l’intégration de l’architecture de référence Shaman (SRA en anglais) dans celle de n’importe quelle organisation. Pour y arriver, le framework Shaman propose des outils d’analyse, de gestion, de contrôle d’accès et de réutilisation des informations et données au travers de différentes archives et librairies documentaires.
Ainsi, pour conserver une vidéo, il n’est pas possible de ne stocker que le fichier. Il est nécessaire de pouvoir « appliquer ou réappliquer les processus de post-production pour chaque image de la vidéo », explique le coordinateur du projet.
Page d’accueil du projet Shaman.
Structure d’hébergement
Et pour le stockage à proprement parler, Ruben Riestra indique qu’il n’est pas encore possible de compter sur le cloud, qui propose trop de technologies immatures, car dans la préservation des données électroniques, l’ennemi est le temps. Avec toutes les « migrations (que cela implique) au fil du temps, l’obsolescence du matériel et du logiciel ». La solution retenue touche au GRID computing plus éprouvé. « Pour le futur, nous avons besoin de solutions robustes, sur le long terme, qui peuvent sécuriser des données et métadonnées dans de nombreux formats », précisait-il.
Mises en application
Trois prototypes de ce projet ont déjà été déployés. Un en association avec la bibliothèque nationale allemande, un deuxième dans un contexte industriel, qui a permis d’améliorer l’efficacité des processus ainsi que les temps de sauvegarde et de s’assurer du bon respect du droit. Car dans le domaine industriel, la question de l’authenticité du document est souvent essentielle, tout comme le contrôle des droits d’accès. Le troisième essai s’est déroulé dans le secteur des sciences, qui génère beaucoup de données qu’il faut pouvoir classer et consulter pendant longtemps.
Le projet Shaman devrait désormais trouver d’autres applications. Mais dans un monde de données de plus en plus abondantes – open data en tête – ce projet a forcément un bel avenir.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.