Passer au contenu

(Mise à jour) L’Europe veut un débat sur sa bibliothèque numérique

Six chefs d’Etat européens écrivent à Jose Manuel Durao Barroso, président de la Commission de Bruxelles, pour la mise en chantier d’un projet paneuropéen de numérisation des savoirs.

Précédente parution le 17/03/2005

Les grandes bibliothèques se préparent à la guerre numérique


Titillé dans son orgueil par l’annonce de Google de mettre en ligne le contenu des principales bibliothèques anglo-saxonnes, Jacques Chirac veut numériser le savoir européen et fera bientôt des propositions à
ses homologues. Mais à ce jour, la Bibliothèque nationale de France n’a mis en ligne que 100 000 ouvrages en dix ans. Techniquement long, ce travail ne se fera pas sans une augmentation massive des investissements.
Selon le président de la République, Jacques Chirac, la numérisation des grandes bibliothèques d’Europe est un ‘ enjeu fondamental ‘ pour la diversité culturelle. Il a
d’ailleurs reçu, mercredi 16 mars, Renaud Donnedieu de Vabres, ministre de la Culture, et Jean-Noël Jeanneney, président de la Bibliothèque nationale de France (BNF). Leur mission sera ‘ d’analyser les conditions
dans lesquelles les fonds des grandes bibliothèques en France et en Europe pourraient être rendus plus largement et plus rapidement accessibles sur Internet ‘.
Afin que le président puisse, dans les semaines qui viennent,
faire des propositions à ses homologues de l’Union européenne pour coordonner leurs efforts de numérisation. Un effort qui demandera une vraie mobilisation.Pourquoi cet intérêt soudain de l’Élysée pour la virtualisation des documents ? Tout simplement pour répondre à Google. Le moteur de recherche américain a annoncé en décembre dernier son intention de créer une
bibliothèque virtuelle regroupant celles de trois grandes universités américaines (Harvard, Standford, Michigan), celle d’Oxford au Royaume-Uni ainsi que la
bibliothèque municipale de New York. L’ensemble, soit une quinzaine de millions d’ouvrages tombés dans le domaine public, serait en ligne en 2015 pour un coût estimé entre 110 et 150 millions d’euros.

‘ Un travail colossal ‘

Craignant que la culture mondiale ne soit dominée par le monde anglo-saxon, Jean-Noël Jeanneney rêvait dès le mois de février dernier d’une
grande initiative européenne et annonçait la mise en ligne d’ici à 2006 de
22 titres de la presse quotidienne française parus entre 1823 et 1994.Du rêve à la réalisation, le chemin sera pourtant long, tant du côté américain que de ce côté-ci de l’Atlantique. Pour Bruno Couderc, président de l’Aproged (Association des professionnels de la gestion électronique de
documents), ‘ la numérisation d’une bibliothèque est un travail colossal ‘.Selon lui, ce n’est pas tant la numérisation elle-même qui pose un problème, même si certains ouvrages rares et fragiles requièrent des méthodes de scannage sans contact. ‘ Le plus délicat est de trouver la
bonne méthode d’indexation pour répondre aux attentes du grand public sans alourdir le processus ‘,
explique-t-il. Sous peine d’être incapable de s’y retrouver avec des milliers de résultats à chaque requête. Et sans
biaiser les résultats de recherche. ‘ On pourrait omettre certains mots-clés ou créer des rapprochements de sens hasardeux. ‘ Par exemple, le mot ‘ boisson ‘ pourrait ramener
vers une marque comme Perrier.

Six mois pour mettre un ouvrage en ligne

À la Bibliothèque nationale de France, le problème ne se pose pas. Depuis le lancement de sa version virtuelle,
Gallica, en 1997, tous les ouvrages numérisés sont indexés suivant le contenu de leur table des matières. Tout simplement, car ils sont numérisés page par page sous forme d’image au format PDF.
Pour numériser les textes et pas les pages, il faudrait reconnaître les caractères dans chaque feuille, ce qui est beaucoup plus lourd.‘ Une numérisation au format texte avec une recherche par mots-clés coûterait dix fois plus cher, assure la porte-parole de la Bibliothèque. Nous ne le ferons que pour certains titres de
presse quotidienne. ‘
Et le processus est loin d’être rapide. Sur les 12 millions d’ouvrages présents dans le fonds de la BNF, seul 100 000 ont été numérisés en dix ans. Il faut six mois pour choisir
l’ouvrage, en retrouver un exemplaire intact, le numériser, l’indexer et le mettre en ligne !Pourtant, l’administration y consacre environ un million d’euros par an, afin de payer des prestataires extérieurs et les 30 salariés qui travaillent à temps plein sur ce sujet. Trois autres millions seront désormais
consacrés tous les ans à la numérisation des journaux. Loin des sommes récoltées, sur des fonds privés, par Google.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Stéphanie Chaptal