Passer au contenu

Données XML : le relationnel résiste

Les éditeurs proposent deux modes de stockage pour les fichiers XML : des bases purement XML ou des SGBDR classiques qui pérennisent les systèmes existants.

L’utilisation de plus en plus fréquente d’XML en entreprise a poussé les éditeurs de bases de données relationnelles à adapter leurs produits ou à en proposer de nouveaux. Premier constat : bien que performants, les SGBD natifs XML sont loin de remplacer complètement les SGBDR traditionnels équipés de convertisseurs. Contrairement à ces derniers, les SGBD XML, à l’exemple de Tamino de Software AG, sont réservés à des usages spécifiques : stockage de documents, de factures ou de bons de commande. Dans ces domaines, ils offrent des performances inégalées.

Les SGBD XML, plus efficaces quand il n’y a pas d’existant

“XML s’imposait pour nos besoins, explique Hervé Tisserand, directeur général d’Altaprofits, spécialiste de l’assurance-vie sur le web. Nous devions agréger de nombreuses sources de données sur notre site et, surtout, pour des raisons juridiques, conserver dans son intégralité le formulaire XML qui constitue le contrat client. En tant que start-up, nous n’avions pas à nous soucier de l’existant, et avons donc choisi Tamino.” Pour Pascal Guarrera, responsable Information du Forem, l’agence nationale belge pour l’emploi, la problématique est quasiment similaire : il s’agit de conserver des documents électroniques – en l’occurrence les CV des demandeurs d’emploi – pour les diffuser sur le web et les mettre en relation avec les offres. “Nous avons choisi Tamino pour arriver à de meilleurs résultats. En plus, la structure d’un CV [expérience, études, etc. , Ndlr] est assez difficile à stocker dans une base relationnelle. Tamino permet vraiment une approche orientée documents.”La structure des données dans une base XML est radicalement différente de celle que l’on rencontre dans les bases de type relationnel. Les informations sont, en effet, regroupées dans des fichiers composés de balises hiérarchiques et non pas réparties dans des tables différentes. “Le XML natif offre un accès direct à la totalité du fichier “, poursuit Pascal Guarrera, qui s’avoue satisfait de son choix : “Aucun mécanisme intermédiaire ne vient ralentir les accès. Bien sûr, la taille du document entre quand même en jeu.” Ici, un demandeur d’emploi saisit son CV dans un formulaire électronique et celui-ci est automatiquement stocké dans la base, avec ses pièces jointes. “Une base XML nous permet d’accroître de façon importante les temps de réponse de notre site “, se réjouit Hervé Tisserand. Il en demeure tout de même que la cohabitation d’une base XML avec une base relationnelle, comme le fait par exemple le Forem, reste un exercice difficile. “Certaines offres d’emploi nécessitent d’extraire des informations de notre SGBDR pour les placer dans Tamino “, explique Pascal Guarrera, qui a dû construire des correspondances entre les nomenclatures utilisées dans le système central et Tamino.Face à la déferlante XML, quelques éditeurs de bases relationnelles, tel Oracle, réagissent en adaptant leurs produits à cette nouvelle technologie. En effet, les éditeurs de SGBDR équipent leurs logiciels de convertisseurs qui extraient le contenu des balises, l’interprètent, puis le classent dans des tables différentes. Une autre possibilité consiste à créer des types de données correspondant à la structure des documents XML à stocker. C’est cette démarche qui a d’ail-leurs convaincu la Délégation générale pour l’armement (DGA), puisqu’elle a adopté une solution de stockage de documents XML intégrée à Oracle8i.

Utiliser des types de données équivalents à la structure XML

Le portail Internet de la DGA publie des dépêches de presse envoyées par l’AFP sous forme de documents XML. Elles sont récupérées par un logiciel spécialisé fourni par Oracle, qui se charge de les stocker dans des champs dont le type reprend la structure des documents (en-tête, date, texte). En sortie, un autre utilitaire, également d’origine Oracle, récupère ces informations, les soumet à une feuille de style XSL et les publie sur le site en HTML. Le procédé reste moins rapide qu’avec une base de données native XML, mais, revanche, la mise en ?”uvre n’a pris que trois à cinq jours, contrairement à l’installation d’une nouvelle base XML.Schlumberger, pour sa part, utilise une autre méthode pour stocker ses documents XML dans une base Oracle architecturée autour de SigmaLink de l’éditeur allemand Empolis. “SigmaLink est une mécanique de stockage de documents XML dans une base Oracle8i, précise Louis-Pierre Guillaume, directeur de projets chez Schlumberger. Une couche Java gère les documents XML, aidée en cela par l’interpréteur idoine et un moteur de recherche pour le texte. Nous nous en servons pour gérer tous les fichiers constituant les documentations techniques utilisées pour les forages pétroliers.”SigmaLink stocke le document XML lui-même ainsi que les fichiers multimédias (vidéos, animations Flash) dans un Blob (Binary Large OBject), tandis que les données texte et les métadonnées contenues dans le fichier sont réparties dans les tables de la base Oracle8i. “C’est vrai, la couche Java ralentit les temps d’accès, mais cela n’a pas d’incidence pour nous. Nous n’utilisons pas SigmaLink pour faire du transactionnel. L’usage type consiste à sortir un document de la base, à travailler dessus en local et à le remettre ensuite en place. Nous n’avons pas vraiment besoin de puissance brute, même si 400 utilisateurs accèdent à la base en permanence depuis 20 bureaux d’études dans le monde.”Oracle a pris les devants : la prochaine version de son SGBDR Oracle9i comprend les outils nécessaires à la gestion des données XML. Les mécanismes de requêtes adaptés sont déjà, en cours de développement.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Olivier Bibard