L’exploitation du balisage de documents n’est pas un concept vraiment nouveau : l’industrie aéronautique ou encore le secteur de l’édition utilisaient le SGML (Standard Generalized Markup Language), ancêtre du XML, pour catégoriser les informations de leurs manuels de maintenance ou de leurs dictionnaires. Pour l’industrie aéronautique, le but était de partager un langage commun avec des partenaires, et d’échanger facilement des informations d’application à application. Dans l’édition, il s’agissait de détacher la présentation des données et de les exploiter sous différentes formes. Comme le SGML, XML s’attache à la sémantique en structurant et en qualifiant l’information. Il ne gère pas la présentation.On distingue deux choix dans le stockage d’informations en XML : le premier, orienté documents, facilite la recherche et permet d’extraire tout ou partie des données d’un document pour les exploiter ensuite sous différentes formes ; le second, orienté données, favorise la communication entre applications, dans le cadre notamment des échanges électroniques B-to-B.
Exploiter de l’information sous différentes formes
En d’autres termes, le “typage” des informations opéré par XML permet d’extraire des communiqués de presse, des brochures et plaquettes, des didacticiels, la page d’un site ou encore les caractéristiques d’un produit pour les échanger avec un partenaire à partir d’un même contenu. Il permet encore d’adapter automatiquement le contenu aux caractéristiques d’affichage d’un périphérique en se basant sur le balisage pour sélectionner certaines parties du document, par exemple. Applicable à différents domaines dont, notamment, la gestion de la connaissance, la publication en ligne, au format papier ou sur CD, mais également à la veille concurrentielle et technique, le stockage en XML contribue ainsi à la réduction des coûts de gestion de l’information et favorise la réactivité de l’entreprise. En autorisant de multiples exploitations à partir d’un même contenu centralisé, il évite en effet la redondance de documents et la gestion toujours difficile de modifications qui doivent être répercutées partout où l’information est abordée. Dans ce cadre, la plupart des solutions de stockage de documents en XML implémentent WebDav (Distributed Authoring and Versioning on the web ?” rédaction en collaboration et gestion de versions par le web), norme qui favorise le travail coopératif en permettant à plusieurs collaborateurs de partager les mêmes ressources sur le réseau par le protocole HTTP. Dans sa version actuelle, elle permet déjà de télécharger, d’éditer, de sauvegarder et de publier des documents sur le web. La prochaine mouture, en cours de définition, gérera également le contrôle de versions afin de conserver par exemple un historique des modifications apportées par les différents collaborateurs à un document.
Simplifier la gestion des documents semi-structurés
Centralisés dans une base, ces documents semi-structurés par le balisage peuvent en effet être partagés par l’ensemble des utilisateurs de l’entreprise en fonction des droits propres à chacun. Combinées à des serveurs d’annuaires qui référencent les profils de ces utilisateurs, les bases XML peuvent en effet offrir des vues personnalisées. Le commercial, par exemple, n’accède qu’aux caractéristiques produits tandis que le technicien n’obtient que les parties techniques. Enfin, le stockage au format XML peut également répondre à des contraintes légales, comme le souligne Éric Derbanne, responsable technique des ventes logicielles d’IBM : “Il arrive que l’on soit obligé de garder un document intact pour des raisons juridiques. En le stockant en XML, il est possible de conserver les avantages de la semi-structuration, donc d’effectuer des recherches et des requêtes sur le document sans avoir à ” l’éclater ” dans une base de données relationnelle.”Peu développée dans les entreprises, en raison notamment de la jeunesse des technologies d’intégration B-to-B, l’approche données du XML devrait pour sa part simplifier les échanges électroniques. Considéré comme le remplaçant de tous les langages de l’EDI ?” dont notamment l’Edifact ?”, le XML intervient sur la structuration et la normalisation des données et des procédures d’échange entre applications. Et pour ce faire, il s’appuie sur le concept de “schéma”.Sorte de dictionnaire d’espéranto, le schéma définit un vocabulaire commun à un secteur d’activité. En d’autres termes, il est, en quelque sorte, au XML ce que le Bled est à la grammaire : il définit les balises, la syntaxe et leur cadre d’utilisation. En garantissant un formatage des données selon une sémantique ou un étiquetage commun, il permet à deux applications de se comprendre malgré leur langage différent. Il contribue ainsi à la réactivité des entreprises, qui n’ont plus à développer des mécanismes particuliers pour intégrer leurs applications. Concrètement, les données extraites du PGI de l’entreprise A seront automatiquement converties au schéma du secteur de la sidérurgie par exemple, puis directement “comprises” par le logiciel de GRC de l’entreprise B, qui les intégrera en effectuant une conversion du XML reçu au format propriétaire.Si ce mécanisme d’échange n’implique pas directement le XML en termes de stockage, mais plutôt de format pivot entre applications, il soulève en revanche un autre problème plus directement lié à “la journalisation”des échanges qui, lui, relève du stockage d’événements transactionnels entre applications. Pour Andreas Zeitler, directeur des ventes et du marketing de Software AG, le stockage en XML devient alors indispensable : “Formater et échanger en XML pour ensuite générer des tables relationnelles en bout de course n’a aucun sens. Le référentiel des échanges, indispensable dans le cadre des transactions électroniques ne serait-ce que pour conserver une trace des messages, vérifier que la transaction s’est bien passée, etc., doit être géré en XML. C’est plus logique, car on évite les procédures toujours complexes de mapping XML/relationnel, et aussi plus performant.” Peu d’acteurs de l’intégration encore se sont investis dans cette normalisation de la journalisation d’événements transactionnels entre entreprises. Mais il est vrai que le XML s’est avant tout développé dans la gestion de documents et que son utilisation dans les échanges électroniques n’en est qu’au stade des balbutiements.
Les principales bases de données pour XML | ||||
Éditeur | Produit | Caractéristiques | ||
B-Bop Associates | Xfinity Server | Doté d’un référentiel pour le stockage natif en XML, cet éditeur s’est spécialisé dans le mapping de données relationnelles/XML. Il propose une plate-forme pour passer d’un univers à l’autre en utilisant les standards d’interrogation (XQuery, SQL via JDBC2) et un langage propriétaire pour les développements. | ||
dbXML Group | dbXML Core 4 | Stockage natif XML. Commercialisée sous Licence GNU (LGPL) en open source. Services Corba, outils d’administration, connecteurs JDBC (téléchargement : http://www.dbxml.org/). | ||
E-XMLMedia | Suite de composants | Stockage natif de documents XML. Mapping de données relationnelles/XML. Interrogation XQuery et accès aux SGBDR par SQL via JDBC2. | ||
Excelon | Information Server | Stockage natif en XML sous forme d’arbres DOM, également accessibles par requêtes XQL. ODBC et OLE DB pour l’importation de données relationnelles, outil de mapping et de conception de schémas. Interrogation en XQL. Outils d’administration et de développement pour définir des schémas, gérer et extraire automatiquement différents documents à partir du contenu stocké. | ||
IBM | DB2 UDB – XML Extender | Base de données relationnelle offrant trois possibilités de stockage en XML et des outils de mapping pour effectuer la conversion entre les deux univers. Interrogation en SQL 3 et Xpath. Intégration des schémas XML prévue. | ||
Microsoft | SQL Server 2000-SQLXML 2.0 | Base de données relationnelle ne prenant pas en compte le stockage natif XML. Microsoft complète sa solution avec SQLXML, un kit de développement pour des applications fondées sur le langage XML. L’ensemble autorise le résultat de requêtes SQL en XML, la production de documents bien formés et valides, la mise à jour de données relationnelles à partir de contenus XML, etc. | ||
Oracle | Oracle 9i | Base de données relationnelle offrant trois possibilités de stockage en XML et des outils de mapping pour effectuer la conversion entre les deux univers. Interrogation en SQL 99 et Xpath. Intégration des schémas XML prévue. | ||
Software AG | Tamino XML Server | Stockage natif en XML. Interrogation en XQL. Outils de travail de groupe (WebDav), de mapping relationnel/XML, intégration des schémas XML, services d’annuaire UDDI, intégration à Biztalk et autres MOM, etc. | ||
Sybase | Adaptive Server Enterprise | Base de données relationnelle offrant trois possibilités de stockage en XML et des outils de mapping pour effectuer la conversion entre les deux univers. Interrogation en SQL 99 et Xpath. Intégration des schémas XML prévue. | ||
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.