Passer au contenu

Un format universel pour décrire les données

Avec sa capacité à représenter les données dans un format neutre, XML fournit un socle sémantique aussi indispensable que l’Ascii hier.

Le W3C définit XML (eXtensible Markup Language) comme “une syntaxe de bas niveau qui permet de représenter des informations de façon structurée. Il a été conçu pour rendre possibles la création, la manipulation et le partage de documents complexes sur le web.Il pallie ainsi les défauts de HTML (qui mélange données, traitements et présentation) et la complexité de SGML (Standard Generalized Markup Language), dont il est issu. XML est capable de définir d’autres langages de balisage – on parle de métalangage – et de stocker des informations structurées.En séparant le sens des données, il permet à tout ordinateur ou être humain possédant la grille de lecture adéquate – une DTD (Document Type Definition), un schéma XML, ou une connaissance implicite du vocabulaire – d’interpréter les données stockées dans un fichier XML.Chaque entreprise peut alors définir son propre vocabulaire et les règles grammaticales associées pour décrire, stocker et manipuler ses données. Pour s’échanger des informations, deux partenaires devront s’entendre sur le choix d’un schéma XML. Le langage du W3C est ainsi un middleware universel, qui respecte les standards du web.Chaque information stockée dans un document XML est formellement identifiée par un jeu de balises décrites et typées dans un document connexe : le schéma XML ou la DTD. C’est le dictionnaire qui permet d’interpréter les informations. Un document XML ne comportant pas de directives de présentation, on peut lui associer une feuille de style pour afficher les données ou les transformer dans un format particulier.Ces règles de transformation sont normalisées par XSLT (XSL Transformation) – un langage écrit en XML. Ce processus de transformation poursuit deux objectifs : l’échange des données normalisées entre deux applications et la présentation des informations dans tout format (HTML, PDF, WML, etc. ).

SAX et DOM, deux façons d’interpréter XML

XML reposant sur un modèle objet, on peut atteindre précisément n’importe quel donnée ou jeu de données d’un document. XPath standardise la façon d’y accéder.Réunis au sein de la recommandation XSL (eXtensible Stylesheet Language), XPath, XSLT et XSL-FO sont les mécanismes de base qui permettent de manipuler les données.Cette manipulation peut aussi s’effectuer par programmation au travers de l’API DOM ( Document Object Model). On dispose de deux types de ” moteurs ” pour appliquer une transformation à un document. SAX est un ” parser ” (analyseur) séquentiel, qui interprète le document XML au fur et à mesure et lui applique des règles de transformation au fil de l’eau.D’autres parsers s’appuient sur DOM et peuvent appliquer les transformations, en bloc, sur un jeu de données préalablement sélectionné.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Frédéric Bordage