Passer au contenu

Xyleme veut faciliter la recherche de documents XML

La start-up française Xyleme lance une gamme d’outils dédiés à l’archivage, à l’indexation et à la recherche de documents XML multisources.

Issue d’un essaimage de l’Inria, la start-up Xyleme s’est fait une spécialité de l’archivage, du classement et de l’interrogation de documents XML. Ses outils visent à faciliter la recherche et l’intégration de contenus XML, produits par l’entreprise et provenant de son environnement externe (Web, sources d’informations payantes, etc.).” La force de notre technologie est d’apporter une dimension sémantique au XML et d’en comprendre les différents dialectes “, analyse Régis Nacfaire, directeur général de Xyleme. Ainsi, la technologie de Xyleme permet de comprendre le contenu d’un document XML et de lui associer un contexte.” Le XML possède déjà une dimension sémantique par essence, définie par les balises qui structurent les documents. Mais au sein d’une même entreprise, pour un même type de contenus, on peut trouver des définitions de balises différentes selon les documents XML “, explique Sophie Cluet, directrice recherche et développement au sein de Xyleme.

Dictionnaires métiers et intelligence artificielle à la rescousse

Pour résoudre ce problème, Xyleme définit avec l’entreprise une structure de document XML idéale par rapport au type de contenus qu’il recherche, puis établit une table de correspondance entre cette structure idéale et les multiples structures réelles des documents XML de l’entreprise.Ainsi, chaque requête dans la base documentaire cible la structure idéale de document, puis est traduite en de multiples requêtes réelles, adaptées à la structure véritable des différents documents XML. Les rapprochements effectués entre le contenu et la structure du document XML idéal et ceux des multiples documents XML réels sont réalisés à l’aide de dictionnaires métiers et d’algorithmes d’intelligence artificielle, selon Sophie Cluet.Xyleme se joue ainsi des différences entre les dialectes XML : “le client rentre ses documents XML structurés, le système élabore par lui-même des schémas d’indexation des documents”, ajoute Sophie Cluet.

Des produits testés depuis deux ans

Le catalogue de produits de Xyleme compte trois types d’offres : Zone Server, News et Tracker.Xyleme Zone Server est la plate-forme technologique nécessaire au stockage, à l’indexation et à l’interrogation d’une base de documents XML. Xyleme News est conçu pour répondre aux besoins des entreprises de presse. Depuis deux ans, l’Agence France Presse (AFP) utilise la solution de Xyleme pour les besoins documentaires de ses journalistes.Enfin, Xyleme Tracker recherche sur le Web les différentes copies réalisées à partir d’un document XML source. Son débouché principal est la traque aux copies illégales de documents, diffusées sur le Web.Le logiciel de base ?” Zone Server sur un serveur monoprocesseur?”  est facturé 200 000 euros pour l’octroi d’une licence d’utilisation de trois ans, comprenant des prestations de services.Xyleme finalise actuellement un second tour de table d’environ 6 millions d’euros. La start-up compte atteindre l’équilibre à la fin de l’année 2003. Ses premiers clients sont : l’AFP, la Bibliothèque nationale de France (pour son projet darchivage du Web) et la société de référencement Netbooster.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Antonin Billet