Passer au contenu

Quand les informations hétéroclites peuvent enfin avoir du sens

Pour gérer l’excès d’information, Stratify propose une solution qui débusque, analyse et hiérarchise les données non structurées. Un programme grâce auquel la société californienne a séduit In-Q-Tel, capital-risqueur de la CIA.

A l’inverse du monde réel, trop souvent caractérisé par le manque, l’espace informationnel est souvent présenté comme celui de l’abondance. Début 2001, l’internet public contenait plus de 4 milliards de pages. Aujourd’hui, nous en sommes à 6 milliards. Selon IDC, en 2002, 15 milliards d’e-mails envahiront chaque jour les boîtes aux lettres des entreprises (contre 3,5 millions en 1999).Hal Varian, doyen de la School of Information Management and Systems de l’université de Californie à Berkeley, résume ainsi le problème : “La production annuelle mondiale totale d’information unique s’élève à 250 mégaoctets [soit à peu près le contenu de 500 livres de taille moyenne, ndlr] pour chaque homme, femme et enfant sur terre. Nous coulons dans une mer d’informations.”Illustration dramatique du phénomène : les autorités américaines, capables d’intercepter toute communication sur la planète, disposaient peut-être de l’information, mais n’ont pu prévenir les attaques du 11 septembre. C’est en partie pour cela que In-Q-Tel, le capital-risqueur de la CIA, vient d’investir plus d’1 million de dollars (1,15 milliard d’euros) dans Stratify, une société californienne spécialiste des données non structurées.Les entreprises ne sont pas mieux armées que la CIA. S’appuyant sur une étude menée par IBM, Stratify estime qu’à peine 15 % des données utiles sont structurées, c’est-à-dire quantifiables, présentes dans des bases de données. Il s’agit surtout d’informations concernant la production, les performances des départements, les coûts, etc. Mais le reste, soit 85 %, est fait de courriers électroniques, de présentations Powerpoint, de documents, de lettres, voire de pages web. Des documents qui contiennent des informations essentielles, mais qui ne sont que partiellement exploitées. Faute de savoir exactement ce qui se trouve dans cette masse informe, les entreprises fondent leurs décisions sur les informations structurées dont elles disposent. “Ça leur permet de répondre à des questions tactiques, alors qu’elles devraient consacrer plus de temps aux problèmes stratégiques”, déplore Nimish Mehta, PDG de Stratify. “Il n’y a pas de méthode d’accès structurée à l’information non structurée”, affirme-t-il. Pour résoudre le problème, Stratify, qui aspire à devenir l’Oracle des données non structurées, propose un programme baptisé Discovery System.

Une hiérachie souple

Capable de lire la plupart des formats, il analyse d’abord les documents utilisés par la société, puis, s’appuyant sur plusieurs méthodes de classification, il les organise en catégories et propose une hiérarchie correspondant aux besoins réels. Mais toute classification a ses limites : les besoins d’une entreprise changent. Discovery System permet donc aux utilisateurs de modifier les définitions, d’ajouter ou d’éliminer autant de concepts qu’ils le souhaitent.Enfin, Discovery System présente les documents classés dans une interface familière, proche de certains moteurs de recherche. La cohérence de l’ensemble est donnée par un serveur qui assure l’accès aux documents décrits en XML.Pour Nimish Mehta, la solution de Stratify “permet de tout prendre en compte et de le réduire de façon intelligente”. “Grâce à nous, se félicite-t-il, les sociétés auront plus d’informations disponibles et seront capables de prendre de meilleures décisions.” Reste à savoir si le paradoxe qui consiste à résoudre le problème de l’excès d’information en prenant en compte un univers toujours plus vaste, quitte à mieux l’organiser, est autre chose qu’un nouveau rêve d’informaticien.* à San Francisco

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Francis Pisani*