En réponse aux API livrées par Google, l’éditeur Inktomi fournit aux entreprises Search Toolkit, un moteur de recherche en langage naturel portant sur des documents structurés ou non. Ces requêtes s’effectuent sur une base contenant le référentiel XML fourni dans un kit. Outre ce référentiel, qui indexe tous les documents traités, le kit comprend le moteur de recherche proprement dit, ainsi que les langages de requête Xpath et Xquery. Fondées sur XML et HTTP, ces API développées en Java sont conçues pour s’intégrer à la plupart des applications d’entreprise et à nombre d’environnements. La majorité des langues européennes et asiatiques sont acceptées, ainsi que tous les documents de type unicode. Outre XML, plus de 225 autres formats de données sont gérés : HTML, PDF et la totalité des documents issus de Microsoft Office.
Des requêtes affinées
L’utilisation de Xquery et de Xpath permet des recherches plus précises : phrase complète, mots fragmentés, format des documents, structure des documents incluant des données et une date limite… Une recherche par champ, au sein d’une base de données (XML entre autres) est aussi possible. Le résultat peut être un document entier ou même un extrait contenant l’information attendue. Il ne reste plus qu’à attendre le prix de ses API.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.