Passer au contenu

Les probabilités affûtent la sagesse des logiciels

Lente révolution : les modèles bayésiens étendent peu à peu leur emprise dans l’industrie des logiciels. Pour que demain, ces derniers se mettent à douter, à supposer et à s’adapter aux nouveaux besoins.

Le constat est sans appel : en un demi-siècle, l’informatique n’a guère évolué. Elle prête encore allégeance au saint triumvirat calculer-analyser-traiter pour accomplir sa tâche : travailler de l’information et comprendre des données. Elle le fait plus vite et avec moins d’intervention humaine, mais l’ordinateur reste ni plus ni moins qu’une machine à calculer.Les systèmes experts, très prisés dans les années quatre-vingt, sont l’illustration de cette vocation. Ces logiciels sont programmés en accumulant les connaissances d’un expert. Confrontés à un problème, ils généreront des inférences combinatoires pour apporter la meilleure solution.

Des limites dues au système expert

Leur limite est double : en amont, la phase de collecte des connaissances conditionne la qualité du traitement. Le système expert ne saura affronter que des cas de figure présents dans sa base de connaissances. D’autre part, à la différence d’un expert humain, le système ne saura profiter de son expérience. De ce constat est née, au début des années quatre-vingt-dix, l’idée d’introduire l’incertitude dans ces systèmes. À l’origine, un chercheur de l’Ucla (l’Université de Californie à Los Angeles), Judea Pearl, part de la théorie des probabilités de Thomas Bayes, un mathématicien du XVIIIe siècle, et intégre ses réseaux dans les systèmes expert. Le principe : ajouter l’évaluation à la volée des probabilités d’occurrence d’un événement. Le traitement de problèmes par un système expert ne sera plus uniquement statistique et déterministe ?” tel événement implique tel fait ?” mais tiendra compte de l’incomplétude. “La description du monde réel est abstraite. On ne peut tout décrire car il y a toujours des variables. Dans une approche bayésienne, on ne les masque pas. On les intègre et on travaille avec. Le tout est représenté par un ensemble de probabilités qui traduit l’incomplétude en incertitude”, explique Olivier Lebeltel, chercheur en robotique à l’Inria (Institut national de recherche en informatique et automatique), spécialisé dans la modélisation bayésienne. Le gain n’est pas moindre. La programmation d’un réseau bayésien est bien moins longue et coûteuse qu’un système expert qui ne saurait traiter aussi rapidement le même problème, et ce dernier système n’aurait aucune possibilité d’adaptation.“Le réseau bayésien repose sur la théorie des probabilités et des graphes de causalité. Ces derniers décrivent l’interdépendance des événements. C’est la partie qualitative du réseau. La théorie des probabilités sert à quantifier”, précise Patrick Naïm, fondateur et PDG d’Elseware, société française éditrice d’outils d’analyse et de datamining basés sur les réseaux bayésiens et auteur d’un ouvrage de référence sur le sujet. “Les réseaux bayésiens ont deux aspects : la construction du modèle et son utilisation, ajoute Patrick Naïm. Le modèle ?” un graphe et des probabilités ?” soit on le demande aux experts, soit on l’obtient des données. L’utilisation du modèle se nomme l’inférence. C’est là que réside la capacité d’adaptation du réseau : les probabilités sont révisées en fonction des nouvelles données.”Du fait de leur modèle non figé, les réseaux bayésiens sont peu gourmands en ressources. Dans la communauté des chercheurs, leur efficacité et la pertinence de leurs résultats sont reconnues. Mais demeurent rarement évoqués dans le monde informatique et dans l’industrie. “S’il n’y a pas eu beaucoup d’applications de marché de cette technologie, c’est parce qu’il est difficile de communiquer sur le rôle des réseaux bayésiens”, avance Philippe Baumard. Cet enseignant-chercheur, membre de la direction stratégique de France Telecom, et lauréat du prix Anvar de l’innovation en 2001, évoque les difficultés de présenter les réseaux bayésiens aux industriels. “Mais c’est l’année du bayésien”, affirme-t-il. Microsoft s’y intéresse depuis le début des années quatre-vingt-dix.Sûr de son flair, il se risque à des prévisions : “L’avenir est aux technologies de gestion de la relation client basées sur ces modèles, seuls capables d’apprendre le comportement du consommateur à la volée, au fur et à mesure de son apprentissage.” Les réseaux bayésiens sont toutefois déjà utilisés. La diffusion dans l’industrie s’est faite via le diagnostic de pannes moteur. La société Knowledge Industries, fondée en 1989, a connu dans ce domaine ses heures de gloire au début des années quatre-vingt-dix. Une réussite qui a conduit à son rachat par Microsoft en 1994. Son produit DXpress sert dans les secteurs automobile et aéronautique.La compagnie SAS utilise ces réseaux, développés avec les outils du Danois Hugin, dans le cadre de la maintenance de ses moteurs et la détection de pannes dans ses systèmes de logistique. Les compagnons d’aide de la gamme Office de Microsoft fonctionnent sur un modèle bayésien. Prochaine étape : la business intelligence et le décisionnel. Plus ambitieux, des chercheurs de l’Insa (Institut national des sciences appliquées) devraient créer cette année une start-up dont l’objectif est la mise au point d’un ordinateur bayésien.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Christophe Dupont