Passer au contenu

Un algorithme pour identifier les buzz à venir sur Twitter

Quand un sujet de discussion devient populaire sur Twitter, c’est toujours selon certaines règles, qu’un chercheur du MIT vient d’identifier et qui permettent d’avoir un coup d’avance.

Identifier à l’avance les sujets qui seront les plus populaires sur Twitter, c’est la découverte de Devavrat Shah, chercheur au Massachusetts Institute of Technology (MIT), dont le nouvel algorithme pourrait s’appliquer à d’autres domaines comme la Bourse, a-t-il déclaré à l’AFP. Devenus un véritable pouls des conversations mondiales, les sujets les plus populaires sur Twitter, également appelés « trending topics » en anglais ou « TT », se présentent sous la forme d’un ou plusieurs mots précédés ou non du signe dièse (ou hashtag).

Consultable au niveau global, par régions, pays ou même villes, ce classement évolue constamment au gré de l’actualité ou des tendances lancées par des personnes influentes sur les réseaux sociaux. Ainsi, en cette période d’élection présidentielle américaine, « Barack Obama » ou « #USA2012 » figuraient mercredi en tête des mots-clés les plus populaires en France et ailleurs.

Prédiction 1h30 à l’avance

Ces mots-clés sont calculés en interne par Twitter en fonction du nombre de personnes qui parlent d’un même sujet à un moment donné sur le réseau social. L’algorithme découvert par Devavrat Shah, professeur d’informatique de 35 ans né en Inde, et son étudiant Stanislav Nikolov, permet de définir ces sujets avec « 1H30 d’avance, en moyenne » et un taux de pertinence de 95%, a-t-il assuré à l’AFP par téléphone.

A partir d’une base de données de 200 sujets populaires et 200 autres peu relayés à un instant T, l’algorithme compare chaque nouveau sujet et lui attribue un taux de probabilité de devenir populaire, a-t-il expliqué en substance. « La manière dont les êtres humains réagissent obéit à des caractéristiques bien particulières (et) il y a assez peu de façons différentes pour un sujet de devenir populaire sur Twitter », a-t-il souligné.

« Les sujets peuvent être liés à un événement, comme un concert de Justin Bieber ou l’équipe de France qui bat l’Italie. Mais ils peuvent aussi avoir d’autres origines (et) avoir gagné lentement en popularité avant de devenir une tendance », a poursuivi celui qui présentera sa découverte en public vendredi 9 novembre au MIT, prestigieuse université de recherche scientifique et technologique basée à Cambridge, près de Boston. « Nous avons donc transformé cela en modèle mathématique », a-t-il ajouté, relevant que « les choses simples sont celles qui marchent le mieux ».

Applicable à tout type de données

Dans un communiqué, le MIT estime que cette nouvelle approche de l’analyse statistique pourrait, en théorie, s’appliquer à n’importe quel type de données qui varient dans le temps, comme la durée d’un trajet en bus, les ventes d’entrées de cinéma et même le marché boursier. « C’est plus une méthode qu’un algorithme destiné à un seul usage. Les applications sont multiples. Il n’y a rien de concret pour l’instant mais ça promet d’être intéressant », a répondu M. Shah sur une éventuelle utilisation de sa découverte par Twitter.

A première vue, Sébastien Lefebvre, Pdg et fondateur de Mesagraph, société qui édite des solutions de gestion et d’analyse des médias sociaux, émet quelques réserves. « L’algorithme des trending topics de Twitter, ce n’est pas quelque chose qui est inscrit dans le marbre et auquel on puisse se fier dans la durée. Rien ne dit qu’il n’évoluera pas, comme a évolué celui de Google », a-t-il dit à l’AFP.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Tupac Pointu (AFP)