Ceux qui disposent d’une enceinte connectée chez eux le savent : les assistants intelligents de ces appareils se déclenchent régulièrement par accident, au détour d’une conversation ou d’un film à la télé.
En effet, ces logiciels ont parfois du mal à bien reconnaître leurs mots-clés, tels que « Okay Google » ou « Dis Siri ». Le problème, c’est que chaque activation provoque un enregistrement de l’environnement sonore, et que cet enregistrement peut se retrouver sur les serveurs d’un géant du Net.
Des chercheurs de Northeastern University et de l’Imperial College London ont voulu en savoir davantage sur ces erreurs de compréhension des assistants intelligents. Ils ont achetés sept enceintes intelligentes, à savoir un Google Home Mini 1ère génération, un Apple HomePod, un Harman Kardon Invoke by Microsoft, deux Amazon Echo Dot 2e génération et deux Amazon Echo Dot 3e génération.
Les appareils ont été abreuvés de séries Netflix
Ces appareils ont été placés dans une boîte dans laquelle étaient diffusées sans interruption des bandes sons de séries Netflix. Ils ont été filmés en permanence pour savoir quand leurs assistants se réveillaient. Leurs flux réseau ont par ailleurs été surveillés pour voir si des données étaient transmises aux différents clouds.
Les premiers résultats de ces expériences confirment le manque de fiabilité de ces assistants. Pas un jour ne s’est passé sans qu’ils ne se soient déclenchés au moins une fois par accident. Le nombre d’erreurs par jour varie entre 1,5 et 19. Les appareils qui se trompent le plus souvent sont le HomePod et le Harman Kardon.
Les activations les plus longues ont été constatées pour l’Echo Dot 2e génération et le Harman Kardon (20 à 43 secondes). Par ailleurs, plus de la moitié des activations accidentelles du HomePod et des Echo Dot durent plus de six secondes. Le risque que ces appareils enregistrent des éléments sonores sensibles est donc élevé.
Sans surprise, ces déclenchements erratiques surviennent quand les mots des dialogues Netflix ressemblent de près ou de loin à des mots clés : « Hey Sorry » au lieu de « Hey Siri » (en anglais), « I can work » au lieu de « Okay Google », « Colorado » au lieu de « Cortana », « Kevin’s car » au lieu de « Alexa ». Bref, les systèmes de reconnaissance vocale de ces appareils sont encore loin d’être vraiment performants.
Cette étude n’est pas finie. Prochainement, les chercheurs compléteront leur rapport avec d’autres résultats. En particulier, on saura combien de ces enregistrements accidentels ont été envoyés vers le cloud. L’affaire est à suivre.
Source : Mon(iot)r Research Group (via ZDnet)
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.