Pour affiner l’oreille d’Alexa, des milliers d’employés ont accès aux interactions sonores qu’elle a avec les usagers. Selon le site Bloomberg, la firme de Jeff Bezos stocke les requêtes vocales faites aux enceintes Echo dans une base de données gigantesque pour les faire analyser ensuite par des humains. L’objectif est d’augmenter les performances de l’assistant vocal d’Amazon en l’habituant au « langage naturel ».
Dans cette enquête, sept employés d’Amazon qui faisaient partie de ce programme témoignent. L’écoute est sous-traitée. Les conservations sont suivies par des prestataires dans différents pays comme le Costa Rica, les États-Unis, l’Inde ou encore la Roumanie. Chaque auditeur de l’ombre écouterait un millier d’extraits sonores par jour, et ce, pendant en moyenne neuf heures. Ils retranscrivent, annotent, isolent les termes complexes, et échangent leurs résultats avec leurs collègues sur une messagerie en interne. Certaines font l’objet de moqueries, selon Bloomberg.
Une écoute non-anonymisée
La mission de ces employés est de pallier les lacunes de la machine. Par exemple, deux témoins dans l’enquête racontent comment ils ont permis à Alexa de mieux appréhender le nom de l’artiste américaine Taylor Swift, qui faisait l’objet de nombreuses requêtes.
Mais, ils peuvent également être confrontés à des situations plus délicates, voire très gênantes. Deux d’entre eux évoquent un enregistrement suspect qui ressemblerait à une scène d’agression sexuelle. Malaise. Ils avaient alors tenté de prévenir leur hiérarchie, qui avait considéré que ce n’était pas du ressort de l’entreprise.
Plus édifiant encore : l’enquête révèle qu’Amazon permet à ses auditeurs salariés d’accéder aux informations sensibles de l’usager, telle que son identité, son numéro de compte ou le numéro de série des enceintes achetées. Un manquement grave à la protection des données personnelles. Alors que chez ses concurrents Google Assistant ou Siri, même si les assistants vocaux sont aussi dopés par l’intelligence humaine, l’anonymisation des données semble assurée.
« Un très petit échantillon »
Invité à répondre à ces accusations, le géant américain du retail a tenté de se défendre :
« Nous prenons au sérieux la sécurité et la confidentialité des informations personnelles de nos clients » assure un porte-parole d’Amazon. « Nous n’annotons qu’un très petit échantillon d’enregistrements vocaux Alexa afin d’améliorer votre expérience client. Ces informations nous aident à former nos systèmes de reconnaissance vocale et de compréhension du langage, ce qui permet à Alexa de mieux comprendre vos demandes » détaille l’entreprise.
Le problème c’est qu’à l’échelle d’Alexa, même un très petit échantillon représente une quantité astronomique d’heures enregistrées, et donc potentiellement un nombre considérable d’usagers écoutés. Surtout que depuis sa création en 2014, Alexa domine le marché des assistants vocaux.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.