Passer au contenu

reCAPTCHA : des millions d’heures perdues… et des milliards de profits cachés pour Google ?

Présentés comme un « mal nécessaire » pour sécuriser internet, les CAPTCHA de Google servent à distinguer un humain d’un robot. Ils seraient aussi une énorme source de revenus indirects pour le moteur de recherche, une perte de productivité énorme et une catastrophe environnementale. Tout ça pour une fiabilité contestée…

Les CAPTCHA, ce sont ces tests énervants qui vous demandent de cliquer sur les photos de vélos ou de voitures, ou encore de résoudre des puzzles, pour que les sites web s’assurent que vous êtes bien un humain et pas un robot. Google est un des plus importants fournisseurs de ces nuisances quotidiennes sur internet, avec le service reCAPTCHA.

L’énorme coût caché des reCAPTCHA de Google

Lancé en 2007, ce service a été acheté par le moteur de recherche deux ans plus tard. La v2 est arrivée en 2014, et la v3 en 2018. Malgré cette nouvelle génération, 3 millions de sites web utilisent toujours reCAPTCHA v2.

Une étude menée par l’université de Californie à Irvine a fait les comptes et ils ne sont pas bons. Sur plus de 13 ans de déploiement, les chercheurs estiment que les puzzles reCAPTCHA ont représenté 819 millions d’heures de travail humain, ce qui correspond à 6,1 milliards de dollars en équivalent salaire !

Ça n’est pas tout : sur cette même période, Google aurait potentiellement tiré profit d’une partie des cookies créés par les sessions reCAPTCHA (des cookies qui représentent la somme totale, et stratosphérique, de 888 milliards de dollars). Cet étiquetage d’images n’est pas gâché : Google revend ces informations, bien pratiques pour entraîner des modèles IA… « Le véritable objectif de reCAPTCHA v2 est de fournir gratuitement un travail d’étiquetage d’images et une ferme de cookies de suivi à des fins publicitaires, déguisés en service de sécurité », accuse l’étude.

En termes environnementaux, ces tests sont une catastrophe : le trafic issu des reCAPTCHA a représenté 134 Po de bande passante, ce qui a nécessité 7,5 millions de kWh d’énergie, soit encore 3,4 millions de kg de CO2. Et tout ça pour des résultats qui laissent à désirer.

Un robot peut ainsi « réussir » 100 % du temps le test du clic sur le bouton d’un reCAPTCHA v2. Quand il s’agit de résoudre un puzzle visuel, la vulnérabilité est de 70 %. Et la v3 de reCAPTCHA ne fait pas vraiment mieux : en 2019, des chercheurs ont conçu une attaque pouvant contourner les défis dans… 87 % des cas.

L’équipe de l’UC Irvine base ses découvertes sur une étude réalisée entre 2022 et 2023 sur un peu plus de 9 000 sessions reCAPTCHA v2, complétée par une enquête auprès de 108 individus. Google a assuré de son côté que les données des utilisateurs ne sont utilisées que pour améliorer le service, ce à quoi les chercheurs opposent l’absence d’informations publiques concernant l’exploitation de ces données.

Par ailleurs, l’entreprise explique que reCAPTCHA v3 est désormais utilisé par une majorité de clients, alors que l’étude s’appuie sur la v2. Mais comme on l’a vu, l’une comme l’autre de ces versions peuvent être contournées.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.

Opera One - Navigateur web boosté à l’IA
Opera One - Navigateur web boosté à l’IA
Par : Opera

Source : The Register


Mickaël Bazoge
Votre opinion
  1. Comment recaptcha peut il etre du travail d’étiquetage gratuit puisqu’il a deja besoin de l’etiquette « bonne réponse ? »

  2. Confronté à un reCAPTCHA il y a belle lurette que je ne m’escrime plus à perdre mon temps à le résoudre : je passe mon chemin, tout simplement.
    CAPTCHA, reCAPTCHA, version, qu’en sais-je … s’il s’agit simplement de cocher “Je ne suis pas un robot” passe encore mais sinon, oust, on sort en claquant la porte, si je puis dire.
    Quant au gaspillage d’un côté, les profits cachés de l’autre, pour une fiabilité contestée — à juste titre — plus rien ne m’étonne quand il s’agit en particulier des pratiques du entreprises GAMAM (Google, Amazon, Meta, Apple, Microsoft). Pas bien joli tout ça.

  3. Article super interessant ! Quid d’une alternatice moins energivore, plus efficace, et surtout respectueuse des RGPD (transparance) ?!

  4. Bon, c’est un peu à charge tout de même.
    Pour avoir connu l’époque avant reCaptcha, je vous assure que le spam de commentaire était BIEN plus pénible pour les gestionnaires de site.

    Bonne journée

Les commentaires sont fermés.