Passer au contenu

IA : Anthropic accusé d’avoir « pillé » des milliers d’œuvres par trois écrivains

La société qui développe Claude, un rival de ChatGPT, est la cible d’une nouvelle action en justice aux États-Unis. Trois auteurs, qui ont formé un recours collectif, estiment que l’entreprise américaine a utilisé des milliers d’ouvrages sans autorisation, et sans le moindre paiement d’un « juste prix ».

Après Meta et OpenAI, Anthropic, l’entreprise technologique qui développe l’IA générative Claude, est, elle aussi, accusée d’avoir utilisé sans autorisation des œuvres protégées par le droit d’auteur. Selon Reuters, mardi 20 août, la société américaine est l’objet d’un recours collectif déposé 24 heures plus tôt devant le tribunal fédéral de Californie aux États-Unis. À l’origine de cette action : trois auteurs, Andrea Bartz, Charles Graeber et Kirk Wallace Johnson, qui estiment qu’Anthropic a « bâti une entreprise de plusieurs milliards de dollars en volant des centaines de milliers de livres protégés par le droit d’auteur ».

Selon ces derniers, la société américaine aurait utilisé sans autorisation leurs livres et des centaines de milliers d’autres pour entraîner son agent conversationnel Claude. Concrètement, le concurrent de ChatGPT aurait été formé sur des versions piratées de ces œuvres, allèguent-ils.

À lire aussi : Droit d’auteur : où en est-on dans la bataille qui oppose créateurs et artistes aux développeurs d’IA ?

Un « vol à grande échelle d’œuvres protégées par le droit d’auteur »

Dans la plainte, les auteurs s’appuient sur des déclarations d’Anthropic reconnaissant avoir utilisé « The Pile », un ensemble de données open source dont une partie serait composée d’œuvres piratées. « Plutôt que d’obtenir des autorisations et de payer un juste prix pour les créations qu’elle exploite, Anthropic les pirate », écrivent-ils dans le dépôt de plainte. « Les auteurs passent des années à concevoir et à écrire des œuvres protégées par le droit d’auteur. La Constitution des États-Unis reconnaît le principe fondamental selon lequel les créateurs méritent une compensation pour leur travail. Et pourtant, Anthropic a ignoré les protections du droit d’auteur » ajoutent-ils.

Ces derniers demandent des dommages et intérêts pour réparer « le vol à grande échelle d’œuvres protégées par le droit d’auteur » qui aurait été commis par Anthropic. Ils souhaitent aussi que les juges interdisent définitivement à la société d’utiliser des œuvres « à mauvais escient ».

À lire aussi : IA : les combines d’OpenAI, de Google et de Meta pour pallier la pénurie de données

Pillage ou exception au droit d’auteur (fair use, data mining) ?

Contacté par 01net.com, Anthropic n’avait pas répondu à notre demande de commentaires, à l’heure de la publication de cet article. Mais un porte-parole a déclaré à Reuters mardi que la société évaluait la plainte. L’avocat des auteurs n’a pas non plus souhaité commenter cette affaire. Cette action en justice pour violation de copyright est la deuxième qui touche Anthropic. L’année dernière, une première plainte avait été déposée par des éditeurs de musique pour utilisation abusive de paroles de chansons, protégées par le droit d’auteur.

Plus récemment (fin juillet), l’entreprise a été épinglée par iFixit, une entreprise présentée comme « la plus grande base d’informations sur les réparations » en ligne. Elle accuse Anthropic d’avoir pioché allègrement dans les sites Web pour entraîner Claude, sans respecter les conditions générales d’utilisation des plateformes.

À lire aussi : IA : Anthropic accusé de collecter sans autorisation des contenus de sites Web

Depuis la sortie de ChatGPT, les actions en justice des ayants droits, des auteurs, des organes de presse et des maisons de disques se multiplient contre les géants de l’intelligence artificielle comme OpenAI, Meta, Stability AI, Midjourney et DeviantArt.

À lire aussi : « Arrêtez de voler nos livres, et payez-nous » : aux États-Unis, la bronca des écrivains face aux industriels de l’IA

D’un côté, les entreprises de l’IA estiment être en droit de se servir sur le Web en vertu du « fair use » aux États-Unis – une exception au droit d’auteur – ou du droit de fouille (data mining) en Europe. De l’autre, le monde de la création estime qu’il s’agit d’une violation de leurs droits d’auteur – et d’un « pillage » de leurs contenus. Des actions en justice sont en cours pour trancher la question.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.