Passer au contenu

Microsoft n’utilise pas les documents Office pour entraîner son IA

Une (fausse) information s’est répandue comme une traînée de poudre sur les réseaux sociaux : Microsoft exploiterait les documents Office des utilisateurs pour entraîner ses modèles d’intelligence artificielle. Ce n’est pas du tout le cas, assène l’éditeur.

La rumeur avait le parfum de la crédibilité. Sur X (anciennement Twitter), nixCraft, un compte très suivi spécialisé dans les systèmes Unix, a affirmé qu’Office avait « discrètement » activé une fonction analysant les documents Word et Excel pour entraîner gratuitement les modèles d’IA de Microsoft. Une option « activée par défaut » à décocher dans un coin obscur des réglages de la suite bureautique.

La crainte du pillage

L’affirmation a de quoi alarmer les utilisateurs des logiciels de Microsoft, en particulier ceux qui vivent de leur plume : l’éditeur pillerait donc indûment leurs écrits pour le plus grand bénéfice de son intelligence artificielle, le tout sans payer un kopeck. Mais voilà, il se trouve que nixCraft a pris des vessies pour des lanternes. Microsoft ayant rapidement démenti. en expliquant que ses logiciels n’utilisait pas les données des utilisateurs pour entraîner de grands modèles de langage (LLM).

Le réglage dont il est question ici concerne uniquement l’accès aux fonctions qui nécessitent un accès à internet, comme l’édition conjointe d’un document ou la recherche d’images en ligne. L’option est effectivement activée par défaut, mais elle ne fait aucunement référence à l’IA et pour cause, il n’en est pas question ici.

Cette affaire montre en tout cas la méfiance grandissante des utilisateurs de logiciels de création. Il existe malheureusement de nombreux précédents où les entreprises spécialisées dans l’IA piochent sans vergogne dans du contenu produit par d’autres, sans autorisation, pour leur plus grand profit. Adobe s’est pris les pieds dans le tapis il y a quelques semaines sur le même sujet.

Lire La communauté créative en colère contre les nouvelles mentions légales d’Adobe

Le cas de Microsoft est encore plus alambiqué : l’entreprise ne se contente pas d’éditer des logiciels bureautiques, elle est aussi partie prenante dans l’IA générative avec ses investissements colossaux dans OpenAI, dont l’entraînement des LLM a besoin d’un maximum de données. Il est donc facile de penser que Microsoft pourrait être tenté de collecter les documents des utilisateurs Office… Le fardeau de la preuve pèse sur ces entreprises, et on ne peut pas dire qu’elles aient été très transparentes jusqu’à présent.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.

Source : The Verge