Passer au contenu

Cette intelligence artificielle d’OpenAI est capable de créer des images à partir d’un simple texte

Open AI combine images et légendes pour entraîner de nouveaux types de modèles capables de saisir les subtilités du langage naturel. Avec des résultats étonnants.

La société OpenAI, fondée par Elon Musk en 2015 et soutenue par Microsoft, a encore fait des pas de géant en matière d’intelligence artificielle. Elle a mis au point un nouveau réseau neuronal, Dall.E, qui dérive de son célèbre logiciel générateur de texte GPT-3.

Des fauteuils en forme d’avocat

Ce modèle a produit des images à partir d’un simple texte. En entrant les mots « fauteuil » et « avocat », il a décliné une longue série de fauteuils en forme d’avocat, comme on peut le voir dans l’image en haut de notre article. Il est donc capable de prendre deux concepts indépendants et de les assembler de manière à obtenir quelque chose de réaliste et fonctionnel. Des résultats encore plus fous ont été obtenus en associant « un radis en tutu » et « faire promener un chien ».

Un radis en tutu promenant un chien.
OpenAI – Un radis en tutu promenant un chien.

L’acuité de Dall.E s’explique par le fait qu’elle a été entraînée à partir d’images légendées glanées sur le web et non classiquement avec une base de données étiquetée où on lui aurait indiqué simplement les mots « banane » ou « chat ».

OpenAI fait état d’un autre réseau neuronal, Clip (Contrastive Language-Image Pre-training), qui réussit l’inverse de ce que fait Dall-E. C’est un système de reconnaissance d’images qui déduit des descriptions textuelles. Un moyen efficace de classifier les images. Lui aussi a été formé avec une combinaison d’images et de légendes. Une voie prometteuse pour rendre encore plus performantes les intelligences artificielles.

Source : OpenAI, MIT Technology Review

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Amélie CHARNAY