Passer au contenu

ChatGPT génère de meilleures images sans l’aide de Dall-E

ChatGPT devient plus doué en génération d’images. Le bot d’OpenAI troque Dall-E 3 pour un modèle plus puissant basé sur GPT-4o. Les visuels sont « plus précis » et « plus détaillés », avec des textes parfaitement lisibles, assure OpenAI.

Mise à jour 27/03 — Oups. La nouvelle fonction Images in ChatGPT se révèle bien plus populaire que prévu. Sam Altman, le patron d’OpenAI, explique que malgré les prévisions très optimistes de l’entreprise, la demande est trop forte. Par conséquent, le déploiement de la génération d’images est mise sur pause pour les utilisateurs gratuits de ChatGPT.

Article original, 26/03 — Jusqu’à présent, Dall-E était chargé de générer des images dans ChatGPT. Le modèle peut toujours servir dans un GPT personnalisé, mais il va être remplacé par la fonction « Images in ChatGPT » (OpenAI ne saura donc jamais comment nommer ses inventions). Comme avec Dall-E, les visuels sont générés directement dans le fil de la conversation, mais ils devraient être de bien meilleure qualité.

Ce que change le passage à GPT-4o

Images in ChatGPT est basé sur le modèle IA GPT-4o dit autorégressif. Il prend un peu plus de temps pour réfléchir, mais en contrepartie le rendu du texte est bien meilleur et sans les scories habituelles des modèles par diffusion comme celui de Dall-E. Les attributs des objets sont bien mieux gérés, ce sont jusqu’à 20 objets qui peuvent être rendus correctement.

Si la résolution ne change pas entre Images in ChatGPT et Dall-E, OpenAI annonce que les images pourront être éditées, y compris celles contenant des personnes en retouchant les éléments au premier ou à l’arrière plan (« inpainting »). Le modèle a été entraîné à partir de données publiques — autrement dit en piochant sur internet — et via des partenariats, notamment avec Shutterstock.

OpenAI, régulièrement accusé de piller les créateurs, assure la main sur le cœur respecter les droits des artistes et interdit la reproduction directe de styles d’artistes vivants. Des mécanismes d’opt-out sont accessibles pour les créateurs qui souhaitent exclure leurs œuvres des données d’entraînement.

Chatgpt Images 4
© OpenAI

Les images générées par ChatGPT ne contiennent pas de watermark ou d’indicateurs qui permettraient de dire que ce sont des visuels IA. OpenAI explique néanmoins qu’à terme, elles intégreront des métadonnées C2PA, le standard qui commence à s’imposer petit à petit.

La fonction, déjà disponible pour les abonnés Pro (la formule à 200 $ par mois), va être proposée à tous les utilisateurs payants Plus, ainsi qu’aux développeurs via l’API et pour les utilisateurs qui ne paient pas l’accès à ChatGPT. Ils seront toutefois limités à une poignée de visuels générés par jour (OpenAI ne précise pas le nombre, mais avec Dall-E c’est 3 par jour).

 

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.

Source : OpenAI


Mickaël Bazoge