Qu’il est agaçant ce film ou le policier de Pessac zoome dix fois sur une bouillie de pixels pour s’apercevoir que l’homme pris en photo est bien le terroriste bordelais que tout le monde recherche ! Enfin, ça c’est pour les films d’aujourd’hui, parce que demain cela pourrait devenir une réalité avec SR3, un nouvel outil logiciel de Google. Une méthode qui transforme une pauvre vignette de 64×64 pixels en une « vraie » photo seize fois plus grande (1024 x 1024).
La nouvelle arme de Google s’appelle SR3 pour Super-Resolution via Repeated Refinements, ou « super définition par des améliorations répétées (ou successives) ». Le système prend votre image de départ, disons une vignette de 64×64, et va la grossir quatre fois.
L’approche est un peu surprenante. Le programme analyse l’image de départ, et va lui appliquer un filtre de bruit numérique de plus en plus fort, jusqu’à faire disparaître complètement l’image. Une étape pendant laquelle il apprend et cartographie les variations des différentes zones de l’image.
Une fois cette étape réalisée et l’algorithme renseigné sur la façon dont a évolué l’image dans ce procédé de « destruction », il va partir dans l’autre sens et partir du bruit pour recréer l’image de départ à une plus grande définition. Mieux encore, le procédé peut être appliqué en cascade : de 64 pix à 256 pix, puis de 256 pix à 1024 pix, etc. Et les résultats présentés par Google sont impressionnants, rappelant de manière troublante les fantasmes logiciels d’Hollywood.
Lire aussi : Les futurs algorithmes photo de Google respecteront les peaux et cheveux des personnes noires
Si la technologie SR3 peut s’avérer utile pour tout le monde afin d’améliorer, par exemple, la qualité des photos prises avec les tous premiers appareils photo numériques (ah, les vieux capteurs de 1,3 Mpix !), elle est aussi pertinente pour les travaux de Google. Plus particulièrement pour générer des bases de données d’image de haute définition en partant… de simples mots.
Le nouvel algorithme SR3 permet aussi à Google d’améliorer et d’accélérer de manière notable le procédé de création de fausses photos naturelles. Le procédé, appelé Class-Conditional ImageNet Generation (CDM), est un genre de baguette magique capable de créer une image à partir d’un simple mot-clé – setter irlandais, par exemple.
Grâce à un travail en cascade d’une génération d’image et plusieurs agrandissements via SR3, Google est désormais capable, sans photo originale, et à partir de simple mots clés, de créer des bases de données de fausses images hyper réalistes.
À découvrir aussi en vidéo :
Si les chercheurs reconnaissent que ce travail de génération d’images pourrait profiter à des « utilisations frauduleuses » (papier scientifique en anglais), cela pourrait aussi profiter à des domaines tels que la compression d’image ou encore faire avancer les travaux de résolutions des problèmes de l’apprentissage machine fondamental.
Pour nous, cela signifie surtout que les grincheux vont bientôt devoir se taire pendant les séquences de zooms jadis improbables de la série « les Experts en Gironde »…
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.