L’IA générative. Depuis le décollage en flèche d’OpenAI fin 2022, toutes les grandes entreprises tentent de rattraper leur retard. Mais bien souvent, face aux démos bluffantes, nombreux sont ceux qui s’écriront : « c’est impressionnant, mais à quoi ça peut bien servir ? »
Lors de sa conférence I/O 2024, Google a peut-être trouvé un usage vraiment intéressant : chercher à l’aide d’une vidéo.
La preuve par l’exemple
Rien ne vaut un bon exemple : la démonstratrice, Rose Yao a donc créé une histoire pour prouver les bénéfices de cette nouvelle technologie. Elle explique avoir acheté un lecteur de disques vinyle qui a un problème : la barre qui supporte le diamant et qui permet de lire la musique ne veut pas rester en place. Il est donc impossible de lire de la musique.
Pour trouver une solution, plutôt que de recourir à la bonne vieille recherche Google, qui vous emmènerait probablement dans divers subReddit plus ou moins utiles, ou encore des articles sur 01net par exemple (beaucoup plus utiles !), Google propose de prendre une vidéo.
La démonstration a le mérite d’être claire : une simple vidéo en posant sa question depuis l’App Gemini : « Pourquoi cette tige ne reste pas en place ? », et le tour est joué. Une fenêtre s’affiche et vous explique le nom de la fameuse tige, un « bras de lecture » et donne plusieurs éléments intéressants. D’abord une explication de la panne, puis un lien vers un site proposant des conseils pour la résoudre, puis une liste générée par Gemini de conseils à suivre.
Bien sûr, il ne s’agit que d’une simple démonstration sur une scène, il faudra vérifier si cela fonctionne concrètement une fois que l’option arrivera entre nos mains. Mais l’idée a le mérite d’apporter un usage concret à l’IA générative. En particulier les modèles dits multimodaux, qui peuvent utiliser plusieurs types de sources différentes : textes, vidéos… Puis Gemini va tout simplement chercher sur Google à votre place pour élaborer une réponse.
Malheureusement, même si cette option sera bientôt disponible sur Gemini, elle ne le sera que pour les utilisateurs vivant aux États-Unis et parlant en anglais.
Les autres annonces de la Google I/O 2024 :
- Dans Android 15, un filtre anti-arnaques pendant les coups de fil
- L’IA de Google va doper le moteur de recherche de Google Photos
- Avec le Projet Astra, Google tente de répondre à OpenAI
- Revoir l’intégralité de la conférence Google I/O 2024
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.