Passer au contenu

Chercher avec une vidéo : la bonne idée de Google Gemini

Parmi les améliorations ajoutées à Google Search lors de sa Google I/O, la firme de Moutain View a présenté la possibilité de chercher depuis une vidéo. Un usage qui met à profit les atouts de Google et Gemini.

L’IA générative. Depuis le décollage en flèche d’OpenAI fin 2022, toutes les grandes entreprises tentent de rattraper leur retard. Mais bien souvent, face aux démos bluffantes, nombreux sont ceux qui s’écriront : « c’est impressionnant, mais à quoi ça peut bien servir ? »

Lors de sa conférence I/O 2024, Google a peut-être trouvé un usage vraiment intéressant : chercher à l’aide d’une vidéo.

La preuve par l’exemple

Rien ne vaut un bon exemple : la démonstratrice, Rose Yao a donc créé une histoire pour prouver les bénéfices de cette nouvelle technologie. Elle explique avoir acheté un lecteur de disques vinyle qui a un problème : la barre qui supporte le diamant et qui permet de lire la musique ne veut pas rester en place. Il est donc impossible de lire de la musique.

Pour trouver une solution, plutôt que de recourir à la bonne vieille recherche Google, qui vous emmènerait probablement dans divers subReddit plus ou moins utiles, ou encore des articles sur 01net par exemple (beaucoup plus utiles !), Google propose de prendre une vidéo.

Google Keynote (google I O ‘24) 2 6 27 Screenshot (1)
© Google

La démonstration a le mérite d’être claire : une simple vidéo en posant sa question depuis l’App Gemini : « Pourquoi cette tige ne reste pas en place ? », et le tour est joué. Une fenêtre s’affiche et vous explique le nom de la fameuse tige, un « bras de lecture » et donne plusieurs éléments intéressants. D’abord une explication de la panne, puis un lien vers un site proposant des conseils pour la résoudre, puis une liste générée par Gemini de conseils à suivre.

Bien sûr, il ne s’agit que d’une simple démonstration sur une scène, il faudra vérifier si cela fonctionne concrètement une fois que l’option arrivera entre nos mains. Mais l’idée a le mérite d’apporter un usage concret à l’IA générative. En particulier les modèles dits multimodaux, qui peuvent utiliser plusieurs types de sources différentes : textes, vidéos… Puis Gemini va tout simplement chercher sur Google à votre place pour élaborer une réponse.

Malheureusement, même si cette option sera bientôt disponible sur Gemini, elle ne le sera que pour les utilisateurs vivant aux États-Unis et parlant en anglais.

Les autres annonces de la Google I/O 2024 :

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.

Opera One - Navigateur web boosté à l’IA
Opera One - Navigateur web boosté à l’IA
Par : Opera

Titouan Gourlin