Passer au contenu

Nvidia lance Maxine, une plate-forme pour améliorer nos visioconférences grâce à l’IA

Destinée aux fournisseurs de services de visioconférence, Maxine est une plate-forme qui pourrait bien leur faire économiser énormément de bande passante… tout en améliorant les heures que nous passons en réunions virtuelles.

A l’occasion de l’ouverture de sa GTC 2020 d’automne, Nvidia a annoncé un nouvel ensemble d’outils animés par l’intelligence artificielle et motorisés par ses puces. Baptisée Maxine, cette plate-forme dans le cloud sera mise à disposition de tous les fournisseurs de solutions de visioconférences qui seraient intéressés. Il pourra donc s’agir aussi bien de Zoom… que de Google.

Réduire la consommation de bande passante

Maxine améliore de nombreux points. Grâce à des algorithmes intelligent de compression du signal vidéo, la plate-forme de Nvidia permet de réduire le besoin en bande passante à un dixième de ce qui est habituellement requis pour passer un appel vidéo en H264.
Pour arriver à cette performance, plutôt que de streamer l’intégralité des pixels à l’écran, seuls des points clés des visages de chaque intervenant sont analysés puis « intelligemment réanimés » sur l’écran de l’interlocuteur.

Améliorer l’expérience de conversation

Par ailleurs, d’autres algorithmes intégrés dans la plate-forme permettront de faire en sorte que les interlocuteurs donneront toujours l’impression de faire face à leur caméra, même s’ils détournent un peu la tête. Le contact visuel sera ainsi assuré.

De manière optionnelle, il sera possible aux services de visioconférence de proposer des avatars 3D et animés, en fonction de leur voix et du ton de leur voix en temps réel.

Comme Broadcast, la solution de Nvidia destinée aux podcasteurs/youtubeurs, Maxine intégrera une solution de cadrage automatique pour que la personne filmée soit toujours au centre du cadre, même si elle se déplace. 

On trouve également la technologie de suppression des bruits parasites. Ainsi, les sons gênants produits en arrière-plan et captés par le micro d’un interlocuteur seront supprimés pour ne pas nuire à la discussion. Il sera également possible de choisir un fond d’arrière-plan, comme si on se tenait devant un fond vert uni. Evidemment, le détourage en temps réel est assuré par une intelligence artificielle.

Enfin, notamment en utilisant le SDK de Nvidia appelé Jarvis, Maxine proposera des modèles de reconnaissance de la parole en temps réel qui permettront à un assistant virtuel de prendre des notes pendant une conférence, de répondre à des questions avec une voix « humaine » ou encore de traduire avec des sous-titres en temps réel la discussion tenue.

Nvidia insiste sur la modularité de son offre et sur son potentiel. Un bon moyen d’améliorer leurs expériences de visioconférences dans un monde marqué par la Covid-19 et, pour Nvidia, de vendre ses solutions matérielles et logicielles.

Source : Nvidia 

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Pierre FONTAINE