Platines DivX, télévision haute définition, TNT : il ne se passe pas un jour sans que l’on parle de MPeg4. Pourtant, dans tous ces cas, le terme est impropre. Au mieux, ces technologies sont des dérivés, des ersatz basés sur le MPeg4. Car ce standard multimédia ne saurait être réduit à de la simple compression vidéo. En apportant, notamment, de l’interactivité, il ouvre une ère nouvelle dans le codage de l’image animée.
La vidéo sous pression
Depuis sa naissance, la vidéo numérique souffre d’un problème de poids. En mode Pal (le standard européen), une seconde de vidéo est composée de 24 images de 768 x 576 pixels, ce qui représente un peu plus de 20 Mo… sans le son ! Difficile, dans ces conditions, d’imaginer stocker ou faire circuler de la vidéo ‘ brute de décoffrage ‘ : pour la diffuser, il faudrait disposer de ‘ tuyaux ‘ capables de soutenir un débit d’au moins 20 Mo/s, soit plus de 160 Mbit/s ! Du coup, il est indispensable de compresser le signal, en limitant les pertes d’informations inhérentes à ce genre d’opération. C’est ce à quoi travaille un groupe de scientifiques : le Motion Picture Expert Group (MPEG). Sa mission : définir les standards de la vidéo numérique. En 1993, cette communauté s’est donc penchée sur l’élaboration d’un nouveau standard, dédié plus spécifiquement au bas débit : le MPeg4. Il s’agissait, au début, de permettre la diffusion de vidéos sur les écrans de téléphones portables. Mais très vite, les recherches ont pris un tour nouveau.Le MPEG a, en effet, modifié la manière de penser la compression vidéo. Là où le MPeg1 et 2 se contentent d’encoder des pixels, sans s’occuper de ce qu’ils représentent, le MPeg4 s’intéresse au contenu, et introduit la notion d’objets.Chaque image de la vidéo est ainsi décomposée : un personnage, une voiture, un fond fixe, une voix, une musique… On parle d’objets médias, regroupés en grandes familles (les objets vidéos, les objets sons, etc.). Chacun peut bénéficier d’un traitement spécifique adapté à sa nature (voir illustration). Un tel système permet un gain de place évident : imaginons une speakerine sur un fond fixe. Codé une fois, le fond n’a plus besoin, ensuite, d’être traité.Pour décrire ces objets, le MPeg4 a un langage : le Bifs (Format binaire pour les scènes), qui détaille leur taille, leur forme, etc., ainsi que leurs mouvements. Mais le Bifs permet aussi de définir le comportement des objets en fonction de l’utilisateur ; en clair, d’introduire de l’interactivité dans la vidéo. Un clic sur un sportif à l’écran (défini comme l’objet vidéo sportif), et on obtient toutes ses statistiques.
Sur les bases du MPeg2
Si la compression orientée objets est l’une des révolutions apportées par le MPeg4, ce n’est pas la seule. Images animées, son, images fixes : tous connaissent aussi leur lot d’innovations. Mais c’est la compression vidéo qui intéresse le plus les professionnels de l’image. Les prouesses du MPeg4 en la matière sont telles que, partis pour de la vidéo sur GSM, les chercheurs ont accouché d’un format adapté aux larges écrans (avec une définition pouvant atteindre 4 096 x 4 096 pixels) et aux touts petits. Deux types de compressions sont principalement appliqués : une compression intraimage (pour chaque image) et une compression dite temporelle (voir illustration page précédente). Le MPeg4 partage, en cela, un large héritage avec le MPeg2. La compression intra-image repose principalement sur ce que l’on appelle la transformation en cosinus discrète (DCT), une fonction mathématique permettant de transformer une image en fréquences. Les informations superflues se trouvant concentrées dans les hautes fréquences, il est très facile alors de les éliminer. Pour que la DCT soit efficace, il faut, auparavant, découper chaque image en une mosaïque de petits blocs, de 8 x 8 ou 16 x 16 pixels : les macroblocs. Plus la surface de travail est faible, plus le traitement est pertinent.La compression temporelle fonctionne différemment : en vidéo, deux images qui se suivent se ressemblent ; bien peu de macroblocs diffèrent d’une image à l’autre. Rien ne sert de tous les coder dans leur intégralité. On définit donc des images complètes, appelées images I (images clés ou keyframes), qui contiennent tous les macroblocs. Entre, on intercale des images P (prédictives) et B (bidirectionnelles), qui ne contiennent que ce qui a changé (voir illustration page précédente). Cette séquence d’images IPB forme un Gop (Group of Pictures). Plus les images clés sont espacées, plus le Gop est grand et plus la qualité de l’image diminue. Mais le MPeg4 peut se permettre un Gop important (il est virtuellement illimité avec ce standard), grâce à de nouveaux algorithmes qui évitent les erreurs dans les images incomplètes P et B.
Pillage organisé
En bouleversant la manière de penser la compression vidéo, le MPeg4 ouvre un nouveau champ de possibilités. Toutefois, bien peu, aujourd’hui, semblent prêts à suivre cette voie. Apple, Real ou Microsoft (membres du MPEG) ont ainsi développé des formats de compression et de décompression vidéo basés sur le MPeg4. Mais ils ont délaissé l’orientation objets. Seule la compression vidéo pure semble intéresser les industriels, qui s’en sont inspirés pour créer le DivX ou le H264. On a gagné en qualité. La révolution, elle, attendra…
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.