Ces trente dernières années, les innovations ont été particulièrement nombreuses dans le domaine de l’informatique et des technologies numériques. Mais si certaines d’entre elles sont dans toutes les mémoires,
d’autres demeurent méconnues. C’est le cas de la compression de données, une technologie logicielle pourtant à l’origine de plusieurs révolutions industrielles.On lui doit notamment le développement rapide d’Internet et son adoption en masse par le grand public : quand le haut débit était encore un luxe réservé à certaines entreprises, la compression était le seul moyen
d’échanger des fichiers dans des délais raisonnables. Et que dire du MP3 ? Trois lettres qui nomment une technologie de compression, devenue si populaire qu’elles désignent aujourd’hui, par extension, les baladeurs
musicaux que tous les jeunes ont dans leur poche.Et ce qui est vrai pour le son l’est aussi pour l’image : qu’est-ce qu’une photo aujourd’hui, sinon une image numérique compressée en Jpeg ? Et un DVD-Vidéo, sinon un disque contenant un film
compressé en Mpeg2 ? Pur produit du génie humain, la compression logicielle utilise des algorithmes mathématiques et statistiques très complexes pour réduire la taille des fichiers. Certains sont applicables à tous les types de données,
d’autres spécifiques à l’image ou au son.Il existe deux sortes d’algorithmes : destructifs ou non destructifs. Le MP3 et le Jpeg sont destructifs, mais pas le Zip des archives Windows, ni les formats de compression audio sans perte (lossless,
en anglais) qui sont le sujet du présent article.
Le taux dépend de l’usage final
Un algorithme destructif privilégie le taux de compression : l’important est de réduire la taille du fichier originel dans des proportions importantes, quitte à supprimer certaines données jugées non essentielles. Ainsi,
lorsque vous encodez un extrait d’un CD-Audio en MP3 (ou en WMA, Ogg Vorbis et AAC) en choisissant un débit constant de 128 kbit/s, vous divisez par dix environ la taille du fichier. Un taux de compression remarquable (10 %), qui
facilite les téléchargements et permet de graver une dizaine d’heures de musique sur un unique CD.Toutefois, il ne peut être obtenu qu’en supprimant certaines parties du signal audio, certaines fréquences censées être masquées par d’autres. La différence de rendu sonore reste néanmoins nettement perceptible
lorsqu’on tend l’oreille. Elle l’est beaucoup moins dans le cas d’une musique de fond jouée à faible volume. D’où une première leçon : l’arbitrage entre taux de compression et qualité dépend
essentiellement de l’usage que l’on veut faire d’un fichier.Laissons maintenant la musique de côté pendant un instant, pour examiner un exemple simple de compression non destructive d’images. Celles-ci sont en effet plus faciles à reproduire dans notre magazine que les sons ! Dans
l’illustration ci-dessous, une photo au format BMP non compressé (en haut) a été convertie au format TIF (en bas), en activant l’algorithme de compression non destructif LZW. Observez, dans la boîte de dialogue de droite, les tailles
des fichiers résultants : on passe de 10,8 Mo pour le fichier BMP à 5,1 Mo pour le fichier TIF. Soit un taux de compression de 50 %, les deux images restant identiques au pixel près.
Nous avons poursuivi l’expérience en appliquant la même conversion en TIF à une image de synthèse, un simple carré rempli d’une couleur uniforme : le taux de compression a cette fois baissé jusqu’à 25 %.
La structure du chaos
C’est le second enseignement : plus les données à traiter sont complexes, moins la compression non destructive est efficace. Or une photo de la nature, par exemple, est un ensemble très complexe, car la nature est une forme
de chaos. Et un morceau de musique l’est plus encore, car il est constitué d’un assemblage de sons qui, pris individuellement, sont eux-mêmes des structures très complexes. Toutefois, pour un véritable mélomane, la place occupée par un
fichier importe moins que sa qualité sonore.C’est d’autant plus vrai que les contraintes matérielles s’estompent peu à peu : la taille des disques durs ne cesse d’augmenter, de même que la mémoire des baladeurs et la capacité des disques compacts,
alors que dans le même temps leurs prix baissent. Quant aux échanges de données par Internet, ils se trouvent grandement facilités par la généralisation du haut débit et la banalisation du stockage en ligne. Alors oui à la compression, mais non
destructive !Les outils de compression audio lossless (voir la liste ci-dessous) sont tous plus ou moins basés sur les mêmes principes mathématiques et les mêmes techniques logicielles :
– La compression des silences. Un morceau de musique est parsemé de courts instants de silence, qui occupent le même espace que les sons complexes. En réduisant chacun de ces silences à un ou deux octets représentant leur
durée, on économise jusqu’à plusieurs kilo-octets, voire mégaoctets.
– Le filtrage des fréquences. Le signal audio est divisé en plusieurs plages de fréquences : basses, bas-mediums, hauts-mediums (les fréquences de la voix humaine), aigus, par exemple. On peut alors appliquer à chacune
de ces plages un encodage spécifique, adapté à la façon dont elle est perçue par l’oreille humaine.
– La suppression de la redondance stéréophonique. Dans un fichier audio stéréo, la différence à un instant T est souvent faible entre le signal véhiculé par le canal droit et celui véhiculé par le gauche. Le fait de
mémoriser une seule fois les données communes aux deux canaux génère un gain de place important.
– Le codage entropique. Il consiste à prédire la valeur d’un échantillon (plus petit élément d’un signal audionumérique) à partir des échantillons précédents, puis à coder la différence entre la prédiction
et la réalité. On retrouve cette méthode dans les algorithmes de compression vidéo comme le MPeg. En combinant ces techniques, chaque encodeur réduit la taille des fichiers de moitié environ.
A nuancer selon la musique
Mais le taux de compression dépend beaucoup du type de musique traité : limité à 55 % avec le rock et les musiques à forte dynamique, il peut tomber à 45 % avec la musique classique. En revanche, pour un même fichier, il
varie peu d’un encodeur à l’autre, comme le montre l’illustration ci-dessous.
Elle indique la taille en kilo-octets d’un même fichier musical (un album complet) encodé en Wave, Flac, APE, WMA sans perte, ainsi qu’en trois qualités différentes de MP3 (64 kilobits, 128 kilobits et
320 kilobits par seconde). Le taux de compression sans perte maximum obtenu, celui de Monkey’s Audio (APE), est de 51 %. Pour obtenir des taux supérieurs, il faut sortir du lossless et accepter de diminuer la qualité sonore. Ce
qu’aucun vrai mélomane ne saurait accepter !
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.