Passer au contenu

Les résultats des tests de qualité vocale

Soumises à rude épreuve, les passerelles de voix sur IP ont leurs limites, mais le BS1200E, d’Oki, et le MAX 6000, de Lucent Technologies, s’en sortent plutôt bien. Avec ce type de solution, on peut basculer vers la voix sur IP.

La passerelle BS1200E, d’Oki Network Technologies, surclasse ses concurrents. Ce résultat n’était pas évident, même si la société occupe une place de leader sur le marché japonais de la téléphonie sur IP. Pour obtenir une compression vocale de qualité et des temps de latence réduits, ce constructeur emploie un codec G.729, mais celui-ci nécessite une bande passante plus importante.

Des coupures avec certaines passerelles

Or, le flux vidéo envoyé sur la liaison WAN (128 kbit/s) afin de la perturber présente déjà un débit moyen de 113 kbit/s. Des pointes de trafic apparaissent et engorgent régulièrement le lien, bloquant alors la communication vocale. En deuxième position, le MAX 6000, de Lucent, s’en tire honorablement. La communication est compréhensible, malgré des mots inaudibles. La taille des paquets RTP (Real time protocol) est identique à celle de ceux du BS1200E, (80 octets). Le MAX 6000 aurait dû être avantagé par son codec G.723 (compression à 6 kbit/s), puisqu’il nécessite presque moitié moins de bande passante pour acheminer la communication. A la décharge de Lucent, il faut préciser que le codec G.723 est plus difficile à réaliser et que le temps de codage est supérieur. De plus, la restitution initiale de la voix est très légèrement inférieure à celle du G.729. Les solutions d’Oki et de Lucent ont largement devancé le MultiVOIP MVP 800, de MultiTech Systems, et l’IP Telephony Gateway, de Nokia. Ces passerelles rétablissent péniblement le discours. D’importantes coupures rendent certains passages inaudibles. En fait, MultiTech est handicapé par deux points. D’abord, la taille des paquets RTP n’est pas modifiable. Le constructeur a opté pour des paquets de 48 octets. Il faut donc deux fois plus de paquets RTP que pour des paquets de 80 octets, et, de ce fait, deux fois plus de bande passante. Ensuite, le mécanisme de contrôle d’erreur, appelé Forward error correction, est actif, ce qui génère un peu plus de trafic. Cela explique que la bande passante nécessaire à l’acheminement d’une seule communication vocale atteint 23 kbit/s. En désactivant le système de contrôle d’erreur, 17 kbit/s suffisent alors pour remplir cette tâche. En revanche, le discours obtenu devient incompréhensible. Nokia, pour sa part, est handicapé par son codec. Le constructeur finlandais utilise le SX7300, codec propriétaire de Lucent Technologies. Il devrait fournir, avec sa prochaine passerelle, les codecs classiques de la recommandation H.323.

Cisco, handicapé par sa politique propriétaire

Enfin, pour Cisco, les notes obtenues atteignent des niveaux très bas ! Ceci est dû au fait que Cisco, dans sa politique de convergence voix-données, penche pour une chaîne de transmission entièrement constituée d’équipements de sa fabrication. Cela permet l’usage de mécanismes d’affectation des priorités selon l’importance du flux, notamment grâce au Weighted fair queuing. Ce mécanisme applique d’office une priorité élevée au trafic multimédia. Il est activé par défaut dans les routeurs du constructeur californien. En raccordant directement les routeurs Cisco sur la liaison WAN, ces méthodes de différenciation du trafic donnent de bons résultats, comme nous l’avons constaté. Dans ce cas, et malgré le flux vidéo de 113 kbit/s transitant sur les deux canaux B de la liaison RNIS, le discours est parfaitement restitué. La voix est claire et nette. La note de Cisco dans ces conditions est de 8,3 sur 10, et les routeurs 2600 et 3640 se placent alors largement en tête. En revanche, en insérant des routeurs tiers sur lesquels aucun mécanisme de priorité n’est activé (des Access Node, de Nortel Networks) pour assurer la liaison WAN, le résultat est catastrophique. La mise en route du Weighted fair queuing sur les équipements de Cisco n’y change rien. D’importants blancs (de 1 à 5 secondes) rendent le discours totalement incompréhensible. Sans parler du souffle pendant ces coupures, qui rend l’écoute très pénible.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Xavier Bouchet