Vive le trafic voix ! Après avoir tout misé sur la transmission de données, comme l’accès rapide à Internet, les opérateurs retrouvent les vertus de la téléphonie. “La voix est le seul moyen, actuellement, de rentabiliser les infrastructures de type Digital Subscriber Line”, assure Daniel Dumont, directeur France de RAD Data Communications. En fait, la majorité des opérateurs de services ADSL avaient omis un paramètre essentiel : le trafic IP n’induit pas encore une marge et un chiffre d’affaires suffisants pour rentabiliser une infrastructure. Seul le trafic voix, bien qu’en perte de vitesse constante face aux données, procure des revenus intéressants pour les opérateurs.La solution voix sur DSL consiste à transporter des flux téléphoniques supplémentaires en même temps que des paquets IP sur une liaison d’accès ADSL. Elle devient opérationnelle grâce, essentiellement, au coût réduit et aux performances élevées des outils de compression du signal vocal disponibles sur le marché. Ces derniers prennent la forme de DSP, puce dédiée pour réaliser la tâche de traitement numérique du signal audio. De plus, la voix sur DSL bénéficie de l’ouverture de la boucle locale. Ce service autorise un opérateur entrant à utiliser les lignes de l’opérateur historique afin de transporter de la voix et des données.Deux topologies d’architectures apparaissent sur le marché en fonction de la nature de l’opérateur en charge du service de voix sur DSL. Dans le cas d’un opérateur historique, les canaux voix sont immédiatement récupérés en sortie du modem ATU-C situé dans le DSLam, pour être ensuite aiguillés vers la passerelle téléphonique. Pour un opérateur alternatif, cette passerelle se trouve nettement plus haut dans l’infrastructure. Bien souvent, elle n’est accessible que par un réseau large bande régional.Le principe de la voix sur DSL est, somme toute, assez simple : le transport de la voix s’effectue, au-delà de la boucle locale, dans un réseau en mode paquet, comme IP, ATM ou Frame Relay. Afin de mettre en place un tel service, les opérateurs installent deux composants essentiels : les passerelles téléphoniques, qui assurent au c?”ur du réseau de l’opérateur la mise en forme des paquets reçus par le réseau de l’opérateur ; et les équipements d’accès intégré, ou IAD. Situés chez l’abonné, ces derniers servent d’interface entre l’infrastructure de l’opérateur et les réseaux voix-données de l’entreprise.
L’IAD multiplexe voix et données
Techniquement, du côté de l’abonné, ce terminal d’accès intégré multiplexe les flux voix et données sur la liaison ADSL, en utilisant l’ATM comme couche de transport. L’IAD assure le codage et la numérisation des signaux voix, puis transforme en paquets ces informations dans des cellules ATM. Conformément à la recommandation émise par l’UIT et l’ATM Forum, ces cellules sont acheminées vers les DSLam en utilisant la couche AAL2 du modèle ATM. Les équipements d’accès intégrés se chargent aussi de l’envoi des informations relatives à la signalisation vers les passerelles téléphoniques. Une fonction de réduction de la gigue introduite dans le réseau est, également, appliquée en réception.Toutes ces opérations s’effectuent grâce à quatre modules composant les équipements d’accès intégrés. Le transformateur hybride assure la connexion physique des postes téléphoniques sur le modem analogique de l’usager ; le codeur numérise et compresse les signaux voix émis depuis les postes téléphoniques ; le paquétiseur concentre les échantillons numériques générés par le codeur ; et l’organe de mémorisation et d’ordonnancement, qui correspond au modem ADSL, est chargé d’organiser les différents flux (voix et données) en fonction de leur priorité.
Des débits multiples de 32 kbit/s
La passerelle téléphonique, quant à elle, se situe au c?”ur du réseau de l’opérateur soit dans le réseau large bande régional pour les opérateurs alternatifs, soit au niveau du commutateur local pour les opérateurs historiques. Elle assure la dépaquétisation des échantillons de voix transportés dans les cellules ATM transitant sur le lien ADSL. Ensuite, une fois que différentes techniques d’annulation d’écho ont été appliquées, la passerelle décompresse les paquets reçus avant de les remettre au format nécessaire (interface V5, pour l’Europe ; ou GR303, pour l’Amérique du Nord) pour s’interconnecter aux réseaux téléphoniques commutés traditionnels. La norme européenne regroupe deux variantes, appelées V5.1 et V5.2. La première est assimilée à un échange bidirectionnel de trames entre le CL (commutateur local) et le CAA (commutateur à autonomie d’acheminement). L’interface V5.2, quant à elle, concentre le trafic montant du CL vers le CAA en ayant recours, cette fois-ci, à une affectation dynamique des intervalles de temps.Les techniques de compression de type ADPCM (Adaptive pulse coded modulation) effectuent un codage de la voix à 32 kbit/s avec un débit constant. Cette dernière caractéristique revêt une grande importance. Les services de voix sur DSL nécessitent, en effet, des débits symétriques, égaux dans le sens montant et descendant. La technologie DSL la plus répandue est, justement, asymétrique. Afin de proposer des services de voix sur l’ADSL, les opérateurs doivent être à même de proposer des débits multiples de 32 kbit/s, correspondant au nombre de lignes téléphoniques dans les deux sens.
Le phénomène d’écho, à ne pas négliger
Reste qu’un problème fondamental, au regard de la qualité sonore perçue par l’utilisateur, doit être résolu lorsqu’on transporte de la voix sur un réseau DSL : le dimensionnement du délai acceptable de paquétisation pour l’acheminement de données voix sur un réseau en mode commutation de paquets, comme IP ou ATM. L’interactivité requise pour les communications vocales limite le temps de transit de la source au destinataire à environ 150 ms. Souvent, les spécialistes de la téléphonie estiment qu’à partir de 50 ms le phénomène d’écho est non négligeable.Ce phénomène est lié à un retour parasite du signal émis par un usager dans son propre combiné. Cet écho provient de l’imperfection du circuit hybride situé du côté du commutateur de rattachement. Ce phénomène existe dans tous les cas, même avec une ligne analogique raccordée au réseau public téléphonique commuté. Des algorithmes se chargent d’annuler, en réception, le phénomène d’écho. Enfin, la valeur de la taille des paquets est une question de compromis : des paquets très courts favorisent une réduction du délai de bout en bout en dégradant l’efficacité protocolaire (ratio entre les données utiles et le poids des en-têtes de chaque paquet voix).
Plusieurs architectures protocolaires
Toutefois, un délai de paquétisation inférieur ou égal à 15 ms est couramment considéré comme acceptable. Pour information, il faut se remémorer qu’un délai de 6 ms engendre des paquets voix de 24 ou de 48 octets. Cela pose le problème du délai de remplissage des trames ATM. Pour diminuer le délai, un mécanisme qui force le remplissage de paquets de bourrage a été mis en place.Afin de faire transiter les paquets dans de bonnes conditions sur les liens DSL, les opérateurs disposent de plusieurs architectures protocolaires pour les solutions de voix sur DSL. Fidèles à leur culture et avec un souci évident de tirer, au mieux, parti des réseaux déjà déployés, les opérateurs historiques, et, par extension, les opérateurs alternatifs qui louent l’infrastructure, ont déployé des architectures de type ATM. La capacité de transfert utilisée pour le transport de la voix paquétisée, avec le mécanisme de suppression d’écho, est le Real Time Variable Bit Rate. Pour mémoire, la couche AAL2 a la particularité de permettre de multiplexer sur un seul et même circuit virtuel ATM plusieurs flots de trafic voix provenant de divers codecs.Dans ce cas, les paquets de voix de taille variable, obtenus par échantillonnage et numérisation du signal de chaque source vocale, sont générés par le mécanisme de mise en paquets. On associe à chacun de ces paquets un en-tête de 3 octets comprenant les champs CID (Connection identifier), sur 8 bits ; LI (Length indicator), sur 6 bits ; RES (Reserved), sur 5 bits ; et HEC (Header error control), sur 5 bits. Le CID assure l’encapsulation, dans une même cellule ATM, d’échantillons de voix issus de différents codecs. La charge utile, appelée payload, commence véritablement avec le champ STF (Start field), qui a la taille de 1 octet. Celui-ci contient 6 bits, pour le champ OSF (Offset field) ; 1 bit, pour le SN (Sequence number) ; et 1 bit, pour le champ P (parité). Ce dernier a la charge de protéger les champs OSF et SN contre les erreurs de transmission.
Les infrastructures de nouvelle génération
Seulement, tous les opérateurs ne souhaitent pas mettre en place une architecture ATM au c?”ur de leur infrastructure, estimant que cette approche ne va pas dans le sens de l’histoire. Ils disposent alors d’une autre solution sérieuse avec la voix sur IP et les approches de type commutateur logiciel (softswitch). Ces infrastructures, dites de nouvelle génération par opposition aux réseaux commutés traditionnels, conviennent aussi bien aux opérateurs historiques qu’aux nouveaux entrants. Cette approche repose sur le couple de protocoles RTP (Real time protocol) et RTCP (Real time control protocol). RTP assure l’identification du contenu et la numérotation des datagrammes IP. Il affecte aussi, à chaque paquet IP, une étiquette temporaire. Celle-ci facilite la compensation de la gigue par le destinataire. Ce protocole est indissociable du RTCP, qui vérifie la qualité de transmission lors des échanges. Afin d’assurer cette tâche, RTCP génère des paquets de contrôle, qui sont échangés entre la passerelle téléphonique et l’IAD. Les paquets RTP transitent grâce au protocole de transport UDP, tandis que les trames de contrôle utilisent TCP.Le choix d’UDP pour transporter les paquets contenant la voix est logique. L’overhead (le poids de l’en-tête) générée restant inférieure à celle de TCP. En revanche, UDP est un protocole non fiable, car il ne bénéficie pas de mécanisme de retransmission de paquets. Toutefois, cette faiblesse reste acceptable dans le cas de la voix sur IP. En effet, afin de limiter les conséquences liées à la perte d’un datagramme IP, chacun contient un résumé du paquet suivant ou précédent. En cas de perte d’un datagramme, celui-ci est approximativement reconstitué.De leur côté, les constructeurs de passerelles téléphoniques ont le choix entre divers protocoles de signalisation. Ils ont, toutefois, un faible pour ceux ratifiés par l’IETF, comme Megaco et Sigtran. Ces protocoles prennent en compte aussi bien le signal vocal que la signalisation téléphonique. Ils assurent la localisation des utilisateurs, l’établissement de session, la négociation de session, et la gestion dynamique du groupe multicast.
Une réflexion commerciale de fond
La fonction de localisation est essentielle. Les ordinateurs des utilisateurs ne possèdent bien souvent pas d’adresse IP permanente. Les accès ADSL s’appuient donc sur le DHCP (Dynamic host configuration protocol) pour la gestion des adresses IP. Les protocoles de signalisation proposent aux usagers d’accepter, de refuser ou de rediriger vers une autre personne la communication. Lors de la négociation de session, les usagers disposent de fonctions afin de négocier les algorithmes de compression et de codage qui auront cours lors de la communication. Ils sont utilisés lors de communications multiples (call conference, par exemple). La gestion dynamique du groupe multicast est indispensable pour proposer des services pour la voix sur DSL. Sur le terrain, les déploiements de services VoDSL en sont encore aux balbutiements.Les avatars liés aux difficultés du dégroupage de la ligne d’abonné font que peu d’opérateurs alternatifs arrivent à percer sur le marché de l’accès à Internet. Si la téléphonie n’est considérée que comme une planche de salut, elle a peu de chances de sortir les pionniers du dégroupage DSL de l’ornière. Elle suppose d’abord une réflexion de fond sur l’approche commerciale (tarifs cible) comme le couplage de services voix-données, rendu possible par cette technologie.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.