Microsoft avance à pas de géant en matière d’intelligence artificielle. L’année dernière, son système de reconnaissance vocale réussissait à atteindre des résultats aussi bons que des humains. Ce 14 mars, la firme annonce qu’une autre de ces intelligences artificielles traduit des articles d’informations du chinois à l’anglais avec le même niveau de qualité et de précision qu’un professionnel.
C’est Xuedong Huang, le responsable technique du langage naturel et de la traduction automatique de Microsoft, qui a supervisé les recherches dans trois laboratoires situés à Pékin, Redmond et Washington.
Pour prouver les performances de leur système, les scientifiques lui ont fait passé un test reconnu par la communauté scientifique et intitulé newstest2017. Ce dernier comprend environ 2000 phrases tirées d’un échantillon de journaux disponibles en ligne et déjà traduits par des professionnels. Des évaluateurs bilingues externes ont même été embauchés pour l’occasion afin de comparer les résultats obtenus par Microsoft avec les traductions humaines.
« Nous ne savions pas que nous serions en mesure de parvenir si vite à ce résultat », a déclaré Xuedong Hang pour qui la parité avec l’homme en matière de traduction automatique n’a longtemps été qu’un rêve. Traduire représente une tâche complexe parce que l’on peut exprimer le même sens avec des mots différents, sans qu’il soit toujours possible de certifier quel est le meilleur choix.
De nouvelles méthodes révolutionnaires
Le défi a été relevé grâce au recours à un réseau de neurones profonds permettant d’obtenir une traduction plus fluide et naturelle qu’en se reposant sur la traduction automatique statistique, la première méthode utilisée aux tout débuts de Google Traduction et qui consiste à se procurer des gigantesques bases de données bilingues pour établir des modèles.
Mais les équipes de Microsoft ne se sont pas contentées du deep learning. Elles ont combiné de multiples méthodes calquées sur la façon dont procèdent les humains pour améliorer leur travail.
Il y a d’abord le “dual learning”, sorte de traduction inversée qui consiste à vérifier les résultats en traduisant dans le sens inverse. Mais aussi les réseaux de délibération, où le système répète encore et encore le processus de traduction de la même phrase pour affiner progressivement la réponse. Plus original, le “joint training” permet de stimuler les systèmes de traduction de l’anglais vers le chinois et du chinois vers l’anglais, en accroissant le nombre de phrases contenues dans l’ensemble de données.
Enfin, une dernière méthode baptisée “agreement regularization” permet de générer automatiquement de la traduction en faisant lire le système de gauche à droite, puis de droite à gauche. Si ces deux techniques de traduction génèrent la même traduction, le résultat est considéré comme plus fiable que si elles n’obtiennent pas les mêmes résultats.
Ces techniques devraient pouvoir être réutilisées dans d’autres domaines de l’intelligence artificielle.
Toutefois, les équipes de Microsoft restent modestes et annoncent qu’il va falloir compléter ces tests par d’autres traductions en temps réel avec un niveau de langage plus complexe et un vocabulaire plus recherché. Mais la société devrait pouvoir utiliser rapidement ces avancées pour améliorer ses outils de traduction déjà commercialisés. La prochaine étape ? Parvenir aux mêmes résultats avec des traductions orales.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.