Cela faisait quatre ans que Google Traduction n’avait pas intégré de nouvelles langues. La mise à jour lancée hier s’accompagne d’une fournée de cinq idiomes : le ouïghour (en Chine et Asie centrale), le tatar (Europe de l’Est et Asie centrale), le turkmène (Irak, Iran, Turkménistan), le kinyarwanda (Rwanda) et l’odia (Inde).
Elles sont pratiquées par 75 millions de personnes
Elles seraient pratiquées au total par plus de 75 millions de personnes dans le monde, d’après un post de Google. La prise en charge du ouïghour est loin d’être anodine. Les 12 millions d’individus concernés vivent principalement au nord-ouest Chine. Ils forment une minorité turcophone et musulmane particulièrement surveillée et même persécutée par le gouvernement.
D’après The Verge, la difficulté pour Google était de trouver suffisamment de textes dans chacune de ces langues. Une première étape indispensable pour former les algorithmes de deep learning développés en interne. L’autre problème était de se faire aider par des bénévoles compétents au sein de la communauté Google Translate. Car leur intervention est indispensable pour améliorer et corriger les résultats.
La traduction de textes et de sites web est prise en charge pour chacune de ces cinq nouvelles langues. En revanche, la saisie via le clavier virtuel de Google est disponible uniquement pour le tatar, l’ouïghour et le kinyarwanda.
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.