Quand vivra-t-on dans un monde où nos appareils n’auront plus de clavier car nous interagirons avec eux uniquement par la voix ? A voir Siri et ses ratés, Google Now et ses imprécisions, ou Kinect et ses incompréhensions, le chemin risque d’être long.
Pour autant, Johan Schalkwyk voit les choses sous un jour bien plus encourageant. Ce chercheur spécialisé dans la reconnaissance vocale (et l’intelligence artificielle) au sein de Google travaille sur un projet ambitieux qui devrait permettre à nos smartphones et autres périphériques connectés de non seulement comprendre ce qu’on dit, mais également de percevoir tout un ensemble d’informations implicites. Un outil capable de « penser » à ce que l’interlocuteur vient de dire.
Un grand pas en avant
Pour réussir ce tour de force, les ingénieurs de Google utilisent des réseaux neuronaux, des milliers d’ordinateurs capables de travailler de conserve, un peu à la manière d’un cerveau humain. Il y a environ six mois, les équipes de Google ont changé leur approche afin de permettre aux « systèmes neuronaux » de conserver davantage de données et de traiter, par conséquent, des trains de données plus complexes et plus longs.
Cette amélioration du logiciel et de la façon de structurer le réseau neuronal a permis de faire sauter les dernières barrières qui empêchaient d’envisager que la reconnaissance vocale soit un jour vraiment intelligente. En effet, jusqu’en 2010, la lenteur relative des ordinateurs tenait à distance le rêve de voir un jour un utilisateur de discuter naturellement avec une intelligence artificielle qui non seulement reconnaîtrait les mots prononcés mais également leur sens et leur contexte. « Il y a encore un an, nous faisions des tests, et notre conclusion était que ce n’était pas encore possible. Tout a changé », indique à Bloomberg Tim Tuttle, spécialiste en intelligence artificielle au sein du MIT et dirigeant de Expect Labs, une start-up fondée il y a quatre ans.
Toucher bientôt au but
Le système de Google utilise désormais le contexte des propos recueillis mais également la localisation physique et d’autres éléments qui lui permettent de mieux qualifier l’utilisateur, afin de mieux cerner les propos et ce qu’ils peuvent signifier. Les nouveaux réseaux neuronaux du géant américain devraient encore augmenter la précision et l’efficacité de ce processus en lui permettant de gérer plus de données en temps réel. L’assistant vocal intelligent pourra ainsi répondre à des demandes plus complexes, avec une meilleure compréhension.
« Il y a trois ans, le système de reconnaissance vocale de Google ne reconnaissait que trois mots sur quatre que vous prononciez », indique Johan Schalkwyk à Bloomberg. L’accélération des progrès et de l’innovation dans ce domaine font que d’ici un an ou deux, ces technologies devraient arriver dans nos smartphones, estime le chercheur de Google.
Très bientôt, « nous vivrons dans un monde où les appareils n’auront pas de clavier », prédit Tim Tuttle. Une déclaration à ne pas prendre au pied de la lettre. Elle signifie plus l’arrivée à maturité d’une technologie que la fin des claviers, qui auront encore longtemps, pour des raisons de praticité et d’intimité, de beaux jours devant eux.
A lire aussi :
Reconnaissance d’images : on peut duper les ordinateurs – 24/12/2014
Source :
Bloomberg
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.