Cette semaine, nous avons coché sur nos calendriers la première décennie écoulée depuis la mort de Steve Jobs, et un jour plus tôt, soufflez les bougies de l’anniversaire de Siri, qui fêtait lui aussi ses dix ans. Dix ans que « l’humble assistant personnel », pour reprendre ses propres mots, a inauguré une nouvelle ère, entamé une nouvelle révolution d’interaction. Bref, qu’il est parti à la conquête du monde avec la promesse de nous faciliter la vie, de nous donner accès à des informations ou actions simplement. Dix ans que le futur est à nos portes et disons-le tout net, dix ans qu’il reste sur le seuil.
A découvrir aussi en vidéo :
Un état des lieux lucide
Ce 4 octobre 2011, Phil Schiller, monsieur Loyal bonhomme, dessinait les contours exacts des limites des interactions vocales possibles jusque-là. Les mots-clés, antinomiques d’un langage naturel et fluide, les compétences réduites et trop rares, les lenteurs et la mécompréhension, ou même le caractère impersonnel. C’est tout cela que Siri voulait changer. Et à l’époque, effectivement, même si la version française était moins engageante que son pendant américain – et c’est toujours le cas – l’effet était bluffant. On assistait à des premiers pas et le potentiel ne pouvait être que prometteur. C’était la fonction phare de cet iPhone 4s.
Dix ans plus tard, Siri a consolidé ses bases, fait du chemin et a essaimé au-delà de l’iPhone. Il s’est enrichi de suggestions contextuelles, proactives, pas toujours pertinentes, mais l’effort est louable. Mais surtout, afin de rendre les interactions plus naturelles et fluides, il a aussi pris son indépendance, plus besoin de presser le bouton qui l’activait initialement. Le désormais célèbre « Dis, Siri » suffit à l’invoquer… mais le renvoie aussi immédiatement à ce qu’il est, un « modeste assistant personnel ».
Car il ramène le concept de mot-clé sur la table et crée de facto une distance malgré sa praticité. Il induit aussi des dizaines de faux départs, de fausses activations, agaçantes, qui portent un sacré coup à l’impression d’avoir un outil performant à disposition.
https://www.youtube.com/watch?v=hSJqPul24DI?start=1173
Enfin, il provoque un déclenchement en cascade. Si vous avez différents appareils Apple à portée de voix – de la Watch à votre MacBook en passant par votre HomePod mini et votre iPhone – interpeler Siri revient parfois à réveiller la bête partout, et donc nulle part où elle pourra vraiment vous aider. Vous vouliez demander à Siri d’ouvrir un tableau Excel sur votre Mac, c’est le HomePod qui va s’évertuer à lancer un morceau des Excel, un groupe qui n’existe pas à notre connaissance !
Et c’est là un problème important, né d’une évolution logique, Siri n’est pas un. Il s’est décliné en fonction des supports qui l’hébergent – de plus en plus en local d’ailleurs, ce qui est une bonne chose. Il s’est adapté à ce qu’on peut attendre d’une enceinte connectée, d’un smartphone, d’une montre, etc. Cela signifie évidemment qu’on ne peut pas demander tout et à tous les Siri. Mais le fait qu’Apple n’arrive pas à savoir à quel Siri on s’adresse met en avant de manière saillante ses limites et erreurs.
Une mission impossible ?
Et il y en a beaucoup, même quand on s’adresse au bon Siri. Des problèmes de reconnaissance vocale, des problèmes de limites à son savoir (ou en tout cas à la façon dont il est structuré et accessible), des problèmes d’intelligence « commune », des problèmes d’incompréhension du contexte, des problèmes d’incapacité à appliquer deux ordres donnés dans une même phrase : « Monte le chauffage et lance France Inter », etc.
Si le cœur des fonctions vantées par Phil Schiller et Scott Forstall le 4 octobre 2011 est là et maîtrisé, dans la plupart des cas, on se heurte bien trop vite à un mur de la réalité, à des erreurs incompréhensibles ou même à une lenteur inexpliquée.
Comment avoir envie d’utiliser Siri quand il est plus simple et efficace de créer un rappel à la main sur son smartphone ? Comment passer au tout domotique quand il est plus rapide d’éteindre les lumières à la main ? Comment ne pas enrager quand on demande en chuchotant l’extinction des quelques lampes allumées au petit matin pour entendre Siri beugler ensuite qu’elle n’a pas réussi à éteindre une lampe… qui l’était déjà ? Où est l’intelligence ? Où est le sens du contexte ? Où est l’assistance promise ? On voit bien l’humilité, mais pour le reste…
Siri et les autres sont dans un bateau…
Mais Siri n’est pas le seul, plus le seul. Dès 2012, il a vu des concurrents arriver, dont les destinées ont été souvent chaotiques. Citons S Voice, mué en Bixby, de Samsung, Google Now, renommé en Assistant, Cortana, passé… aux abonnés absents chez Microsoft, ou encore Alexa, qui croît dans l’ombre colossale et un peu inquiétante d’Amazon.
Tous les géants de la tech ont leur assistant. Tous croient et veulent nous faire croire à ce moyen d’interaction qu’est la voix. Tous, depuis dix ans, enregistrent nos commandes, nos interjections, nos crises de nerf, peaufinent leurs algorithmes de reconnaissance vocale, de retranscription de la parole en texte, de synthèse vocale.
Dans ces domaines, les progrès sont réels. Ainsi, le gain en puissance des appareils permet de limiter les données de remonter dans le cloud, les voix synthétiques sont plus naturelles et moins horripilantes. Bref, sur les 100% du chemin à parcourir pour obtenir un vrai assistant intelligent, naturel et fluide, comme nous en vend la science-fiction depuis des années – Hello, Jarvis ! Non, pas toi Vision… – peut-être en sommes-nous à 95, voire 98%. Mais les derniers pourcents sont et seront les plus durs à grappiller.
Ces progrès diffus mais pas vraiment convaincants, cette gadgétification de la technologie au détriment de l’usage pertinent, cette mise dans la balance de nos vies privées, tout pointe dans une direction peu agréable. Depuis dix ans, nous payons pour des appareils – c’est encore plus flagrant pour les enceintes – dont la fonction logicielle principale est… en bêta. Et cela est vrai pour toutes ces technologies, pas seulement pour Siri.
Le cas particulier de Siri, premier d’entre eux, historiquement au moins
L’assistant d’Apple n’est clairement pas le meilleur. Mais cette perte de la première place, Apple la doit à un empilement de dominos. On en citera une petite poignée. Le premier, le moindre savoir-faire dans l’organisation du savoir : Google en est le roi, puisque c’est son premier métier.
Le deuxième, un positionnement très centré sur le respect de la vie privée – qui l’a empêché d’accumuler beaucoup de données pour entraîner ses modèles, notamment. Même si le géant de Cupertino a commis des erreurs dans ce domaine. Google et Amazon, notamment, ont avancé bien plus vite, en s’encombrant moins de certains détails et remords – et en investissant davantage également, ou en en faisant davantage publicité, il faut le dire.
Il est intéressant de voir toutefois qu’Apple a dû emprunter d’autres voies, des solutions différentes, notamment celle de la confidentialité différentielle pour l’entraînement des algorithmes d’apprentissage machine. Le goût du secret d’Apple a également été parfois pointé du doigt pour expliquer les retards de Siri.
Enfin, le troisième domino, une longue errance interne et une perte de repères. En 2018, deux articles, l’un du magazine Quartz et l’autre du site The Information, éclairaient cette réalité cachée. Steve Jobs croyait beaucoup dans le potentiel de Siri, depuis la première présentation que lui en avait fait Scott Forstall. Ainsi, l’équipe en charge du développement de l’assistant est passé de 24 personnes en avril 2010, au moment du rachat de la jeune structure par Apple, à presque 100 un peu plus d’un an plus tard. Le projet était lancé, mais pas assez pour ne pas être ébranlé par la disparition du patron d’Apple. « Quand Steve est mort, le lendemain du lancement de Siri, ils ont perdu leur vision », expliquait à The Information un membre de l’équipe originelle. Une perte de ligne directrice qui s’est manifestée par certains choix, comme celui d’abandonner Nuance, dont nous serions bien incapable de juger la pertinence.
Steve Jobs voyait grand, il voulait que Siri se place au centre d’une multitude de services créés par des développeurs tiers. Mais pour tenir les délais, intégrer Siri dans l’iPhone 4s, des choix ont été faits, moins ambitieux, évidemment. Avec des fonctions surtout totalement contrôlées par Apple… Un travers qu’il est difficile de mettre uniquement sur le dos de l’urgence, tant il fait écho à une pratique récurrente au sein du géant de Cupertino. Il a fallu attendre 2016 pour voir arriver SiriKit et un semblant d’ouverture sur le monde extérieur.
Trop tard ? Difficile à dire, mais devant la complexité de la tâche à mener, l’immensité des travaux concomitants à faire avancer, la fermeture du départ n’a pas aidé à améliorer les interactions, c’est certain. Le départ de Scott Forstall a, lui aussi, été un coup dur pour Siri, dont les équipes se sont retrouvées bringuebalées ensuite dans la division Services d’Eddie Cue, avant de revenir dans le giron du logiciel et de Craig Federighi.
Au-delà de la parole, l’intelligence et la vivacité de l’esprit humain
Des errements, qui peuvent expliquer les soucis de performance de Siri. Mais pas l’état général des assistants vocaux, qui sont encore loin de supplanter les interfaces plus classiques que comme le duo clavier / souris ou leur évolution, les écrans tactiles. Car pour l’heure, Siri et ses congénères offrent au mieux un usage ponctuel, et sont souvent un gadget vite délaissé. Quelle valeur ajoutée apportent-ils vraiment au quotidien à part quelques usages ciblés et qui, finalement, changent assez peu notre vie : savoir qu’il va faire beau sans lancer son appli météo, est-ce une révolution ? Lancer un compte à rebours pour cuire un œuf, mérite-t-il un tel investissement ? Passer un appel sans sortir son téléphone de sa poche, bouleverse-t-il l’équilibre de votre univers ?
Les assistants numériques donnent encore trop peu, ils ne tiennent pas la promesse initiale, celle de nous faciliter la vie, tout simplement. C’est une tâche immense où la difficulté n’est pas tant de parler et de comprendre les mots, mais de saisir le contexte, l’intention. Siri et les autres nous montrent à quel point il est difficile d’imiter ce que l’humain fait si naturellement, communiquer. La science-fiction est un miroir déformant qui nous fait trop espérer, trop vite. Apple et les autres doivent renforcer l’attrait de leur assistant pour qu’ils deviennent un moyen d’interaction privilégié… Mais la route est encore longue et semée d’embûches, technologiques et déontologiques. L’ère de la bêta est loin d’être derrière nous. « Dis, Siri, mets-moi un rappel pour dans dix ans. » Tiens, ça n’a pas marché !
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.