Passer au contenu

Comment Waymo s’inspire de la théorie de l’évolution pour améliorer ses voitures autonomes

Les ingénieurs de la filiale d’Alphabet ont utilisé une nouvelle méthode héritée des experts de DeepMind pour entraîner des réseaux de neurones. Ils les ont rendu plus efficaces plus rapidement en les mettant en compétition et en les faisant évoluer.

Pour détecter des obstacles sur la route ou anticiper le comportement d’autres véhicules, les voitures autonomes font appel à des réseaux neuronaux qui nécessitent des quantités phénoménales de calcul et de très longues séances d’entraînement.

Pour optimiser ces processus d’apprentissage et améliorer la conduite de ses voitures, Waymo a trouvé un moyen plus efficace : s’inspirer de la théorie de l’évolution de Darwin !

Ainsi, ses chercheurs ont annoncé tout récemment avoir inauguré une nouvelle méthode baptisée PBT, pour Population Based Training. Cette approche est le fruit de la collaboration des experts en intelligence artificielle de DeepMind, une autre filiale d’Alphabet, et de Waymo.

Gagner du temps et des ressources

Schématiquement, les réseaux neuronaux apprennent de leurs erreurs à chaque fois qu’ils essaient d’accomplir la tâche qu’on leur a confiée. Mais les performances de ces réseaux neuronaux dépendent du « régime d’entraînement » choisi, qu’on appelle aussi planning d’hyperparamètres.
Ce choix est généralement confié à un ingénieur expérimenté qui va, en suivant son expérience ou son intuition, tenter certains réglages. Cet ingénieur essaye plusieurs modèles en parallèle de façon aléatoire, règle les paramètres manuellement, avant de sélectionner le plus performant. Il relancera ensuite un nouveau réseau neuronal «vierge» et ainsi de suite.

De son côté, pour gagner du temps, Deepmind a donc créé le PBT, qui consiste à lancer parallèlement plusieurs réseaux neuronaux dont les hyperparamètres (les variables) ont été choisis de manière aléatoire. Les algorithmes sont ensuite mis en compétition et évalués régulièrement.
A chaque évaluation, seuls les plus performants sont appelés à survivre et « enfantent ». Comprenez par là que leurs caractéristiques sont copiées dans un nouveau réseau neuronal qui bénéficie donc des entraînements déjà réalisés mais avec des variables légèrement modifiées.

En conséquence de quoi le PBT, qui n’a pas besoin de faire recommencer l’entraînement des réseaux neuronaux à zéro, optimise ses ressources et son temps à entraîner les bons paramètres seulement.

Intervention « divine »

Toutefois, cette tendance à éliminer les « faibles » un peu rapidement peut poser problème. Deepmind l’explique par le fait que cette technique privilégie le présent et n’est pas capable de voir sur le long terme. Or, privilégier les meilleurs algorithmes à un instant T peut revenir à éliminer un algorithme moins performant à cet instant T mais qui deviendra plus performant à l’instant T+1, par exemple. Autrement dit, les réseaux neuronaux qui montent en puissance plus lentement mais sont meilleurs ensuite n’ont pas l’occasion de faire leur preuve.
Pour combattre ce travers, Deepmind a accru le nombre et donc la diversité de la « population » des algorithmes. Puis, des sous-groupes ont été créés afin que les réseaux neuronaux s’affrontent dans une même espèce, entre semblables en quelque sorte.

Une petite révolution de l’entraînement

La méthode a été testée sur une première application consistant à générer une zone entourant un piéton, un cycliste ou un conducteur de moto. En l’espèce, le PBT a permis d’améliorer considérablement les performances du modèle en atteignant une précision supérieure et en réduisant les faux positifs de 24%. « PBT épargne du temps et des ressources », concluent les équipes de DeepMind dans un billet de blog.
L’entraînement et l’adaptation à de nouveaux éléments des IA qui pilotent les voitures autonomes s’effectuera plus rapidement. Elles deviendront ainsi plus sûres et fiables en moins de temps. Voilà qui est prometteur. Mais la force de cette méthode est qu’elle ne s’arrête pas au premier stop rencontré. Waymo et Deepmind voient déjà plus loin et souhaitent l’appliquer dans bien d’autres domaines.

Source : DeepMind

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.


Amélie CHARNAY