Passer au contenu

Comment Microsoft a utilisé ChatGPT pour piloter des drones et des robots

Microsoft estime que ChatGPT peut révolutionner l’industrie de la robotique. Grâce à l’intelligence artificielle d’OpenAI, il est en effet possible de contrôler des drones et des robots sans être un expert en programmation.

Soucieux de prendre la tête de la course à l’intelligence artificielle, Microsoft a injecté une fortune dans OpenAI, la start-up derrière ChatGPT. Fort de plusieurs investissements massifs, le géant de Redmond a promptement intégré le chatbot à Bing, son moteur de recherche, et à Edge, son navigateur web. Microsoft compte continuer sur sa lancée en incorporant ChatGPT à d’autres produits phares, comme Outlook, Word ou Powerpoint.

La firme américaine ne souhaite pas cantonner ChatGPT au secteur des logiciels. Microsoft ambitionne également de se servir des avancées d’OpenAI pour révolutionner le monde de la robotique. Dans un rapport publié il y a quelques jours, l’entreprise révèle avoir utilisé le chatbot d’OpenAI pour contrôler « des bras de robots, des drones et des robots assistants domestiques ».

Dans le détail, Microsoft s’est appuyé sur ChatGPT pour contrôler un drone volant. Sur demande de l’IA, l’engin a réalisé un zigzag dans les airs avant de prendre un selfie à l’aide de sa caméra intégrée. En suivant les ordres de ChatGPT, le drone est aussi parvenu à atteindre un endroit précis tout en évitant les obstacles sur sa route.

Les ingénieurs se sont aussi servis du chatbot pour faire des tests dans Microsoft AirSim, le simulateur pour les drones. Dans ses laboratoires, Microsoft a par ailleurs employé ChatGPT pour ordonner à un bras de robot d’empiler des blocs. La machine est parvenue à empiler ces blocs en suivant un modèle bien précis.

Faciliter la communication entre l’homme et la machine

Microsoft explique vouloir faciliter l’interaction entre les êtres humains et les robots en s’appuyant sur les modèles de langage d’OpenAI. Pour y parvenir, ChatGPT doit impérativement « penser au-delà du texte et raisonner sur le monde physique ». En clair, l’IA ne doit pas se contenter de générer des réponses basées sur les requêtes de son interlocuteur. Elle doit comprendre ce que les requêtes impliquent d’un point de vue de l’environnement et des lois de la physique.

« Il s’avère que ChatGPT peut faire beaucoup de choses par lui-même, mais il a encore besoin d’aide », déclare Microsoft, assurant que les premiers résultats sont encourageants.

À lire aussi : Microsoft savait que le ChatGPT de Bing allait piquer des crises… des mois avant le lancement

Utiliser ChatGPT comme traducteur

Dans le cadre de ses recherches, le géant américain a mis au point « des principes de conception ». Grâce à ces différents principes, Microsoft a utilisé ChatGPT pour générer du code capable de contrôler un robot. Une méthodologie complète a été développée par les ingénieurs du groupe sur base de ces préceptes. Celle-ci détaille comment il est possible de se servir d’un modèle de langage pour faciliter la programmation d’un robot.

Tout d’abord, il est impératif de définir un répertoire des fonctions du robot. Chaque fonction doit avoir un intitulé descriptif afin que ChatGPT comprenne de quoi il s’agit. Dans un second temps, l’utilisateur rédige une requête dans l’interface du chatbot décrivant la tâche qui attend le robot. Comme toujours, il faut donner le plus d’informations possible à l’IA pour obtenir le résultat voulu.

En rédigeant la requête, l’utilisateur doit décrire l’objectif de la tâche, indiquer quelles fonctions décrites auparavant doivent être utilisées, et préciser les éventuelles contraintes. Sur base des données fournies, ChatGPT va traduire la requête en langage de programmation. L’utilisateur peut alors évaluer le code fourni et réaliser une simulation par précaution, avant de le déployer sur l’automate. Au terme de ce processus, le robot aura obéi à une commande générée par ChatGPT sur demande de son interlocuteur. L’utilisateur n’a pas forcément besoin de connaître un langage de programmation complexe pour communiquer avec un robot ou un drone.

Notez que Microsoft n’est pas le seul titan de la technologie à se pencher sur l’utilité des modèles de langage dans le domaine de la robotique. Google travaille actuellement sur des expériences analogues en s’appuyant sur PaLM (Pathways Language Model), un modèle de langage de son cru.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.

Source : Microsoft


Florian Bayard
Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *