Passer au contenu

Google veut vous aider à bricoler votre propre caméra intelligente avec ses outils et un Raspberry Pi

Google présente le Vision Kit est une boîte à monter soi-même qui intègre une puce Intel Movidius et les outils d’apprentissage machine TensorFlow du géant de Moutain View. De quoi lancer rapidement n’importe quel projet de visual computing.

En mai dernier, Google enfantait sa gamme de produits destinés aux bidouilleurs avec le lancement du kit « AIY Voice Kit », une boîte de carton intelligente à monter soi-même afin de créer un Assistant Google de toute pièce.
La famille AIY (artificial intelligence yourself) de Google s’élargit aujourd’hui avec le lancement du Vision Kit, une autre boîte en carton qui comprend tous les éléments – carte électronique, câbles, optique, etc. – pour lancer un projet autour de la reconnaissance d’image et de la technologie d’apprentissage machine TensorFlow de Google. Un kit qui coûtera 50 $ (un seul distributeur US pour le moment) et qui sera disponible à partir du 31 décembre 2017.

Google ambitionne ici de faciliter la création de projets utilisant une caméra pour ouvrir une porte que votre chien approche – mais pas le chat du voisin, qui reconnaisse les utilisateurs d’un service (Netflix, etc.) et tout autre idée plus ou moins utile ou farfelue. L’intérêt de la solution de Google est son caractère tout en un, son petit prix, et le fait que tant le matériel que le logiciel soient développés et soutenus par le géant américain.

Conçu autour d’un Raspberry Pi

Comme dans le cas du Voice Kit, la machine est propulsée par une carte Raspberry Pi Zero W qui n’est pas comprise dans le kit. Autre achat non optionnel à prévoir : la Raspberry Pi Camera 2 (un module caméra 8 Mpix conçu autour d’un capteur Sony IMX219PQ) et une carte SD pour installer le système. Un système qui prendra la forme d’une image ISO qui sera téléchargeable au moment de la disponibilité officielle du Vision Kit.

Intel Movidius pour tous

À lire :  Movidius, l’arme d’Intel pour offrir une vision humaine à son intelligence artificielle

Si la gestion des entrées/sorties, du réseau, de l’alimentation, etc. est bien opérée par le Raspberry Pi, la partie analyse de l’image est réalisée par une puce Intel, la Movidius Myriad 2 MA2450. Rachetée par Intel en 2016, Movidius est un spécialiste du « visual computing » et de la création de VPU (Vision Processing Unit), des puces dédiées uniquement à l’analyse du contenu d’une image. Le MA2450 embarqué est un processeur multicoeurs 28 nm complexe (12 unités vectorielles 128 bit dédiées à la vision, deux processeur RISC 32 bit en chefs d’orchestre) qui embarque 4 Go de RAM (LPDDR3) et qui délivrerait « des TeraFLOPS* de performance pour une enveloppe thermique de 1W ». En clair : une puce hyperspécialisée peu énergivore, et surpuissante dans le traitement d’un signal visuel.

https://www.youtube.com/watch?v=JXh1yyvXpwo

La Movidius MA2450 serait la même puce qui propulserait le Google Clip, ce qui semble logique : Google a déjà développé les outils logiciels et n’aurait plus qu’à les mettre à la disposition de la communauté via le AIY Vision Kit.

Comme les assistant vocaux, le visual computing n’en est qu’à ses balbutiements mais dans l’effervescence autour de ces technologies d’analyse, de traitement et de reconnaissance d’image, Google préfère (logiquement) que les makers optent pour ses propres solutions.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.