Quatre ans après le rachat de Prime Sense, la start-up qui a créé Kinect, Apple continue de déposer des brevets liés à cette acquisition. Le dernier en date détaille un système de reconnaissance de multiples visages optimisé grâce à une technologie de mesure de la profondeur de champs.
Mieux, l’algorithme en question est capable d’identifier les visages non pas dans une image fixe, mais dans une scène dynamique, que vous filmez en direct, par exemple. Les personnes filmées se déplacent alors non seulement dans le plan principal mais également à l’arrière-plan et à l’avant-plan, bref, sur toute la profondeur du champs.
Kinect, à la rescousse !
Souci, pour réussir à reconnaître des visages dans ce genre de configuration, les systèmes généralement utilisés requièrent beaucoup de puissance de calcul. En effet, un système conventionnel découperait la scène en plusieurs « fenêtres » de tailles différentes et y chercherait des visages. Compliqué sur une image en mouvement, d’autant que le système peut assez facilement se tromper.
Apple a donc eu recours à l’expertise de Prime Sense dans les “caméras 3D” pour réduire le taux d’erreur et le nombre d’opérations de calcul nécessaires. Comment ? En croisant deux éléments. Le premier, la taille “normale” d’une tête, d’un visage, selon la distance à laquelle se tient le sujet. Ensuite, second élément essentiel, un système de mesure de la profondeur de champs.
Répertorier tous les plans
Pour schématiser, si ce qui pourrait ressembler à une tête de taille normale située à 2 mètres se trouve à 16m, il est peut probable qu’il s’agisse d’un vrai visage… L’algorithme de détection réalise donc une seule mesure et écarte ensuite tout ce qui ne répond aux bons critères. Un bon moyen pour éviter les mesures gourmandes en puissance de calcul.
Afin d’obtenir ces données, le système présenté dans ce brevet utilise donc des informations relatives à la profondeur de champs. Il se sert d’un émetteur spécial de lumière infrarouge, qui projette un motif sur une scène. C’est ce motif qui permet de définir les différents plans. La lumière est ensuite capturée et traitée pour établir une carte de profondeurs correspondant aux différents plans de la scène réelle.
Pour ceux qui s’étaient intéressés à la caméra Kinect de la Xbox 360/One, ce procédé vous dira certainement quelque chose.
Un humain, oui, mais qui ?
Reste que si cette technologie permet de reconnaître des visages en général, elle ne permet pas de reconnaître un individu en particulier. Ce n’est donc pas un outil biométrique en tant que tel mais il pourrait très bien servir de base à un système de reconnaissance plus élaboré. Ou encore être utilisé dans le cadre de prise de clichés ou de la réalité augmentée, à laquelle Tim Cook croit beaucoup.
Ceci dit, un brevet ne signifie pas forcément qu’une technologie sera un jour adoptée. Néanmoins, certaines rumeurs concernant l’iPhone 8 ou Edition font état de l’arrivée d’un module photographique révolutionnaire, qui se verrait adjoindre un capteur infrarouge…
Or, économiser de la puissance de calcul quand on envisage d’intégrer une technologie dans un appareil mobile est souvent le premier problème à régler. Il se pourrait que ce brevet vienne prouver qu’Apple a trouvé la solution. Ne reste plus qu’à patienter pour savoir si les rumeurs disent vrai. L’iPhone 2017 devrait être annoncé en septembre prochain, si les équipes de Tim Cook tiennent leur calendrier habituel.
Source :
USPTO
🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.