Passer au contenu

Apple élabore bien sur sa propre IA générative, nom de code MM1

Si l’entreprise à la pomme croquée va miser sur l’IA de Google pour ses iPhone, ce choix n’est probablement que transitoire ; elle devrait proposer son propre modèle d’ici quelques mois.

Tandis que Meta, Microsoft ou encore Google se livrent à une surenchère sur l’intelligence artificielle, et que Samsung présente ses Galaxy S24 comme de « smartphones IA » avant tout, un géant des nouvelles technologies est resté très discret jusqu’à présent : Apple. Nous avons appris récemment que la marque à la pomme croquée, dont Siri commence sérieusement à accuser le coup, négocierait avec Google pour intégrer son IA Gemini dans la prochaine version d’iOS. Cependant, au vu de la propension de l’entreprise à privilégier son indépendance, nous la voyons mal ne pas s’accommoder d’une solution d’un concurrent sur le long terme. Il se trouve qu’un document de recherche, publié en fin de semaine dernière par des équipes d’Apple, suggère que la firme développe bien son propre modèle d’IA générative. Son nom : MM1, possiblement pour MultiModal 1.

Une IA pour calculer le prix des bières

Le document traite d’un MLMM (Multimodal Large Language Model) capable de travailler avec du texte et des images. Les auteurs stipulent « qu’après l’essor des LLM, les MLLM apparaissent comme la prochaine frontière des modèles de base ».

Ci-dessous, l’un des exemples présentés : une photo d’une table sur laquelle sont disposées quelques bouteilles de bière ; une image du menu. MM1 doit déterminer combien coûte la consommation de l’ensemble des bières.

Mm1 Chatbot Biere
Une IA biberonnée à la bière © Apple

En se basant sur le nombre de paramètres, MM1 est un modèle plutôt modeste. Dans l’article, il est écrit : « Nous construisons MM1, une famille de modèles multimodaux, comprenant à la fois des variantes denses jusqu’à 30B et des variantes MoE [mixture-of-experts] jusqu’à 64B, qui sont SOTA dans les métriques de pré-entraînement et atteignent des performances compétitives après un réglage fin supervisé sur une gamme de points de référence multimodaux établis ».

Précisons que SOTA signifie State-of-the-art. C’est un terme utilisé pour désigner les technologies les plus récentes et les plus innovantes.

Selon les propos de Kate Saenko, professeur à l’université de Boston et spécialiste de l’apprentissage automatique, rapportés par The Wire, il serait toutefois hasardeux de tirer des conclusions à ce stade. Elle suggère que les ingénieurs d’Apple expérimentent différentes méthodes d’apprentissage à petite échelle, avant de passer à des modèles plus complexes. D’ailleurs, Brandon McKinzie, auteur principal de l’article MM1, a précisé sur X, « Ce n’est que le début. L’équipe travaille déjà d’arrache-pied sur la prochaine génération de modèles ».

iPhone-Gemini, une relation CDD ?

Comme rapporté ci-dessus, Apple envisagerait d’intégrer sous peu le chatbot Gemini de Google au sein de ses iPhones – moyennement au passage une coquête somme (dans le cadre de l’accord avec Google visant à faire du moteur de recherche du géant de Mountain View celui proposé par défaut sur les iPhone, ce dernier aurait versé plus de 18 milliards de dollars à Apple en 2021, selon les informations de The Wire). Il semble donc un peu contradictoire que ses équipes travaillent sur un chatbot en interne.

Seulement en 2012, Apple a bien lancé Apple Maps comme alternative à Google Maps, alors application de navigation par défaut sur les iPhone. En outre, le partenariat avec Google n’est peut-être qu’un moyen de gagner du temps. Ces dernières années, la firme de Cupertino a montré qu’elle préférerait prendre son temps ; directement sortir des produits très aboutis plutôt que de se précipiter sur un marché. En témoigne la commercialisation tardive du casque de réalité virtuelle Vision Pro, supérieur à bon nombre de produits concurrents sur de nombreux aspects. L’absence de l’entreprise sur le marché des smartphones pliants témoigne également de cette stratégie. D’autant plus que de nombreux éléments suggèrent que des iPhone pliants sont bien en préparation depuis plusieurs mois.

Quoi qu’il en soit, en matière d’IA générative, Tim Cook, PDG d’Apple, a promis aux investisseurs des annonces dans le courant de l’année.

🔴 Pour ne manquer aucune actualité de 01net, suivez-nous sur Google Actualités et WhatsApp.

Source : Apple via The Wire


Rémi Bouvet
Votre opinion
  1. Sachant que le but d’Apple est d’enfermer ses clients dans des prisons dorées pour mieux leur presser le portefeuille on craint le pire avec leur IA. Leur enfumage marketing va encore une fois tourner à fond.

  2. L’apparence modeste du LM (modèle de langage) tient peut-être au fait que Apple a comme argument le dit “on-device”, autrement dit, le fonctionnement local qui minimise l’envoi de données personnelles sur des serveurs! Qui sait? Attendons la WWDC au mois de join!

Les commentaires sont fermés.