Aizip, une entreprise spécialisée dans l'apprentissage automatique, a présenté un modèle de l'IA innovant capable de se "répliquer" en générant d'autres algorithmes compacts et très spécialisés. Cette avancée pourrait jouer un rôle significatif dans la démocratisation de la technologie de l'IA.
En collaboration avec l'Université de Berkeley, l'Université de Davis et l'Université de San Diego, les ingénieurs de la startup californienne ont atteint une étape qui pourrait signifier un nouveau paradigme dans le domaine de l'IA. La société affirme avoir créé un modèle d'IA capable de produire d'autres modèles d'IA petits et spécialisés.
Au cours des dernières années, nous avons assisté à une montée fulgurante de l'IA générative. Des images au texte, en passant par l'audio ou le code informatique, les réseaux neuronaux artificiels sont désormais capables de produire du contenu numérique extrêmement convaincant avec une facilité déconcertante. Cependant, il existe un cap que aucune entreprise n'a encore réussi à franchir à ce jour : créer un système capable d'accoucher d'autres modèles d'IA préentraînés et fonctionnels. C'est pourtant ce qu'Aizip affirme avoir accompli dans un communiqué daté du 18 décembre.
Quand l'IA Devient Procréative
"Nous utilisons de gros modèles pour construire de plus petits, comme un grand frère qui aide son cadet à s'améliorer. C'est la première étape sur la route qui permettra de montrer que des modèles d'IA peuvent construire d'autres modèles d'IA", explique Yan Sun, PDG d'Aizip dans une interview à Fox News.
Bien que cette réalisation soit une preuve de concept, selon le communiqué de l'entreprise, c'est la première fois qu'un programme démontre la capacité de gérer l'ensemble du processus de conception de l'IA, de la collecte des données à la validation en passant par l'entraînement, sans la moindre intervention humaine.
Appelé Aizipline, l'objectif de ce système n'est pas de créer de gros modèles sophistiqués comme GPT, l'impressionnant modèle de langage d'OpenAI. À la place, il vise à générer une grande variété de petites applications d'IA spécialisées dans la résolution de divers problèmes. Sun cite notamment l'identification des voix humaines, le suivi de l'activité dans les pipelines, ou le suivi des espèces en voie de disparition à des fins de conservation.
Utilisables Localement : Mini-Modèles pour une Intégration Pratique
Au-delà de sa polyvalence, cette approche offre également un avantage pratique non négligeable en termes d'intégration. Les grands modèles de langage comme GPT sont extrêmement complexes et trop lourds pour être intégrés dans de petits appareils. En pratique, ils résident donc dans un écosystème cloud auquel les clients accèdent par l'intermédiaire d'une API.
En revanche, les modèles produits par Aizipline sont présentés comme des "mini-modèles" compacts et légers. Ils pourraient donc être utilisés localement par différents appareils pour créer un écosystème d'objets dopés à l'IA. Une philosophie qui ressemble vaguement à celle de l'Internet des objets (IdO), mais appliquée à l'intelligence artificielle.
"Avec l'aide des gros modèles qui servent de fondations, les petits modèles évolueront plus rapidement que les gros, donc la tendance est clairement en leur faveur", déclare le communiqué d'Aizip. "Comme les minuscules cerveaux des petits animaux qui peuvent agir et percevoir le monde qui les entoure avec moins d'un million de neurones, ces mini systèmes d'IA qui alimenteront la technologie de demain auront besoin de solutions astucieuses, efficientes pour opérer avec un minimum de puissance et d'impact environnemental."
Une Autre Conception de l'Apprentissage Automatique
Les chercheurs reconnaissent cependant qu'il reste beaucoup de travail avant d'y parvenir. Mais ces initiatives seront aussi une bonne occasion de travailler sur des problèmes de fond qui sont très importants pour l'IA dans son ensemble.
"Nous allons nous pencher sur des questions fascinantes en cours de route", explique Yubei Chen, directeur technique d'Aizip. "Où trouver les bonnes informations dans des jeux de données massifs ? Comment générer des données à partir de ressources limitées ? Comment définir et garantir la robustesse de ces systèmes dans le monde réel ? Comment maximiser la capacité des réseaux de neurones à travailler avec des ressources limitées ? Comment débuger un modèle d'IA ?" cite-t-il. "Nous essayons de simplifier et d'optimiser chaque étape de la conception d'une IA avec un minimum d'intervention humaine", résume-t-il.
Au-delà de ces défis techniques, il conviendra donc de surveiller l'évolution de cette thématique. Certes, il est encore trop tôt pour déterminer si les pronostics d'Aizip vont se réaliser, mais force est de constater que la tendance actuelle va dans leur sens. On constate aujourd'hui que de plus en plus d'appareils se dotent de petits modèles d'IA spécialisés. Nous l'avons encore constaté récemment avec les fonctionnalités photos du Pixel 8, ou avec la sortie des nouveaux processeurs Intel Core Ultra qui sont équipés d'une petite puce dédiée à l'apprentissage automatique. Reste à voir comment cette dynamique va évoluer sur les prochaines années.