De nouvelles puces pour alléger la facture de l’IA 

Par Zakaria Choukrallah

Dans le monde du hardware lié à l’IA, le roi du pétrole s’appelle Nvidia. Le fabricant américain de puces graphiques, élément central de tout système opérant l’IA, a franchi pour la première fois la barre des 5000 milliards de dollars en octobre dernier. 

Le géant des GPU est le maître du temps, grâce à ses innovations technologiques et sa capacité de production des puces les plus avancées en la matière. Ce sont notamment certaines de ses puces que les Américains interdisent aux Chinois. et que Trump veut voir fabriquées sur le sol américain. 

“OpenAI a présenté “Jalapeño”. Une puce IA custom qui peut prendre en charge tous les grands modèles de langages, actuels et futurs, selon la firme de ChatGPT”

Zakaria Choukrallah

Toujours est-il que le mur de cette domination commence à se fissurer. OpenAI a présenté “Jalapeño”. Une puce IA custom, réalisée avec l’américain Broadcom. Elle est destinée pour le moment uniquement à l’inférence, c’est-à-dire à la phase ou l’IA applique sur de nouvelles données ce qu’elle a “appris”. Cette puce peut prendre en charge tous les grands modèles de langages, actuels et futurs, selon la firme de ChatGPT. 

Elle signale l’intention des géants du secteur de s’affranchir un peu de Nvidia. D’ailleurs, Google est déjà équipé de ses solutions et Anthropic, lui, mise sur une stratégie multi-puces avec plusieurs partenaires. Si tout ce beau monde se rue sur le silicium, ce n’est pas pour le plaisir d’innover en hardware. C’est surtout parce qu’une puce spécialisée est moins chère qu’un GPU Nvidia. C’est une stratégie de réduction de coûts, nécessaire à l’heure ou la facture explose sans perspective concrète de rentabilité.