Des chercheurs de Microsoft d�veloppent un mod�le d'IA hyper-efficace qui peut fonctionner sur les CPU

**Jade Emy** · 18/04/2025, 18h56

Des chercheurs de Microsoft d�veloppent un mod�le d'IA hyper-efficace qui peut fonctionner sur les CPU, BitNet b1.58 2B4T, le plus grand mod�le d'IA � 1 bit � ce jour avec 2 milliards de param�tres

Des chercheurs de Microsoft affirment avoir mis au point le plus grand mod�le d'IA � 1 bit, �galement connu sous le nom de � bitnet �, � ce jour. Baptis� BitNet b1.58 2B4T, il est disponible sous licence MIT et peut fonctionner sur des CPU, y compris le M2 d'Apple. Les bitnets sont essentiellement des mod�les compress�s con�us pour fonctionner sur du mat�riel l�ger.

L'intelligence artificielle (IA) d�signe la capacit� des syst�mes informatiques � effectuer des t�ches typiquement associ�es � l'intelligence humaine, telles que l'apprentissage, le raisonnement, la r�solution de probl�mes, la perception et la prise de d�cision. � la fin des ann�es 2010, les unit�s de traitement graphique (GPU), de plus en plus con�ues avec des am�liorations sp�cifiques � l'IA et utilis�es avec le logiciel sp�cialis� TensorFlow, ont remplac� les unit�s centrales de traitement (CPU) pr�c�demment utilis�es comme moyen dominant pour la formation des mod�les d'apprentissage automatique � grande �chelle.

R�cemment, des chercheurs de Microsoft viennent d'annoncer un nouveau mod�le d'IA r�volutionnaire qui n'est pas seulement puissant, mais aussi incroyablement efficace. Baptis� BitNet b1.58 2B4T, ce mod�le est con�u pour fonctionner sans probl�me sur les processeurs CPU, m�me ceux de vos appareils de tous les jours, comme les puces M2 d'Apple. Qu'est-ce que cela signifie pour l'avenir de l'IA ?

Nom : 1.jpg
Affichages : 10265
Taille : 72,8 Ko

BitNet b1.58 2B4T : Le mod�le d'IA hyper-efficace de Microsoft

Microsoft fait des vagues avec sa derni�re cr�ation, BitNet b1.58 2B4T. Mais qu'est-ce qu'un � bitnet � exactement, et pourquoi devriez-vous vous y int�resser ? Les bitnets sont les athl�tes rationalis�s du monde de l'IA. Ils sont con�us pour offrir des performances maximales avec un minimum de ressources. Les bitnets sont essentiellement des mod�les d'IA compress�s. Cette compression est essentielle car elle leur permet de fonctionner sur du mat�riel qui n'est pas n�cessairement haut de gamme, comme les unit�s centrales de traitement (CPU).

BitNet b1.58 2B4T utilise la quantification pour plus d'efficacit�. Les mod�les d'IA traditionnels utilisent souvent des � poids � complexes, c'est-�-dire les param�tres internes qui guident l'apprentissage du mod�le. Pour rendre ces mod�les plus polyvalents, ces poids sont souvent � quantifi�s �. La quantification r�duit le nombre de bits n�cessaires pour repr�senter ces poids, ce qui all�ge le mod�le et le rend plus rapide. BitNet pousse la quantification � l'extr�me. Au lieu d'utiliser la gamme typique de valeurs pour les poids, il les comprime � seulement trois : -1, 0 et 1. Cette simplification radicale est ce qui rend les mod�les BitNet incroyablement efficaces en termes de m�moire et de calcul.

Le BitNet b1.58 2B4T de Microsoft n'est pas un bitnet comme les autres ; c'est le plus grand � ce jour, avec 2 milliards de param�tres. Dans ce contexte, les param�tres sont essentiellement les m�mes que les � poids �. Ce mod�le, entra�n� sur un ensemble massif de donn�es de 4 000 milliards de jetons (33 millions de livres !), d�montre que m�me � grande �chelle, l'approche efficace des mod�les d'IA de BitNet reste solide.

Selon les chercheurs de Microsoft, BitNet b1.58 2B4T ne se contente pas de se maintenir, il surpasse les mod�les d'IA traditionnels de taille similaire. Il surpasse des mod�les comme Llama 3.2 1B de Meta, Gemma 3 1B de Google et Qwen 2.5 1.5B d'Alibaba sur des points de r�f�rence cl�s. La vitesse est peut-�tre l'aspect le plus impressionnant. BitNet b1.58 2B4T serait deux fois plus rapide que d'autres mod�les de sa taille dans certains tests, tout en utilisant beaucoup moins de m�moire. Cela change la donne pour le d�ploiement de l'IA dans des environnements � ressources limit�es.

Imaginez les implications d'un tel mod�le ! Dans le domaine de la cryptomonnaie, une IA plus rapide et plus l�g�re pourrait alimenter des applications d�centralis�es plus r�actives et plus accessibles, am�liorer l'analyse de la blockchain et m�me renforcer les protocoles de s�curit� sans n�cessiter d'�normes fermes de serveurs. Cela ouvre des possibilit�s d'int�gration de fonctionnalit�s d'IA sophistiqu�es directement dans les portefeuilles, les �changes d�centralis�s et d'autres plateformes, sans qu'il soit n�cessaire de mettre en place une infrastructure lourde. En outre, un traitement plus rapide des transactions, � des contrats intelligents plus intelligents et � des exp�riences utilisateur am�lior�es, le tout aliment� par une IA l�g�re.

Nom : 2.jpg
Affichages : 1816
Taille : 71,8 Ko

L'avantage du CPU : D�mocratiser le traitement de l'IA

La capacit� de BitNet b1.58 2B4T � fonctionner sur des CPU est un �l�ment central de son attrait et un changement de paradigme potentiel. Pourquoi est-il si important de fonctionner sur les CPU ?

Accessibilit� et rentabilit� : Les CPU sont omnipr�sentes. Ils sont pr�sents dans nos ordinateurs portables, nos ordinateurs de bureau et m�me nos smartphones. Contrairement aux unit�s de traitement graphique (GPU), qui sont souvent sp�cialis�es et co�teuses, les CPU sont facilement disponibles et plus abordables. Cela r�duit consid�rablement la barri�re � l'entr�e pour l'ex�cution de mod�les d'IA avanc�s.
Des possibilit�s de d�ploiement plus larges : Les CPU �tant tr�s r�pandues, les mod�les BitNet peuvent �tre d�ploy�s sur une gamme beaucoup plus large d'appareils. Ceci est crucial pour les applications qui doivent �tre accessibles � une large base d'utilisateurs qui n'ont pas forc�ment acc�s � du mat�riel haut de gamme.
Efficacit� �nerg�tique : Les CPU sont g�n�ralement plus �conomes en �nergie que les GPU pour certains types de t�ches, en particulier lorsqu'il s'agit de mod�les comme BitNet qui sont con�us pour l'efficacit�. Cela correspond � l'importance croissante accord�e � la durabilit� dans les domaines de l'IA.

Imaginez un avenir o� l'ex�cution d'algorithmes d'IA complexes est aussi courante que l'ex�cution de n'importe quel autre logiciel sur votre ordinateur. BitNet sur les CPU nous rapproche de cette r�alit�, en rendant l'IA sophistiqu�e plus accessible � tous, et pas seulement � ceux qui ont acc�s � de puissantes grappes de GPU.

Cependant, bien que BitNet b1.58 2B4T soit une avanc�e significative, il y a des d�fis � prendre en compte. Bien que BitNet soit efficace et rapide, il est important de se rappeler qu'il ne � balaie pas le sol � de tous les mod�les rivaux en termes de performances brutes. Il tient son rang et excelle en termes d'efficacit�, mais dans les sc�narios o� la performance absolue est primordiale et o� les ressources sont abondantes, d'autres mod�les peuvent encore �tre pr�f�r�s.

Pour atteindre des performances maximales, BitNet b1.58 2B4T n�cessite actuellement le cadre personnalis� de Microsoft, bitnet.cpp. Ce cadre a des limites mat�rielles et, notamment, ne prend pas encore en charge les GPU, qui sont la force dominante dans l'infrastructure de l'IA. En outre, la d�pendance � l'�gard d'un cadre sp�cifique et la compatibilit� mat�rielle limit�e constituent un d�fi pour l'adoption g�n�ralis�e. Pour que BitNet prenne v�ritablement son envol, une prise en charge plus large du mat�riel et des cadres potentiellement plus polyvalents sont n�cessaires.

Malgr� ces difficult�s, la promesse de l'accessibilit� de l'IA gr�ce � des mod�les tels que BitNet est ind�niable. L'avenir nous r�serve probablement d'autres d�veloppements de la technologie BitNet, notamment un support mat�riel �largi, le d�veloppement de cadres ainsi que l'optimisation et mise � l'�chelle. Les efforts visant � �largir la compatibilit� pour inclure les GPU et une plus large gamme de CPU sont cruciaux. La cr�ation de cadres plus ouverts et polyvalents qui prennent en charge les bitnets pourrait acc�l�rer l'adoption et l'innovation. La poursuite de la recherche sur l'optimisation des architectures bitnet et leur mise � l'�chelle pour des mod�les encore plus grands et plus complexes sera essentielle pour lib�rer tout leur potentiel.

bitnet.cpp : Essayez sur votre propre CPU

bitnet.cpp est le cadre d'inf�rence officiel pour les LLMs 1-bit (par exemple, BitNet b1.58). Il offre une suite de noyaux optimis�s, qui permettent une inf�rence rapide et sans perte des mod�les 1.58-bit sur le CPU (avec un support NPU et GPU � venir).

La premi�re version de bitnet.cpp est destin�e � prendre en charge l'inf�rence sur les CPU. bitnet.cpp permet d'obtenir des gains de vitesse de 1,37x � 5,07x sur les CPU ARM, les mod�les les plus importants b�n�ficiant de gains de performance plus importants. En outre, il r�duit la consommation d'�nergie de 55,4 % � 70,0 %, ce qui am�liore encore l'efficacit� globale.

Sur les processeurs x86, les gains de vitesse vont de 2,37x � 6,17x avec des r�ductions d'�nergie allant de 71,9 % � 82,2 %. En outre, bitnet.cpp peut ex�cuter un mod�le BitNet b1.58 de 100B sur un seul CPU, atteignant des vitesses comparables � la lecture humaine (5-7 jetons par seconde), am�liorant de mani�re significative le potentiel d'ex�cution des LLM sur des dispositifs locaux.

Conclusion

Le BitNet b1.58 2B4T de Microsoft est plus qu'une simple r�alisation technique ; c'est un aper�u d'un avenir o� l'IA est plus d�mocratis�e, plus accessible et plus efficace. En prouvant que des mod�les d'IA � grande �chelle peuvent fonctionner efficacement sur des CPU, BitNet remet en cause l'id�e re�ue selon laquelle une IA puissante n�cessite des ressources informatiques massives. Alors que l'IA continue d'�voluer, des innovations comme BitNet contribueront � fa�onner un avenir o� l'IA ne sera pas seulement puissante, mais aussi durable et � la port�e de tous.

Source : Demo BitNet b1.58

Et vous ?

Pensez-vous que cette annonce est cr�dible ou pertinente ?

Quel est votre avis sur le sujet ?

Voir aussi :

La strat�gie de Microsoft en mati�re d'IA : laisser OpenAI br�ler son argent pour cr�er des mod�les pionniers, puis s'appuyer sur ses succ�s pour am�liorer les capacit�s de Copilot avec 3 � 6 mois de retard

"Chat With RTX" de NVIDIA, un chatbot IA qui fonctionne localement sur votre PC contrairement � ChatGPT. S'il contribue ainsi � la protection de la vie priv�e, le chatbot pr�sente d�j� des limites

L'essor de l'IA donne naissance au � GPU-as-a-Service �, une solution face � la p�nurie de puissance mais non sans limites, avec des risques de d�pendance aux g�ants du cloud