
Intel et Advanced Micro Devices (AMD) ont lutt� pour produire un ensemble convaincant de puces et les logiciels n�cessaires pour cr�er des applications d'IA qui peuvent devenir une alternative viable � Nvidia. Nvidia contr�lait environ 83 % du march� des puces pour centres de donn�es en 2023, la majorit� des 17 % restants �tant d�tenue par les unit�s de traitement tensoriel (TPU) personnalis�es de Google qu'il ne vend pas directement.
Les entreprises technologiques sont � la recherche d'une source alternative de puces rares n�cessaires � l'intelligence artificielle. Intel a d�clar� que sa nouvelle puce Gaudi 3 �tait capable d'entra�ner un grand mod�le de langage sp�cifique 50 % plus rapidement que le processeur H100 de g�n�ration pr�c�dente de Nvidia. Elle est �galement capable de calculer les r�ponses g�n�ratives de l'IA, un processus appel� inf�rence, plus rapidement que les puces H100 pour certains des mod�les test�s par Intel.
Intel a utilis� le processus 5nm de Taiwan Semiconductor Manufacturing Co pour construire les puces. Gaudi 3 comprend deux processeurs principaux fusionn�s, et est plus de deux fois plus rapide que son pr�d�cesseur. La puce est con�ue pour �tre reli�e � des milliers d'autres et peut ainsi g�n�rer une �norme puissance de calcul. La puce Gaudi 3 sera disponible pour les constructeurs de serveurs tels que Supermicro et Hewlett Packard Enterprise au cours du deuxi�me trimestre de cette ann�e.
Intel d�voile les d�tails de la puce Intel Gaudi 3
� Intel Vision, Intel pr�sente l'acc�l�rateur d'IA Intel Gaudi 3 qui offre 4x le calcul d'IA pour BF16, 1,5x l'augmentation de la bande passante m�moire et 2x la bande passante r�seau pour une mise � l'�chelle massive du syst�me par rapport � son pr�d�cesseur. C'est un saut significatif en termes de performance et de productivit� pour la formation et l'inf�rence IA sur les grands mod�les de langage (LLM) et les mod�les multimodaux les plus populaires. S'appuyant sur les performances et l'efficacit� �prouv�es de l'acc�l�rateur d'IA Intel Gaudi 2, une alternative MLPerf-benchmark�e pour les LLM sur le march�, Intel donne aux clients le choix avec un logiciel ouvert bas� sur la communaut� et un r�seau Ethernet standard de l'industrie pour faire �voluer leurs syst�mes de mani�re plus flexible.
"Dans le paysage en constante �volution du march� de l'IA, un �cart significatif persiste dans les offres actuelles. Les commentaires de nos clients et du march� en g�n�ral soulignent le d�sir d'un plus grand choix. Les entreprises prennent en compte des consid�rations telles que la disponibilit�, l'�volutivit�, la performance, le co�t et l'efficacit� �nerg�tique. Intel Gaudi 3 s'impose comme l'alternative GenAI pr�sentant une combinaison convaincante de prix, de performance, d'�volutivit� du syst�me et d'avantage en termes de temps de retour sur investissement". - Justin Hotard, vice-pr�sident ex�cutif d'Intel et directeur g�n�ral du groupe Data Center and AI.
Aujourd'hui, les entreprises de secteurs critiques tels que la finance, la fabrication et la sant� cherchent rapidement � �largir l'acc�s � l'IA et � faire passer les projets d'IA g�n�rative (GenAI) des phases exp�rimentales � une mise en �uvre � grande �chelle. Pour g�rer cette transition, alimenter l'innovation et atteindre les objectifs de croissance du chiffre d'affaires, les entreprises ont besoin de solutions et de produits ouverts, rentables et plus �conomes en �nergie qui r�pondent aux besoins de retour sur investissement (ROI) et d'efficacit� op�rationnelle.
L'acc�l�rateur Intel Gaudi 3 r�pondra � ces exigences et offrira une polyvalence gr�ce � un logiciel communautaire ouvert et � une norme industrielle Ethernet ouverte, aidant les entreprises � faire �voluer leurs syst�mes et applications d'IA de mani�re flexible.
Comment l'architecture personnalis�e offre la performance et l'efficacit� de la GenAI ?
L'acc�l�rateur Intel Gaudi 3, con�u pour le calcul efficace de l'IA � grande �chelle, est fabriqu� sur un processus de 5 nanom�tres (nm) et offre des avanc�es significatives par rapport � son pr�d�cesseur. Il est con�u pour permettre l'activation de tous les moteurs en parall�le - avec le moteur de multiplication matricielle (MME), les c�urs de processeur tensoriel (TPC) et les cartes d'interface r�seau (NIC) - permettant l'acc�l�ration n�cessaire pour un calcul d'apprentissage profond rapide et efficace et une mise � l'�chelle. Les principales caract�ristiques sont les suivantes :
- Moteur de calcul d�di� � l'IA : l'acc�l�rateur Intel Gaudi 3 a �t� sp�cialement con�u pour le calcul GenAI haute performance et haute efficacit�. Chaque acc�l�rateur dispose d'un moteur de calcul h�t�rog�ne compos� de 64 TPC personnalis�s et programmables pour l'IA et de huit MME. Chaque MME Intel Gaudi 3 est capable d'effectuer un nombre impressionnant de 64 000 op�rations parall�les, ce qui permet un haut degr� d'efficacit� de calcul, les rendant aptes � traiter des op�rations matricielles complexes, un type de calcul qui est fondamental pour les algorithmes d'apprentissage profond. Cette conception unique acc�l�re la vitesse et l'efficacit� des op�rations parall�les d'IA et prend en charge plusieurs types de donn�es, y compris FP8 et BF16.
- Boost de m�moire pour l'exigence de capacit� des LLM : 128 gigaoctets (Go) de capacit� de m�moire HBMe2, 3,7 t�raoctets (To) de bande passante m�moire et 96 m�gaoctets (Mo) de m�moire vive statique (SRAM) embarqu�e fournissent suffisamment de m�moire pour traiter de grands ensembles de donn�es GenAI sur moins d'Intel Gaudi 3, particuli�rement utiles pour servir de grands mod�les de langage et multimodaux, ce qui se traduit par une augmentation de la performance de la charge de travail et de la rentabilit� du centre de donn�es.
- Mise � l'�chelle efficace du syst�me pour la GenAI d'entreprise : 24 ports Ethernet de 200 gigabits (Gb) sont int�gr�s dans chaque acc�l�rateur Intel Gaudi 3, fournissant un r�seau flexible et ouvert. Ils permettent une mise � l'�chelle efficace pour prendre en charge les grands clusters de calcul et �liminent le verrouillage des fournisseurs par des r�seaux propri�taires. L'acc�l�rateur Intel Gaudi 3 est con�u pour passer efficacement d'un seul n�ud � des milliers de n�uds afin de r�pondre aux exigences �tendues des mod�les GenAI.
- Logiciel industriel ouvert pour la productivit� des d�veloppeurs : Le logiciel Intel Gaudi int�gre le cadre PyTorch et fournit des mod�les optimis�s bas�s sur la communaut� Hugging Face - le cadre d'IA le plus courant pour les d�veloppeurs GenAI aujourd'hui. Cela permet aux d�veloppeurs GenAI d'op�rer � un niveau d'abstraction �lev� pour faciliter l'utilisation et la productivit�, ainsi que le portage des mod�les � travers les types de mat�riel.
- Gaudi 3 PCIe : La carte d'extension Gaudi 3 PCIe (peripheral component interconnect express) est une nouveaut� dans la gamme de produits. Con�ue pour apporter une grande efficacit� tout en consommant moins d'�nergie, ce nouveau facteur de forme est id�al pour les charges de travail telles que le r�glage fin, l'inf�rence et la g�n�ration augment�e par r�cup�ration (RAG). Il est �quip� d'un facteur de forme pleine hauteur � 600 watts, avec une capacit� de m�moire de 128 Go et une bande passante de 3,7 To par seconde.
L'acc�l�rateur Intel Gaudi 3 offrira des am�liorations significatives de performance pour les t�ches de formation et d'inf�rence sur les principaux mod�les GenAI. Plus pr�cis�ment, l'acc�l�rateur Intel Gaudi 3 devrait offrir en moyenne par rapport au Nvidia H100 :
[LIST][*]Un temps d'entra�nement 50 % plus rapide pour les mod�les Llama2 7B et 13B et GPT-3 175B.
[...
La fin de cet article est r�serv�e aux abonn�s. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer � vous proposer des publications.