Technologie révolutionnaire NPU: 60% plus rapide AI avec 44% d'énergie en moins!
Technologie révolutionnaire NPU: 60% plus rapide AI avec 44% d'énergie en moins!
Tokio, Japan - Qu'y a-t-il dans le monde de l'intelligence artificielle? À un point passionnant du revirement technologique se trouvent les chercheurs du Korea Advanced Institute of Science and Technology (Kaist). Ils ont développé une nouvelle technologie NPU économe en énergie qui augmente les performances des modèles d'IA génératifs par un impressionnant 60%, tandis que la consommation d'énergie est réduite de 44%. [CloudComputing-news.net] rapporte les progrès réalisés dans le cadre de cette recherche dirigée par le professeur Jongseok Park, en collaboration avec Hyperaccel Inc ..
Les grands modèles AI actuels tels que OpenAIS Chatgpt-4 et Google Gemini 2.5 sont de vrais monstres arithmétiques qui nécessitent une capacité de stockage élevée et une bande passante. Il n'est pas étonnant que des entreprises comme Microsoft et Google achètent des centaines de milliers de GPU NVIDIA pour répondre à ces exigences. Mais cela pourrait changer, car la nouvelle technologie NPU vise à résoudre les goulots d'étranglement existants dans l'infrastructure d'IA et maintient la consommation d'énergie dans les échecs.
Progrès à travers du matériel spécialisé
Dans le cœur de cette innovation, l'optimisation de la gestion du stockage est en utilisant une architecture matérielle spécialisée. Minsu Kim et le Dr Seongmin Hong de Hyperaccel Inc. ont travaillé ensemble sur la recherche, dont les résultats ont été présentés à Tokyo sur le Symposium international sur l'architecture informatique (ISCA 2025). Le travail de recherche est intitulé "Oaken: LLM rapide et efficace servant avec la quantification du cache KV hybride hors ligne" et se concentre fortement sur la quantification du KV-Cache, qui constitue une partie énorme de la consommation de mémoire dans les systèmes d'IA génératifs. Avec cette technologie, les mêmes performances peuvent être réalisées avec moins de dispositifs NPU, ce qui non seulement abaisse les coûts, mais protège également l'environnement.
En mettant en œuvre un algorithme de quantification à trois tracks, les ingénieurs peuvent maintenir la perte de précision au cours de l'inférence. Cela comprend des stratégies combatives telles que la quantification hybride hors ligne basée sur les seuils, la quantification de changement de groupe et une densité fusionnée et un codage clairsemé. Ces approches sont conçues pour gérer de manière optimale la plage et la capacité limitées des systèmes actuels et donc pour promouvoir la longévité de l'infrastructure d'IA.
un pas dans l'avenir durable
Cependant, l'efficacité énergétiquedans l'IA ne peut pas être effectuée avec une seule solution. Dans l'ensemble, la recherche représente un progrès significatif dans le sens de l'infrastructure d'IA durable, dont les effets ne sont correctement développés qu'avec la mise à l'échelle et la mise en œuvre dans des environnements commerciaux. L'empreinte CO2 des services d'IA-Cloud pourrait réduire considérablement les nouveaux développements. Les recherches actuelles sur d'autres techniques jouent également un rôle ici qui vise à réduire la consommation d'énergie, tels que la circoncision du modèle, la quantification ou des architectures efficaces. Les scientifiques et les entreprises sont tenus de mettre ces objectifs en harmonie avec des demandes croissantes de performance.
Mais quelle est la clé de l'avenir de l'efficacité énergétique de l'IA? Selon [focalx.ai], non seulement du matériel innovant et des algorithmes spécialisés sont nécessaires, mais également une coopération accrue entre les techniciens et les entreprises afin de créer des solutions durables. Les défis sont divers: de l'équilibre entre les performances et l'efficacité aux éventuelles restrictions matérielles.
Dans l'ensemble, nous sommes confrontés à un développement passionnant qui pourrait nous montrer à quel point les infrastructures énergétiques peuvent être mises en œuvre dans l'IA. Il reste à voir les impulsions que cette nouvelle technologie NPU se déroulera dans l'industrie et comment elle peut aider à réduire les empreintes écologiques des entreprises.
Doncnous gardons à l'esprit les développements - le futur semble prometteur!
Details | |
---|---|
Ort | Tokio, Japan |
Quellen |
Kommentare (0)