Tecnología revolucionaria de NPU: ¡60% de IA más rápida con 44% menos de energía!
Tecnología revolucionaria de NPU: ¡60% de IA más rápida con 44% menos de energía!
Tokio, Japan - ¿Qué hay en el mundo de la inteligencia artificial? En un punto emocionante del cambio de tecnología están los investigadores del Instituto de Ciencia y Tecnología Avanzado de Corea (KAIST). Han desarrollado una nueva tecnología NPU de eficiencia energética que aumenta el rendimiento de los modelos de IA generativos en un impresionante 60%, mientras que el consumo de energía se reduce en un 44%. [CloudComputing-News.net] informa sobre el progreso que se logró como parte de esta investigación dirigida por el profesor Jongseok Park, en colaboración con Hyperaccel Inc ..
Los modelos AI grandes actuales como OpenAIS ChatGPT-4 y Google Gemini 2.5 son verdaderos monstruos aritméticos que requieren una alta capacidad de almacenamiento y un ancho de banda. No es de extrañar que compañías como Microsoft y Google compren cientos de miles de las GPU de NVIDIA para cumplir con estos requisitos. Pero eso podría cambiar, porque la nueva tecnología NPU tiene como objetivo resolver cuellos de botella existentes en la infraestructura de IA y mantiene el consumo de energía en el ajedrez.
Progress a través de hardware especializado
En el núcleo de esta innovación, la optimización de la gestión de almacenamiento es mediante el uso de una arquitectura de hardware especializada. Minsu Kim y el Dr. Seongmin Hong de Hyperaccel Inc. trabajaron juntos en investigación, cuyos resultados se presentaron en Tokio en el Simposio Internacional sobre Arquitectura de Computadora (ISCA 2025). El trabajo de investigación se titula "Oaken: Fast and Eftient LLM que sirve con cuantificación de caché de KV híbrido fuera de línea en línea" y se centra en gran medida en la cuantización de KV-Cache, que constituye una enorme parte del consumo de memoria en sistemas de IA generativos. Con esta tecnología, se puede lograr el mismo rendimiento con menos dispositivos NPU, lo que no solo reduce los costos, sino que también protege el medio ambiente.
Al implementar un algoritmo de cuantización de tres vías, los ingenieros pueden mantener mínimamente la pérdida de precisión durante la inferencia. Esto incluye estrategias combativas, como la cuantización híbrida fuera de línea en línea basada en umbral, cuantización de cambio de grupo y una densidad fusionada y codificación escasa. Estos enfoques están diseñados para tratar de manera óptima el rango y la capacidad limitados de los sistemas actuales y, por lo tanto, promover la longevidad de la infraestructura de IA.
Un paso hacia el futuro sostenible
Sin embargo, la eficiencia energéticaen la IA no se puede hacer con una sola solución. En general, la investigación representa un progreso significativo en la dirección de la infraestructura de IA sostenible, cuyos efectos solo se desarrollan correctamente con la escala e implementación en entornos comerciales. La huella de CO2 de los servicios de AI-Cloud podría reducir significativamente los nuevos desarrollos. La investigación actual sobre otras técnicas también juega un papel aquí que tiene como objetivo reducir el consumo de energía, como la circuncisión del modelo, la cuantización o las arquitecturas eficientes. Se requiere que los científicos y las empresas pongan estos objetivos en armonía con crecientes demandas de rendimiento.
Pero, ¿cuál es la clave del futuro de la eficiencia energética de IA? Según [Focalx.ai], no solo se requieren hardware innovador y algoritmos especializados, sino también una mayor cooperación entre técnicos y empresas para crear soluciones sostenibles. Los desafíos son diversos: desde el equilibrio entre rendimiento y eficiencia hasta posibles restricciones de hardware.
En general, nos enfrentamos a un desarrollo emocionante que podría mostrarnos cómo se pueden implementar infraestructuras poderosas y eficientes en energía en la IA. Queda por ver qué impulsos esta nueva tecnología NPU establecerá en la industria y cómo puede ayudar a reducir las huellas ecológicas de las empresas.
Entonces,tenemos en cuenta los desarrollos: ¡el futuro suena prometedor!
Details | |
---|---|
Ort | Tokio, Japan |
Quellen |
Kommentare (0)