256 núcleos de potencia de IA: así es el procesador que traduce vídeos en tiempo real y potencia los chatbots

256 núcleos de potencia de IA: así es el procesador que traduce vídeos en tiempo real y potencia los chatbots
256 núcleos de potencia de IA: así es el procesador que traduce vídeos en tiempo real y potencia los chatbots
-

Aquí tienes un procesador que nunca comprarás… pero que sin duda usarás un poco cada día sin saberlo. Desconocida para el gran público, Ampere Computing es una empresa estadounidense fundada por una ex alta ejecutiva de Intel, Renée James. La misión de Ampere es diseñar y vender CPU ARM para centros de datos y otras supercomputadoras. Y acaba de presentar su nueva generación de chips, AmpereOne. ¡Un procesador que integra nada menos que 256 núcleos de CPU!

¿Qué tiene esto que ver con sus usos? A medida que crecen los asistentes de IA basados ​​en la nube, los actores de la industria buscan reducir sus facturas de uso, tanto de compra como de consumo. Y en este juego, las CPU con núcleo ARM de Ampere tienen, sobre el papel, muchas ventajas.

Publicidad, tu contenido continúa abajo

type="image/webp">> type="image/webp">> type="image/webp">>>>>>>>

© Adrián Branco para Les Numériques

Hablemos primero del chip: si ya está en el mercado una versión del AmpereOne con 192 núcleos grabados en 5 nm e integrado en centros de datos como el del francés Scaleway (cuyo backstage visitamos el pasado mes de diciembre), los siguientes puntos irá más lejos. Gracias al grabado de 3 nm, hasta ahora exclusivo de los chips de Apple, Ampere podrá aumentar el número de núcleos en un 33%, para llegar a 256 núcleos de CPU.

Pero mientras Nvidia y otros Intel cuentan con chips que consumen cada vez más energía (Intel está trabajando activamente en la disipación de chips que van de 1 kW a 2 kW, y Nvidia no ha ocultado el hecho de que está tomando el mismo camino), Ampere hace la apuesta estratégica de buscar ganancias de desempeño con disipación constante. Una ganancia que la empresa obtiene añadiendo siempre más núcleos. Corazones cada vez más eficientes.

Publicidad, tu contenido continúa abajo

Cada vez más núcleos con consumo constante

type="image/webp">> type="image/webp">> type="image/webp">>>>>>>>

Jeff Wittich, director de productos de Ampere.

© Adrián Branco para Les Numériques

Según la hoja de ruta de Ampere, su mejor chip, AmpereOne, previsto para 2025, tiene, por tanto, 256 núcleos. Pero como nos explica Jeff Wittich, director de producto de Ampere, este tipo de chip es lo opuesto a las GPU y otros aceleradores de alta potencia. “El ritmo al que aumenta el consumo de energía de la industria de los centros de datos es insostenible“, el explica. “No siempre podemos consumir más energía, y debemos optimizar el consumo al máximo“, él continúa.

Nuestra fortaleza en el mercado es que hemos diseñado una arquitectura de chip dedicada al uso de la nube. Si bien nuestros competidores tienen diseños de núcleos anteriores a la nube y a la IA, nuestros núcleos y chips de CPU están completamente diseñados para esta necesidad.“, asegura.

type="image/webp">> type="image/webp">> type="image/webp">>>>>>>>

© Adrián Branco para Les Numériques

La primera arma de Ampere es la impresionante cantidad de núcleos integrados en sus chips. “Actualmente, nuestro chip más denso tiene 192 núcleos de CPU. Pero a partir de 2025, nuestro AmpereOne grabado en 3 nm ofrecerá nada menos que 256 núcleos“. Y aquí es donde entra en juego la segunda arma de Ampere: el nuevo chip consumirá exactamente igual que el chip actual. Es decir “entre 300 y 350W“, explica J. Wittich. “No queremos consumir más energía, siempre queremos hacer más con la misma potencia. Y nuestra arquitectura es extensible y particularmente adecuada para la IA.“, asegura el hombre. Pero espera un momento, ¿la IA no es dominio de las GPU?

Publicidad, tu contenido continúa abajo

El 85% de la IA no está relacionada con el entrenamiento

type="image/webp">> type="image/webp">> type="image/webp">>>>>>>>

Victor Jakubiuk, jefe de IA de Ampere.

© Adrián Branco para Les Numériques

Frente a Nvidia, que ahora tiene una capitalización de mercado de 3 billones de dólares, el novato en IA tiene razón al preguntarse cómo un jugador pequeño podría sacudir a un gigante así. “¡No es lo mismo!“, explica pedagógicamente Victor Jakubiuk, jefe de IA de Ampere.Existen potentes GPU para entrenar IA. De hecho, se trata de una informática intensiva que requiere chips de alta potencia. ¡Pero el entrenamiento en IA sólo representa el 15% de los cálculos relacionados con este campo! Sin embargo, el 85% restante es inferencia, es decir el uso de estas IA. Porque una vez que se entrena un modelo, lo que lleva varias semanas o meses, ese modelo es utilizado en masa por millones de usuarios. Y ahí es donde entran nuestros procesadores“, explica el ingeniero.

type="image/webp">> type="image/webp">> type="image/webp">>>>>>>>

Utilizando modelos ligeros de IA, un único núcleo de procesador Ampere puede transformar una transmisión de audio en subtítulos en tiempo real.

© Adrián Branco para Les Numériques

Procesadores que están ahí para ejecutar modelos de la forma más óptima posible. ¿Y qué modelos son estos? Jeff Wittich nos responde: “Además de los usos clásicos de las CPU en la nube, como bases de datos como MongoDB, nuestros núcleos de CPU se utilizan para muchos de sus usos diarios. Cuando miras un vídeo, nuestro corazón se encarga de generar subtítulos automáticos, traduciendo estos subtítulos. Y cuando utiliza el chatbot de su aplicación bancaria, es posible que nuestras CPU también lo estén ejecutando.“, el explica.

Publicidad, tu contenido continúa abajo

Ahorros reales, y no sólo en IA

type="image/webp">> type="image/webp">> type="image/webp">>>>>>>>

Damien Lucas, director ejecutivo de Scaleway.

© Adrián Branco para Les Numériques

Para comprobar las declaraciones de los equipos de Ampere, volvimos a ver a Damien Lucas, el CEO de Scaleway a quien conocimos el año pasado. El hombre está sonriendo, pero también es muy directo y experto en cero mierda : “Los ahorros de energía de los chips Ampere son reales“, dice. Si bien el camino de las CPU ARM en los centros de datos no siempre ha sido un río largo y tranquilo, desde Scaleway lo ha hecho “ARM propuesto y luego descontinuado hace unos años“, el conjunto de instrucciones está regresando “gracias a la demanda de los clientes. Por un lado, las situaciones de monopolio nunca son buenas para el mercado, pero por otro lado, los chips ARM de Ampere permiten importantes ahorros de energía.“, asegura. En IA, se trata de ganar en inferencia”en el orden de x3 a x5 en comparación con la GPU Nvidia, según Ampere“.

type="image/webp">> type="image/webp">> type="image/webp">>>>>>>>

Un servidor Ampere de Scaleway.

© Adrián Branco para Les Numériques

Ganancias de eficiencia que no se limitan solo al área de inferencia de IA. “Si ponemos todas las tecnologías y todos los chips del mercado al servicio de nuestros clientes, como trabajamos con todos, también tenemos nuestra propia infraestructura en Scaleway. Y la verdad es que cambiamos todos nuestros servidores domésticos de x86 a Ampere ARM“, dice Damien Lucas durante la conversación. ¿Para qué beneficios? “Una reducción en la factura energética del 30%“, se entusiasma.

Publicidad, tu contenido continúa abajo

Pero no nos dejemos llevar por la responsabilidad de los jugadores de la nube: si aquellos que tienen necesidades de inferencia pudieran recurrir masivamente a chips como los de Ampere, los monstruos hambrientos de energía todavía tienen mucho futuro. “En cuanto al entrenamiento, en estos momentos lo que está en marcha es una carrera de velocidad. Nunca hay suficientes GPU disponibles. Nosotros, en Scaleway, atendemos a todo tipo de clientes. Y se ve claramente la doble tendencia: por un lado, el cálculo que yo calificaría de superintensivo y, por otro, el cálculo supereficiente.“. Una eficiencia que es el caballo de batalla de Ampere.

¿Procesadores de 1000 núcleos en 2030?

type="image/webp">> type="image/webp">> type="image/webp">>>>>>>>

© Adrián Branco para Les Numériques

Entre las amenazas chinas que se ciernen sobre Taiwán o la dificultad de reducir alguna vez la finura del grabado, los desafíos que rodean la mejora de las capacidades de cálculo de los procesadores son enormes. Sin embargo, Jeff Wittich no parece preocupado en lo más mínimo por futuras mejoras en el rendimiento por vatio de sus chips.

Incluso si los procesos de fabricación permanecen estancados en 3 nm durante años, aún podríamos hacerlo mejor incluso con nuestra envolvente de 350 W.“, asegura. Antes de aceptar hacer una predicción.”Incluso con estas limitaciones, en 2030 podríamos tener un chip con 1.000 núcleos. Todavía tenemos mucho espacio en nuestra arquitectura.“, promete. Antes de concluir: “Y eso es bueno. Porque en el mundo en el que vivimos, ya no podemos darnos el lujo de desperdiciar energía.“.

Publicidad, tu contenido continúa abajo

-

PREV Ubisoft Forward: resumen de la conferencia y toda la información que no debes perderte sobre futuros videojuegos
NEXT El precio de las acciones de AAPL se desplomó durante la WWDC