Maia 200: el nuevo chip de IA de Microsoft

Maia 200

Redacción: Carolina Herrera 

Microsoft presentó Maia 200, su nuevo chip de inteligencia artificial diseñado para mejorar la velocidad, eficiencia y escalabilidad de modelos avanzados como GPT en centros de datos.

Ideado para competir con gigantes tecnológicos, Microsoft reemplaza su antiguo chip de IA con la llegada de Maia 200, que promete ejecutar con mayor eficacia y velocidad los modelos de inteligencia artificial más recientes, como GPT.  

Este nuevo chip de Microsoft ha sido diseñado para ejecutarse en los centros de datos al contar con más de 100.000 millones de transistores capaces de ejecutar cualquier modelo de IA al ser capaz de garantizar un rendimiento de más de 10 petaFLOPS en FP4 y más de 5 petaFLOPS en FP8.  Asimismo, cuenta con un SoC que mantiene una memoria HBM3e de 216 GB con ancho de banda de 7 TB/s, al igual que la SRAM de 272 MB que también ha sido integrada en el chip.  

Fabricado por TSMC utilizando su proceso de 3 nanómetros, Maia 200 supera hasta tres veces el rendimiento FP4 de Trainium de la tercera generación de Amazon. Además de dejar por muy debajo al TPU de séptima generación de Google en cuanto a rendimiento FP8.  

Para Scott Guthrie, el vicepresidente ejecutivo de Nube e IA de Microsoft, Maia 200 se traduce como “el sistema de inferencia más eficiente que Microsoft ha desplegado jamás”, debido a ser capaz de mejorar el rendimiento de hasta el 30% en tareas de inferencia. Agregó que este nuevo chip “puede ejecutar sin esfuerzo los modelos más grandes de la actualidad, con mucho margen para modelos aún más grandes en el futuro”. 

Ahora bien, en términos más accesibles, Maia 200 representa una nueva y mejorada alternativa para generar tokens de manera más veloz y eficiente, es decir, permitirá que la inteligencia artificial pueda comprender mejor el texto, procesarlo y ofrecer repuestos más rápidos.  

Cabe destacar, que, aunque este nuevo chip está diseñado para integrarse en los centros de datos, se tiene planeado que los usuarios de asistentes virtuales basados en inteligencia artificial generativa puedan beneficiarse directamente.  

De acuerdo con Microsoft, la primera organización en utilizar a Maia 200 será la división de Superinteligencia liderada por Mustafa Suleyman con el objetivo de generar datos sintéticos y mejorar el aprendizaje por refuerzo. Posteriormente, se ofrecerá a todo el público como un servicio similar al que ya existe en Google y Amazon con sus TPU y Trainium.  Además, se anunció que esperan ampliar sus centros de datos que actualmente se encuentran en Estados Unidos y dirigirse a más regiones en un futuro.  

¿Te gustó nuestra nota? ¡Contáctanos y deja tu comentario! AQUÍ

Conoce nuestra red ANCOP Network AQUÍ

Post Views146 Total Count

Entradas relacionadas