Central TEC

Oracle presenta OCI Zettascale10: el supercomputador de IA más grande en la nube

Oracle anunció hoy Oracle Cloud Infrastructure (OCI) Zettascale10, el supercomputador de inteligencia artificial más grande en la nube. OCI Zettascale10 conecta cientos de miles de GPUs NVIDIA distribuidas en múltiples centros de datos para conformar clústeres multigigavatio, capaces de entregar un rendimiento pico sin precedentes de hasta 16 zettaFLOPS.

OCI Zettascale10 constituye la base tecnológica del superclúster insignia desarrollado junto a OpenAI en Abilene, Texas, como parte del proyecto Stargate. Construido sobre la arquitectura de red Oracle Acceleron RoCE de próxima generación, este sistema está potenciado por la infraestructura de IA de NVIDIA, ofreciendo escalabilidad revolucionaria, latencia ultrabaja entre GPUs, la mejor relación desempeño-precio del mercado, mayor utilización de clúster y la confiabilidad necesaria para ejecutar cargas de trabajo de IA a gran escala.

OCI Zettascale10 representa una evolución significativa del primer clúster de computación en la nube Zettascale, presentado en septiembre de 2024. Los nuevos clústeres están alojados en campus de centros de datos de gigavatios, optimizados para densidad dentro de un radio de dos kilómetros, lo que garantiza la mejor latencia GPU a GPU en procesos de entrenamiento de inteligencia artificial de gran magnitud. Esta arquitectura se encuentra actualmente en implementación junto a OpenAI en el sitio Stargate en Abilene.

“Con OCI Zettascale10, estamos fusionando la innovadora arquitectura de red Oracle Acceleron RoCE con la infraestructura de IA de próxima generación de NVIDIA, para ofrecer capacidad de inteligencia artificial multigigavatio a una escala nunca antes vista”, afirmó Mahesh Thiagarajan, vicepresidente ejecutivo de Oracle Cloud Infrastructure. “Los clientes podrán construir, entrenar y poner en producción sus modelos de IA más grandes con menor consumo energético por unidad de rendimiento y con altos niveles de confiabilidad. Además, contarán con la flexibilidad de operar dentro de la nube distribuida de Oracle, bajo estrictos controles de soberanía de datos e inteligencia artificial.”

“La red y el tejido del clúster OCI Zettascale10 fueron desarrollados e implementados inicialmente en el sitio insignia Stargate, en Abilene, Texas —nuestro superclúster conjunto con Oracle”, señaló Peter Hoeschele, vicepresidente de Infraestructura y Cómputo Industrial de OpenAI. “El diseño personalizado y altamente escalable de RoCE maximiza el rendimiento del tejido a escala de gigavatios, concentrando la mayor parte de la energía en cómputo. Estamos entusiasmados de seguir ampliando Abilene y el programa global Stargate junto a Oracle.”

OCI planea ofrecer implementaciones multigigavatio de Zettascale10 a sus clientes. En una primera etapa, los clústeres estarán diseñados para implementaciones de hasta 800.000 GPUs NVIDIA, entregando rendimiento predecible, eficiencia de costos y alto ancho de banda GPU a GPU, gracias a la red Oracle Acceleron RoCEv2 de ultra baja latencia.

“Oracle y NVIDIA están uniendo la nube distribuida de OCI con nuestra infraestructura de inteligencia artificial full stack para ofrecer capacidades de IA a una escala extraordinaria”, comentó Ian Buck, vicepresidente de Hyperscale en NVIDIA. “Con la infraestructura de IA full stack de NVIDIA, OCI Zettascale10 proporciona la red de cómputo necesaria para impulsar la investigación de vanguardia y ayudar a las organizaciones a avanzar desde la experimentación hacia una IA industrializada.”

Shares: