NVIDIA y Google Cloud llevan más de una década colaborando en el desarrollo conjunto de una plataforma de IA de pila completa que abarca todas las capas tecnológicas

Ambas empresas están creando fábricas de IA con instancias A5X equipadas con GPU NVIDIA Vera Rubin

NVIDIA y Google Cloud llevan más de una década colaborando en el desarrollo conjunto de una plataforma de IA de pila completa que abarca todas las capas tecnológicas, desde bibliotecas y marcos optimizados para el rendimiento hasta servicios en la nube de nivel empresarial.

Esta base permite a los desarrolladores, emprendedores y las empresas llevar la IA agentica y física del laboratorio a la producción, desde agentes que gestionan flujos de trabajo complejos hasta robots y gemelos digitales en las plantas de fabricación. En el evento Google Cloud Next realizado en Las Vegas, la colaboración da un paso más con avances para ampliar Google Cloud AI Hypercomputer para fábricas de IA que impulsarán la próxima frontera de la IA agentica y física.

Entre ellas se incluyen las nuevas instancias bare-metal A5X con tecnología GPU NVIDIA Vera Rubin; una versión preliminar de Google Gemini en Google Distributed Cloud, que se ejecuta en el GPU  Blackwell y NVIDIA Blackwell Ultra; máquinas virtuales confidenciales con GPU NVIDIA Blackwell; e IA agentiva en la plataforma Gemini Enterprise Agent con modelos abiertos NVIDIA Nemotron y el framework NVIDIA NeMo.

Infraestructura NVIDIA Blackwell a Vera Rubin

En Google Cloud Next, Google anunció A5X, basado en los sistemas a escala de rack de GPU NVIDIA Vera Rubin NVL72, que — gracias a un diseño conjunto exhaustivo que abarca chips, sistemas y software — ofrecen un costo de inferencia por token hasta 10 veces menor y un rendimiento de tokens por megavatio hasta 10 veces mayor que la generación anterior.

A5X utilizará las SuperNIC NVIDIA ConnectX-9, combinadas con la tecnología de redes Google Virgo de última generación, lo que permitirá escalar hasta 80 000 GPU NVIDIA Rubin en un clúster de un solo sitio y hasta 960 000 GPU NVIDIA Rubin en un clúster de múltiples sitios, lo que permitirá a los clientes ejecutar sus cargas de trabajo de IA más exigentes en una infraestructura optimizada para NVIDIA.

La amplia gama de productos NVIDIA Blackwell de Google Cloud abarca desde máquinas virtuales (VM) A4 con sistemas NVIDIA HGX B200 hasta máquinas virtuales A4X a escala de rack con sistemas NVIDIA GB200 NVL72 y A4X Max NVIDIA GB300 NVL72, pasando por máquinas virtuales G4 fraccionadas con GPU NVIDIA RTX PRO 6000 Blackwell Server Edition.

Los clientes pueden adaptar sus capacidades de aceleración a sus necesidades, ya sea utilizando varios racks NVL72 interconectados que se pueden ampliar hasta alcanzar miles de GPU NVIDIA Blackwell, un solo rack que puede ampliarse hasta 72 GPU Blackwell con NVIDIA NVLink de quinta generación y el conmutador NVLink 5, o tan solo una octava parte de una GPU.

Esta plataforma integral ayuda a los equipos a optimizar cada carga de trabajo, desde el razonamiento de mezcla de expertos, la inferencia multimodal y el procesamiento de datos hasta simulaciones complejas de ingeniería para la próxima frontera de la IA física y la robótica.

Los principales laboratorios de IA de vanguardia ya están aprovechando esta infraestructura. Thinking Machines Lab amplía su interfaz de programación de aplicaciones (API) Tinker en máquinas virtuales A4X Max con sistemas GB300 NVL72 para acelerar el entrenamiento, mientras que OpenAI ejecuta inferencias a gran escala en sistemas NVIDIA GB300 (máquinas virtuales A4X Max) y GB200 NVL72 (máquinas virtuales A4X) en Google Cloud para algunas de sus cargas de trabajo de inferencia más exigentes, incluyendo ChatGPT.

IA segura dondequiera que se necesite ejecutar

Los modelos de Google Gemini que se ejecutan en las GPU NVIDIA Blackwell y Blackwell Ultra ya están disponibles en versión preliminar en Google Distributed Cloud, lo que permite a los clientes llevar los modelos de vanguardia de Google allí donde se encuentren sus datos más confidenciales.

La tecnología NVIDIA Confidential Computing, junto con la plataforma NVIDIA Blackwell, permite que los modelos Gemini se ejecuten en un entorno protegido en el que las indicaciones y los datos de ajuste fino permanecen encriptados y no pueden ser vistos ni modificados por terceros no autorizados, incluidos los operadores de la infraestructura. En la nube pública, la versión preliminar de las máquinas virtuales Confidential G4 con GPU NVIDIA RTX PRO 6000 Blackwell lleva estas medidas de protección a los entornos multitenant, lo que ayuda a proteger las solicitudes, los modelos de IA y los datos para que los clientes de sectores regulados puedan acceder al potencial de la IA sin comprometer la seguridad ni el rendimiento.

Esta es la primera oferta de computación confidencial de las GPU NVIDIA Blackwell en la nube, lo que brinda a los clientes de Google Cloud una nueva base para una IA segura y de alto rendimiento.

Modelos y API abiertos para la IA de agentes

La plataforma NVIDIA en Google Cloud está optimizada para ejecutar todo tipo de modelos — desde las familias Gemini y Gemma de Google, a la vanguardia de la tecnología, hasta los modelos abiertos de NVIDIA Nemotron y el ecosistema más amplio de pesos abiertos —, lo que permite a los programadores crear sistemas de IA con capacidad de agencia que razonan, planean y actúan.

NVIDIA Nemotron 3 Super está disponible en la plataforma Gemini Enterprise Agent, lo que ofrece a desarrolladores una vía directa para personalizar e implementar modelos de razonamiento y multimodales optimizados por NVIDIA para flujos de trabajo basados en agentes.

Google Cloud y NVIDIA también están facilitando el entrenamiento y la personalización de modelos abiertos a gran escala. Los clústeres de entrenamiento gestionados de la plataforma Gemini Enterprise Agent han incorporado una nueva API de aprendizaje por refuerzo (RL) gestionada, desarrollada con NVIDIA NeMo RL, para acelerar el entrenamiento de RL a gran escala y automatizar al mismo tiempo el dimensionamiento de los clústeres, la recuperación ante fallos y la ejecución de tareas, de modo que los equipos puedan centrarse en el comportamiento de los agentes y la calidad de los modelos en lugar de en la gestión de la infraestructura.

CrowdStrike, líder en ciberseguridad, utiliza las bibliotecas abiertas de NVIDIA NeMo — como NeMo Data Designer, NeMo Automodel y NeMo Megatron Bridge — para generar datos sintéticos y ajustar Nemotron y otros modelos de lenguaje grandes y abiertos para la ciberseguridad en ámbitos específicos. Estas capacidades, que se ejecutan en clústeres de entrenamiento gestionados en la plataforma Gemini Enterprise Agent con GPU NVIDIA Blackwell, aceleran la detección, la investigación y la respuesta ante amenazas.

El futuro de la IA industrial y física

Desarrollar IA industrial y física a gran escala requiere un hardware potente y una combinación de modelos, bibliotecas y marcos de trabajo abiertos para desarrollar estos complejos flujos de trabajo de extremo a extremo.

La infraestructura de IA de NVIDIA, los modelos abiertos y las bibliotecas de IA física disponibles en Google Cloud están generalizando el uso de aplicaciones de IA industrial y física, lo que permite a los clientes simular, optimizar y automatizar flujos de trabajo del mundo real.

Las soluciones de los principales proveedores de software industrial, entre los que se incluyen Cadence y Siemens Digital Industries Software, ya están disponibles en Google Cloud, optimizadas gracias a la infraestructura de IA de NVIDIA. Estas aplicaciones impulsan el diseño, la ingeniería y la fabricación de última generación de todo tipo de productos, desde chips hasta vehículos autónomos, robótica, plataformas aeroespaciales, maquinaria pesada y sistemas de producción a gran escala.

Cadence y NVIDIA gemelos digitales

Gracias a las bibliotecas de NVIDIA Omniverse y al marco de simulación robótica de código abierto NVIDIA Isaac Sim, disponibles en Google Cloud Marketplace, los programadores pueden crear gemelos digitales con precisión física y desarrollar flujos de trabajo personalizados de simulación robótica para entrenar, simular y validar robots antes de su implementación en el mundo real.

Los microservicios NVIDIA NIM para modelos como NVIDIA Cosmos Reason 2 pueden implementarse en Google Vertex AI y Google Kubernetes Engine. Esto permite que los robots y los agentes de IA de visión vean, razonen y actúen en el mundo físico como los humanos, lo que da lugar a casos de uso tales como la curación y anotación automatizadas de datos, planeación y el razonamiento robótico avanzados, y los agentes de análisis de video inteligente para obtener información y tomar decisiones en tiempo real. En conjunto, estas tecnologías ayudan a los desarrolladores a pasar sin problemas del diseño asistido por computadora a gemelos digitales industriales activos y robots impulsados por IA, lo que acelera los procesos desde la aprobación del diseño hasta la optimización de la fábrica en la plataforma de NVIDIA que se ejecuta en Google Cloud.

Desde startups hasta empresas globales

Empresas globales, laboratorios de IA y startups de rápido crecimiento están utilizando la plataforma desarrollada conjuntamente por NVIDIA y Google Cloud para pasar más rápidamente de la fase de prototipos a la de producción, entre ellas Snap, Schrödinger y Salesforce. Snap reduce el costo de las pruebas A/B a gran escala al migrar sus flujos de datos a Spark acelerado por GPU en Google Cloud. Schrödinger disminuye las simulaciones de descubrimiento de fármacos que antes duraban semanas a tan solo unas horas gracias a la computación acelerada por NVIDIA en Google Cloud.

Las startups están impulsando la próxima ola de innovación en inteligencia artificial: crean nuevos agentes y aplicaciones nativas de IA utilizando la computación acelerada de NVIDIA en Google Cloud.

Como parte de un ecosistema más amplio impulsado por NVIDIA Inception y Google for Startups, CodeRabbit y Factory están utilizando modelos basados en NVIDIA Nemotron en Google Cloud para impulsar la revisión de código y los agentes de desarrollo de software autónomo, mientras que Aible, Mantis AI, Photoroom y Baseten desarrollan soluciones de datos empresariales, inteligencia de vídeo, imágenes generativas e inferencia gestionada en la plataforma NVIDIA de pila completa en Google Cloud.

En poco más de un año, más de 90 000 personas se han unido a la comunidad conjunta de programadores de NVIDIA y Google Cloud, aprovechando esta plataforma para crear y ampliar nuevas aplicaciones de inteligencia artificial.

Juntas, NVIDIA y Google Cloud ofrecen a los clientes una plataforma a escala de nube para convertir agentes experimentales y simulaciones en sistemas de producción que revisan código, protegen flotas, permiten nuevas aplicaciones de IA y optimizan fábricas en el mundo real.

Fuente: NVIDIA