OpenAI y Broadcom presentan Jalapeño, su primer chip de IA y su plan para depender menos de Nvidia
OpenAI y Broadcom lanzan Jalapeño, su chip para inferencia de IA que llegará a gran escala a fines de 2026
TL;DR:
- OpenAI y Broadcom revelaron Jalapeño, el primer chip de inferencia diseñado por OpenAI, desarrollado de principio a fin en apenas nueve meses.
- OpenAI afirma un rendimiento por vatio "sustancialmente mejor" que el hardware actual; su socio Broadcom habla de hasta 50% de ahorro, pero son cifras propias y aún sin verificación independiente.
- El despliegue a escala de gigavatios arranca a fines de 2026 con Microsoft y otros socios; Broadcom habría pedido a Microsoft comprometerse a comprar el 40% de los chips.
OpenAI y Broadcom presentaron este miércoles 24 de junio de 2026 Jalapeño, el primer chip de inteligencia artificial diseñado por OpenAI. Es un acelerador hecho a la medida para la inferencia de modelos de lenguaje —el proceso de ejecutar un modelo ya entrenado para responder a cada usuario en productos como ChatGPT— y la primera pieza de una plataforma de cómputo de varias generaciones que ambas compañías construyen juntas. OpenAI diseñó el chip; Broadcom aporta el silicio y la red, y la fabricación corre a cargo de TSMC. La jugada persigue un objetivo claro: abaratar el costo de operar sus modelos y depender menos de las GPU de Nvidia. El despliegue a gran escala arrancará antes de que termine 2026.
Para OpenAI, Jalapeño es su primer paso hacia el hardware propio después de años enfocada en modelos y productos. La compañía bautizó la categoría como "Intelligence Processor" y la enmarca en una idea mayor: controlar toda la cadena, del chip hasta la app que usa el público. El primer ejemplar físico se lo entregaron en persona el CEO de Broadcom, Hock Tan, y el presidente Charlie Kawwas al CEO de OpenAI, Sam Altman, y al presidente, Greg Brockman.
Greg Brockman, presidente y cofundador de OpenAI, resumió la apuesta en el comunicado:
"El mundo se está moviendo hacia una economía impulsada por el cómputo. Jalapeño es parte de nuestra estrategia de infraestructura full-stack de largo plazo para hacer el cómputo más abundante, lo que se traduce en una IA más rápida, más confiable y más asequible para las personas y las empresas, y capaz de resolver problemas más importantes. Al diseñar nosotros mismos una mayor parte del stack, podemos entregar más inteligencia con mayor eficiencia y seguir acercando la IA avanzada a un acceso más amplio."
La pelea de fondo no es el entrenamiento, es la inferencia
La inferencia es el momento en que la IA toca a la gente: cada respuesta de ChatGPT, cada tarea de Codex, cada llamada a la API. Ahí el costo se acumula consulta tras consulta, y una mejora pequeña se nota muchísimo cuando hay cientos de millones de peticiones al día. Jalapeño está pensado exactamente para eso. No para entrenar modelos —ese trabajo, más pesado, seguirá apoyado en hardware de Nvidia—, sino para ejecutarlos más barato y de forma más estable.
El movimiento no es nuevo en la industria; más bien, OpenAI llega tarde. Google lleva años con sus TPU, Amazon con Trainium, Microsoft con sus aceleradores Maia —su Maia 200 ya corre modelos GPT-5.2 dentro de Azure, según VentureBeat— y Meta con su línea MTIA. Todos comparten la misma lógica: a esta escala, diseñar tu propio silicio sale más barato que pagar para siempre los márgenes de Nvidia.
Brockman ya había explicado el razonamiento en el pódcast de la propia OpenAI, poco después de que en octubre de 2025 se sellara la alianza con Broadcom: la empresa conoce a fondo sus cargas de trabajo y lleva tiempo buscando aquellas "desatendidas" donde un chip a medida pueda acelerar lo que hoy no rinde.
Nueve meses del diseño al tape-out, con sus propios modelos ayudando
El dato que más llama la atención no es solo el chip, sino la velocidad. OpenAI asegura que Jalapeño pasó del diseño inicial al tape-out de manufactura en nueve meses, lo que la compañía describe como el ciclo de desarrollo de un ASIC más rápido jamás logrado en semiconductores avanzados de alto rendimiento. Y hay un giro que cierra el círculo: los propios modelos de OpenAI ayudaron a acelerar partes del diseño y la optimización. Brockman dijo a la CNBC que "el grado en que nuestros modelos lograron acelerarlo fue muy sorprendente para nosotros". Es, en corto, IA ayudando a construir el hardware que correrá la próxima IA.
Richard Ho, que dirige el programa de hardware de OpenAI, explicó que el equipo optimizó la arquitectura alrededor de los kernels, el movimiento de memoria, la red y los patrones de servicio que más pesan en los modelos de frontera. Según sus primeras pruebas, el chip ejecuta las cargas más importantes de la empresa cerca de los límites teóricos del hardware.
Lo que se sabe de Jalapeño hasta ahora:
- Es un acelerador diseñado desde cero para inferencia de LLMs, no un chip de propósito general reciclado de cargas anteriores.
- OpenAI diseña el chip; Broadcom aporta la fabricación del silicio y la tecnología de red, incluido su silicio de conmutación Tomahawk; Celestica arma placas, racks e integración de sistemas, y TSMC fabrica.
- Muestras de ingeniería ya corren cargas de aprendizaje automático en laboratorio a la frecuencia y potencia objetivo de producción, incluido el modelo GPT-5.3-Codex-Spark.
- La arquitectura reduce el movimiento de datos y busca acercar el uso real al máximo teórico del hardware.
- El despliegue inicial está previsto para antes de fin de 2026, con expansión en los años siguientes y una próxima generación apuntada a 2028.
Un apunte que ubica las cosas: según The Decoder, ese modelo de prueba, GPT-5.3-Codex-Spark, corre hoy en hardware de Cerebras, otra empresa especializada justo en inferencia. OpenAI está midiendo su chip en un terreno que sus rivales ya disputan.
El número que Broadcom puso sobre la mesa (y conviene leer con pinzas)
Aquí aparece la cifra más vistosa, y también la más resbaladiza. El comunicado oficial de OpenAI se limitó a decir que las primeras pruebas muestran un rendimiento por vatio "sustancialmente mejor" que el hardware de punta actual. Pero en entrevistas, el CEO de Broadcom fue más lejos: Hock Tan aseguró que las primeras muestras apuntan a un ahorro de costos cercano al 50% frente a las GPU de IA convencionales, e incluso situó a Jalapeño a la altura de la línea Blackwell de Nvidia y de las TPU de Google. Son números de parte interesada, todavía sin verificación independiente: OpenAI no detalló contra qué chips se midió, en qué tareas ni bajo qué condiciones, y prometió un reporte técnico en los próximos meses. Hasta que llegue, la afirmación es una promesa de fabricante más que un resultado comprobable.
El despliegue arranca a fines de 2026, y Microsoft es clave
Jalapeño es la primera pieza de una plataforma de varias generaciones. La alianza original, de octubre de 2025, contemplaba 10 gigavatios de aceleradores diseñados por OpenAI —una potencia equivalente a la de unos diez reactores nucleares— con despliegues escalonados hasta 2029. Hock Tan dijo a Bloomberg que su proyección de 1.3 gigavatios para el año próximo se le quedó corta:
"Nos gusta pensar que podemos hacerlo mejor, porque hay mucha demanda."
Hay un matiz financiero que conviene no perder de vista. Según reportes recogidos por The Decoder, Broadcom habría condicionado la primera fase a que Microsoft —principal socio de nube e inversor de OpenAI— garantice la compra del 40% de los chips. Una apuesta de este tamaño necesita un comprador ancla antes de encender las fábricas. La reacción del mercado fue moderada: tras el anuncio, las acciones de Broadcom subieron alrededor de 2% según varios reportes, mientras Nvidia cedió levemente.
Una jugada con un ojo puesto en la salida a bolsa
Hay una lectura que va más allá del silicio. OpenAI prepara una esperada salida a bolsa y arrastra pérdidas enormes por el costo de entrenar sus modelos. Si logra abaratar la inferencia —donde está el gasto recurrente—, Jalapeño puede ser justo la señal que tranquilice a inversionistas sobre un camino hacia la rentabilidad, como apunta VentureBeat. Aun así, esto es diversificación, no ruptura: OpenAI sigue siendo uno de los mayores compradores de Nvidia, mantiene acuerdos vigentes con AMD y Cerebras, y reconoce que el entrenamiento de sus modelos más exigentes seguirá, por ahora, en manos de Nvidia.
Para el usuario final —incluido el público hispanohablante que paga ChatGPT o el desarrollador en México, España o Latinoamérica que construye sobre la API—, la promesa se resume en algo simple: si OpenAI logra bajar el costo de la inferencia, eso puede traducirse en respuestas más rápidas, tareas más largas sin esperas y precios más bajos. La promesa ya está sobre la mesa. Falta lo más difícil: ver el chip corriendo fuera del laboratorio, a escala y de forma confiable.