El 24 de junio de 2026, OpenAI y Broadcom presentaron Jalapeño, el primer chip de IA diseñado por OpenAI: un ASIC construido exclusivamente para inferencia de modelos de lenguaje, no para entrenamiento ni uso general. Las muestras de ingeniería las entregó físicamente Hock Tan, CEO de Broadcom, a Sam Altman y Greg Brockman en la sede de San Francisco —y ya ejecutan cargas de ML en laboratorio, incluido GPT-5.3-Codex-Spark.
Qué ha pasado exactamente
OpenAI denomina a Jalapeño su primer Intelligence Processor: un ASIC optimizado solo para servir modelos de lenguaje en producción. El ciclo desde el diseño inicial hasta el tape-out duró nueve meses; OpenAI lo describe como el desarrollo de ASIC más rápido documentado en el sector. Lo fabrica TSMC. OpenAI diseñó la arquitectura; Broadcom implementó el silicio y las redes (conmutación Tomahawk); Celestica integra placa, rack y sistema. La colaboración se anunció en octubre de 2025.
Greg Brockman declaró que los propios modelos de OpenAI aceleraron el diseño y que el grado en que lo hicieron "fue muy sorprendente". Las muestras ya corren cargas de ML a frecuencia y potencia objetivo de producción, incluido GPT-5.3-Codex-Spark. El chip usa un chiplet de cómputo grande con memoria HBM —no DRAM barata— para baja latencia en razonamiento y cargas agénticas.
En cifras, conviene separar fuentes. Hock Tan afirmó —según Bloomberg y CNBC— que Jalapeño reduce el coste de inferencia por token en torno a un 50% frente a GPU Nvidia actuales y que rinde a la par de Blackwell y TPU de Google. Son declaraciones auto-reportadas: sin benchmarks independientes ni baseline público. OpenAI solo asegura "rendimiento por vatio sustancialmente mejor que el estado del arte actual" y promete un informe técnico en los próximos meses.
Por qué importa
La inferencia es donde OpenAI gasta más a diario —y donde se juega la rentabilidad de cara a la OPV. Brockman: "no consigue cómputo lo bastante rápido". Hock Tan: la demanda de chips es "simplemente insaciable". Un ASIC propio ataca el coste por token, no el entrenamiento. Si el 50% de ahorro (auto-reportado) se confirma, cambia ChatGPT y la API; si no, Jalapeño sigue siendo diversificación frente a Nvidia, como las TPU de Google o el silicio de Amazon, Meta y Microsoft.
Despliegue inicial a finales de 2026, escalado en 2027-2028, hacia 10 gigavatios hasta 2029. Microsoft tendría ~40% de la producción inicial. En bolsa, Broadcom acumula +10% en 2026 y casi 7 veces su valor desde finales de 2022. La pregunta abierta: si el ahorro del 50% sobrevive de laboratorio a millones de tokens en producción.
Las muestras ya ejecutan GPT-5.3-Codex-Spark a potencia de producción; el silicio existe. Lo que falta es evidencia pública de que ese ASIC bate a Blackwell en coste por token cuando sirve millones de peticiones simultáneas en ChatGPT —exactamente la carga que Jalapeño promete optimizar.
Qué significa en España
Si el ~50% de ahorro (Hock Tan, auto-reportado) se confirma, podría abaratar ChatGPT y la API para pymes españolas que pagan por uso —300 €/mes en tokens podrían bajar a ~150 € con la misma carga. Es escenario, no factura: OpenAI no ha publicado precios en Jalapeño ni confirmado el 50% con datos auditables.
El impacto no es inmediato: despliegue a finales de 2026, rampa real en 2027-2028. Microsoft absorbe ~40% de la producción inicial. Quien pague API en julio de 2026 seguirá facturando sobre GPU Nvidia en datacenters actuales.
No cambies de proveedor por esta promesa. Evalúa coste/capacidad con modelos disponibles hoy —GPT-5.5, Claude Opus 4.8, DeepSeek V4-Pro a 0,44$/0,87$— y revisa la factura trimestral con datos reales. Migrar un pipeline por un titular del 50% sin benchmark independiente arriesga semanas de integración por un ahorro no demostrado.
El abaratamiento sostenido de inferencia democratizaría IA para negocios pequeños, pero conviene esperar el informe técnico prometido y benchmarks de terceros. El AI Act activa obligaciones para modelos de propósito general el 2 de agosto de 2026; un chip propio no exime de transparencia sobre el modelo, solo del coste de ejecutarlo.
Análisis
Jalapeño es hito real —silicio en nueve meses, GPT-5.3-Codex-Spark en laboratorio— con cifras de marketing no verificadas. La brecha entre Tan (~50%, paridad Blackwell/TPU) y OpenAI (solo "rendimiento por vatio sustancialmente mejor") delata quién necesita impresionar al mercado hoy. El 50% es hipótesis de Broadcom/Bloomberg, no hecho contrastado.
La estrategia sí parece sólida: inferencia propia para bajar el coste marginal de ChatGPT y la API. Si el ahorro real es 15-20% y no 50%, el chip sigue siendo útil pero el titular queda corto. Las pymes españolas deben seguir el coste por token en su factura, no el comunicado de prensa.
Métrica a vigilar: si OpenAI publica antes de finales de 2026 el informe técnico con tokens por vatio y coste por millón de tokens en Jalapeño frente a Blackwell en cargas reales. Sin eso, el 50% de Hock Tan es cifra para inversores, no para quien presupuesta API en euros. Impacto comercial diferido a 2027-2028.
Herramientas relacionadas
- ChatGPT — principal consumidor de inferencia que Jalapeño busca abaratar; la ficha recoge precios y límites actuales mientras el chip no entra en producción.
- GitHub Copilot — las muestras de Jalapeño ya ejecutan GPT-5.3-Codex-Spark; Copilot y Codex son cargas de inferencia intensiva que se beneficiarían primero si el ahorro del 50% se confirma.
- Claude — alternativa de API mientras OpenAI despliega silicio propio; útil para comparar coste por token real sin depender de promesas de ASIC no verificadas.
- DeepSeek — referencia de precio bajo en inferencia (V4-Pro a 0,44$/0,87$) contra la que medir si Jalapeño cambia el tablero o solo acerca a OpenAI a la competencia por coste.