El Banco de Pagos Internacionales (BIS) publicó el 29 de junio de 2026 su informe económico anual advirtiendo de señales de sobreinversión en inteligencia artificial por parte de los grandes hiperescaladores, en la misma semana en que la china Z.ai consolidó GLM-5.2 como modelo abierto con licencia MIT que en ciberseguridad y codificación iguala en varios aspectos a Claude Mythos de Anthropic. Dos lecturas opuestas del mismo mercado: un billón de dólares en infraestructura financiada con deuda frente a un modelo que cualquier desarrollador puede descargar y ejecutar sin pagar por token a un hiperescalador.
Qué ha pasado exactamente
El capítulo inaugural del Annual Economic Report 2026 del BIS, titulado "Progress and peril", dedica un apartado explícito al frenesí inversor en IA. Los economistas del banco de los bancos centrales calculan que los cinco mayores hiperescaladores —Alphabet, Amazon, Meta, Microsoft y Oracle— planean invertir más de 1 billón de dólares en gasto de capital relacionado con IA entre 2025 y 2026. Esa cifra ya supera la generación de caja libre de esas empresas: varias han acudido a mercados de deuda para financiar centros de datos, chips y contratos energéticos de largo plazo. El informe señala que la financiación de infraestructura de IA es ya una parte relevante del crédito privado no bancario global, con fondos de private credit que han cuadruplicado en cinco años su exposición al sector de IA y tecnología, hasta representar alrededor del 15% de sus carteras.
En paralelo a esa advertencia macroeconómica, el BIS documenta señales contables de posible infraamortización de activos. Amazon recortó el año pasado —con efecto el 1 de enero de 2025— la vida útil estimada de un subconjunto de sus servidores y equipos de red de 6 a 5 años, citando el ritmo acelerado de innovación en IA y aprendizaje automático. En el cuarto trimestre de 2024 registró un cargo de depreciación acelerada de 920 millones de dólares por retirar equipamiento antes de lo previsto, y anticipó una reducción de unos 700 millones de dólares en el ingreso operativo de 2025 solo por el cambio de estimación. Analistas que estudian los filings de los hiperescaladores señalan que dos tercios del coste de un centro de datos corresponde a chips y servidores de corta vida útil; dada la velocidad de obsolescencia de GPUs como las H100 o B200, algunos plantean que la amortización razonable debería ser de 3 años, no de 6 como mantienen Microsoft, Google o Meta.
En el otro extremo del ecosistema, Z.ai —marca comercial de Zhipu AI, cotizada en Hong Kong desde el 18 de enero de 2026 y respaldada por inversores como Alibaba y Tencent— liberó GLM-5.2 como modelo de pesos abiertos bajo licencia MIT. Los pesos están disponibles en Hugging Face y ModelScope; el modelo admite 1 millón de tokens de contexto, alcanza el 81,0% en Terminal-Bench 2.1 y puede desplegarse con vLLM, SGLang o transformers sin supervisión de un proveedor cerrado. En el benchmark IDOR de la empresa de seguridad Semgrep —que mide detección de referencias directas a objetos inseguros en código—, GLM-5.2 puntúa 39% en F1 frente al 32% de Claude Code y al 28% de Claude Opus 4.8, a un coste estimado de unos 0,17 dólares por vulnerabilidad detectada. El contexto de mercado que enmarca ambos hechos: la euforia inversora en IA continúa pendiente de las previstas salidas a bolsa de Anthropic —valorada en torno a 370.000 millones de dólares— y OpenAI, mientras los mercados de predicción y los informes de analistas sitúan esas IPO como catalizadores del siguiente tramo alcista del sector.
Por qué importa
La advertencia del BIS no es una predicción de colapso inmediato, pero sí nombra un mecanismo con precedentes históricos: el informe compara el ciclo actual con la fiebre de los canales en la década de 1830, la burbuja ferroviaria británica de 1840 y el crash puntocom de 2000 —todas comenzaron con avances tecnológicos reales que atrajeron más capital del que los retornos comerciales pudieron justificar. En el caso de la IA, el BIS argumenta que la carrera por dominar un mercado donde solo unos pocos jugadores prevalecerán empuja a comprometer recursos en proyectos cuyo retorno sigue siendo incierto; en escenarios adversos, el excedente económico neto del sector —beneficios menos costes de inversión— podría volverse negativo y desencadenar un arranque brusco de financiación que convierta el boom de capex en una caída prolongada de inversión.
La dimensión financiera trasciende el balance de los cinco hiperescaladores. El informe describe una red opaca de financiación circular: fabricantes de chips y nubes toman participaciones en laboratorios de IA o proveedores neocloud, que a su vez se comprometen a comprar chips y capacidad de cómputo a esos mismos inversores, reciclando capital como ingresos. La construcción de centros de datos se externaliza cada vez más a terceros que arriendan instalaciones con contratos de larga duración y cláusulas de salida poco transparentes. Si las valoraciones bursátiles del sector se reprician a la baja —el BIS señala que los márgenes de crédito en empresas vinculadas a IA ya han empezado a ampliarse—, el impacto podría extenderse más allá del perímetro de los fondos de crédito privado hacia bancos y aseguradoras con exposiciones cruzadas.
GLM-5.2 introduce una presión competitiva distinta pero complementaria. Al ser un modelo abierto que puede descargarse, ejecutarse y modificarse libremente sin supervisión de terceros, reduce la distancia entre modelos cerrados de frontera y alternativas autoalojadas. Eso amenaza directamente el modelo de negocio de los hiperescaladores, cuyos márgenes dependen de vender inferencia por token a precios que en planes Pro o API pueden superar los 20 dólares al mes por usuario o los 3-15 dólares por millón de tokens en API. Un modelo que cuesta fracciones de centavo por consulta en hardware propio o en un proveedor chino de bajo coste erosiona la tesis de inversión que justifica el billón de dólares en capex: si la demanda migra hacia pesos abiertos, la infraestructura construida con deuda podría quedar infrautilizada antes de amortizarse.
Qué significa en España
Para un autónomo español que hoy paga Claude Pro a 18-19 €/mes o ChatGPT Plus a 23 €/mes, la disponibilidad de GLM-5.2 como pesos abiertos abre una vía concreta de reducción de costes: desplegar el modelo en un servidor europeo —por ejemplo en OVH, Hetzner o un proveedor español como Gigas— y pagar solo el coste de GPU, sin factura recurrente en dólares con IVA deducible en el modelo 130. Semgrep estima unos 0,17 $ por vulnerabilidad detectada con GLM-5.2 frente a los tokens que consume un agente de Claude Code en la misma tarea; para una pyme de desarrollo en Valencia o Bilbao con 10 ingenieros, la diferencia entre 200 €/mes en suscripciones individuales y un servidor dedicado a 150-300 €/mes con modelo autoalojado deja de ser teórica cuando el benchmark de codificación del modelo abierto alcanza el 81,0% en Terminal-Bench 2.1, a pocos puntos de Opus 4.8.
El riesgo de dependencia de infraestructura de hiperescaladores extranjeros tiene un precedente reciente y español: el bloqueo de Fable 5 y Mythos 5 del 12 al 30 de junio de 2026 cortó el acceso a todos los usuarios —incluidos clientes de Madrid, Barcelona o Sevilla— durante 18 días por una orden del Departamento de Comercio de EE.UU., no por decisión europea. GLM-5.2 no está sujeto a controles de exportación estadounidenses ni a listas blancas gubernamentales, pero sustituir un hiperescalador estadounidense por un laboratorio chino no elimina la dependencia geopolítica: la API de Z.ai envía datos por infraestructura sujeta a la legislación china, mientras que el autoalojamiento de los pesos MIT en un servidor dentro de la UE resuelve la soberanía de datos pero exige ~1,5 TB de memoria GPU para el modelo a precisión completa —fuera del alcance de la mayoría de micropymes españolas sin un presupuesto de infraestructura de cinco cifras.
En el marco regulatorio, el Reglamento de IA de la UE (AI Act) entra en aplicación plena el 2 de agosto de 2026 —dentro de un mes desde esta noticia—. Los sistemas de IA de propósito general de alto impacto, que incluyen modelos frontera como los que usan las herramientas que cotizan los hiperescaladores, deberán cumplir obligaciones de transparencia, documentación técnica y evaluación de riesgos. Un modelo abierto como GLM-5.2 descargado y modificado por una consultora de Zaragoza o un startup de Málaga convierte al desplegador en responsable del cumplimiento: no basta con contratar una API; si ajustas los pesos o integras el modelo en un producto que llega a usuarios finales, las obligaciones del AI Act recaen sobre tu empresa. La AEPD y las autoridades de vigilancia del mercado coordinarán la supervisión a partir de agosto; las pymes que migren a modelos abiertos necesitarán registrar qué versión despliegan, con qué datos entrenan si hacen fine-tuning y qué evaluaciones de sesgo o seguridad documentan.
La recomendación operativa para empresas españolas se reduce a tres acciones verificables antes del 2 de agosto. Primero: auditar cuánto gastas hoy en tokens de hiperescaladores (facturas de OpenAI, Anthropic, Google Cloud o Azure en euros) y comparar con el coste de un despliegue piloto de GLM-5.2 o DeepSeek en infraestructura europea —sin asumir que el ahorro es automático si tu caso de uso requiere integraciones que solo existen en ecosistemas cerrados. Segundo: diseñar un plan de contingencia multi-proveedor tras el apagón de junio —si tu flujo de trabajo dependía exclusivamente de Mythos o Fable, un modelo abierto autoalojado es un seguro operativo, no solo un ahorro. Tercero: preparar la documentación de cumplimiento del AI Act para cualquier sistema de IA que despliegues, abierto o cerrado, porque la fecha límite del 2 de agosto de 2026 no distingue entre pesos descargados de Hugging Face y APIs de Silicon Valley.
Análisis
El contraste entre el informe del BIS y el lanzamiento de GLM-5.2 es la foto más honesta del sector en julio de 2026: los hiperescaladores apuestan un billón de dólares a que la inferencia cerrada seguirá siendo el negocio dominante, mientras un laboratorio chino demuestra que la frontera técnica ya puede empaquetarse como software libre. No creo que una de las dos tesis gane de forma limpia en los próximos meses; lo más probable es una bifurcación. Las grandes empresas seguirán pagando por APIs con SLA, soporte y cumplimiento contractual; los equipos técnicos con capacidad de autoalojamiento probarán modelos abiertos que cuestan una fracción por consulta.
Para el usuario final de las herramientas que lista iautiles.com —editores como Cursor, agentes como Claude Code, asistentes como ChatGPT o alternativas de bajo coste como DeepSeek—, el abaratamiento de la IA de código abierto significa más opciones pero también más fragmentación. Hoy puedes elegir entre una docena de modelos en un mismo editor; mañana, con GLM-5.2, Qwen y DeepSeek al nivel de Mythos en tareas concretas, la pregunta ya no es "¿qué herramienta compro?" sino "¿qué combinación de modelo + interfaz + proveedor de inferencia encaja con mi presupuesto, mi regulación y mi tolerancia a que Washington o Pekín cambien las reglas de acceso de la noche a la mañana?". Esa fragmentación beneficia al usuario informado que sabe alternar proveedores, pero perjudica al que buscaba una única suscripción de 20 €/mes y olvidarse.
La métrica a vigilar en los próximos meses no es el precio de las acciones de los hiperescaladores ni el benchmark de GLM-5.3 —previsto para agosto según Z.ai—, sino si Amazon, Microsoft o Google recortan también sus vidas útiles de servidores de 6 a 5 o a 4 años en los próximos filings trimestrales. Amazon ya rompió filas en febrero de 2025; si los demás siguen, será la confirmación contable de que el BIS tiene razón sobre infraamortización y que el billón de dólares en capex incluye activos que se depreciarán más rápido de lo que los inversores modelan. Si, en cambio, mantienen los 6 años mientras construyen a ritmo récord, el desajuste entre contabilidad y realidad técnica será la señal de alerta que precedió a burbujas anteriores.
Herramientas relacionadas
- DeepSeek — referencia de precio bajo en modelos abiertos (V4-Pro a 0,44 $/M tokens de entrada); útil para comparar el coste real de inferencia frente a GLM-5.2 y a las suscripciones de hiperescaladores que el BIS considera sobrefinanciadas.
- Claude — Mythos 5 sigue restringido fuera de organizaciones Glasswing de EE.UU.; la ficha recoge qué planes españoles dan acceso a Fable 5 y por qué GLM-5.2 compite en la misma categoría de ciberseguridad sin controles de exportación.
- Cursor — editor que permite alternar entre modelos cerrados y abiertos en un mismo flujo; relevante para equipos que quieran probar GLM-5.2 como fallback tras el apagón de 18 días de Anthropic en junio.
- ChatGPT — OpenAI con S-1 pendiente y GPT-5.6 en preview restringida; la ficha documenta precios en euros mientras la euforia inversora que describe el BIS depende de que esa IPO confirme la tesis del billón de dólares en capex.
Fuentes
- BIS — Annual Economic Report 2026, Chapter I: Progress and peril
- Fortune — BIS sees $1 trillion AI investment boom headed for a reckoning (29 jun 2026)
- Euronews — Central banks warn AI boom could trigger next crash (29 jun 2026)
- Z.ai — GLM-5.2: Built for Long-Horizon Tasks
- Semgrep — GLM 5.2 beats Claude in Cyber Benchmarks