Saltar al contenido

GLM-5.2 de Z.ai: pesos abiertos, contexto de 1M de tokens y mejor código que GPT-5.5

Z.ai liberó GLM-5.2: licencia MIT, ventana de 1 millón de tokens y mejor desempeño que GPT-5.5 en código.

por Ana Ambriz
GLM-5.2 de Z.ai: pesos abiertos, contexto de 1M de tokens y mejor código que GPT-5.5

TL;DR:

  • Z.ai liberó GLM-5.2 con pesos abiertos bajo licencia MIT en Hugging Face, ya disponible en su API y en más de 20 entornos de programación.
  • En FrontierSWE marcó 74,4%, por encima de GPT-5.5 (72,6%) y a un punto de Claude Opus 4.8; es el primer modelo abierto en pasar el 80% en Terminal-Bench.
  • VentureBeat calcula que cuesta cerca de una sexta parte de GPT-5.5, con planes desde unos 12,60 dólares al mes.

Z.ai, la empresa china antes conocida como Zhipu AI, lanzó GLM-5.2, su nuevo modelo insignia de inteligencia artificial enfocado en tareas de programación de largo aliento. La compañía liberó los pesos del modelo bajo licencia MIT en Hugging Face, lo que permite a cualquier empresa descargarlo, ajustarlo y ejecutarlo en sus propios servidores. GLM-5.2 llega con una ventana de contexto de 1 millón de tokens —cinco veces la de su antecesor— y, según las cifras publicadas por Z.ai, supera a GPT-5.5 de OpenAI en varios benchmarks de código mientras cuesta una fracción. El medio especializado VentureBeat calcula que el precio ronda una sexta parte del de GPT-5.5. Es la tercera entrega de la familia GLM-5 en lo que va de 2026 y refuerza la apuesta de China por la IA abierta y barata.

El anuncio salió directo de la cuenta oficial de la compañía, que resumió el lanzamiento en una idea: inteligencia de frontera con pesos abiertos.

Qué significa una ventana de contexto de 1 millón de tokens

El cambio más concreto de esta versión no es un número de benchmark, sino la memoria de trabajo del modelo. GLM-5.2 maneja 1 millón de tokens de contexto, cinco veces los 200.000 de GLM-5.1. En la práctica, eso equivale a meterle una base de código entera y pedirle que razone sobre todo el proyecto de una sola vez, sin trocearlo.

Las tareas de largo aliento (long-horizon) son trabajos de varios pasos que un agente de IA tiene que sostener durante sesiones extensas: refactorizar varios archivos, mantener el hilo de una tarea compleja sin descarrilarse, completar un flujo de desarrollo de principio a fin. Ahí puso Z.ai el foco.

Según lo que reportaron los desarrolladores que probaron el modelo antes de la apertura, las mejoras se concentraron en:

  • Capacidad de contexto a nivel proyecto, para colocar un repositorio completo dentro de un mismo razonamiento.
  • Ejecución más estable de tareas largas, sin que el modelo se salga del camino a mitad del trabajo.
  • Cumplimiento más confiable de estándares de ingeniería en entornos de equipo.
  • Mejor desempeño en ingeniería móvil y del lado del cliente, con un ciclo de depuración en el propio dispositivo.

El modelo también estrena dos niveles de esfuerzo de razonamiento. El modo Max exprime el máximo de capacidad pero gasta cerca de 85.000 tokens de salida por tarea. El modo High cede unos pocos puntos de rendimiento y, a cambio, recorta casi a la mitad ese gasto: una palanca pensada para quien necesita controlar costo y latencia.

Los benchmarks: le gana a GPT-5.5, pero no destrona a Claude Opus 4.8

Aquí conviene leer con cuidado. Las cifras las publicó la propia Z.ai, no un evaluador independiente. Con esa salvedad por delante, los números que presentó la compañía dibujan a un modelo abierto peleando de tú a tú con lo mejor del mercado cerrado:

  • FrontierSWE, que mide si un agente termina proyectos técnicos abiertos de horas de trabajo: 74,4%, por encima de GPT-5.5 (72,6%) y a un punto de Claude Opus 4.8 (75,1%).
  • SWE-bench Pro: 62,1, por delante de GPT-5.5 (58,6) y de su propio antecesor GLM-5.1 (58,4).
  • Terminal-Bench 2.1: 81,0. Primer modelo de pesos abiertos en cruzar el 80%, aunque por debajo de Opus 4.8 (85,0) y GPT-5.5 (84,0), y por encima de Gemini 3.1 Pro (74,0).
  • PostTrainBench: 34,3% frente al 25,0% de GPT-5.5, segundo solo detrás de Opus 4.8.
  • Design Arena, un ranking de tareas de diseño votado por la comunidad: primer lugar, con un ELO de 1.360, por delante incluso de Claude Fable 5.

El patrón es claro. En tareas de largo aliento, GLM-5.2 es el modelo abierto mejor posicionado y le saca ventaja a GPT-5.5 en buena parte de las pruebas, mientras la serie Claude Opus de Anthropic sigue marcando el techo. Lo que ningún benchmark resuelve todavía es la pregunta que de verdad importa: si el modelo aprovecha ese millón de tokens de forma productiva a lo largo de una sesión completa, sin que la precisión se caiga en el tramo final. Esa parte espera evaluación externa.

El golpe real está en el precio y en los pesos abiertos

Más que el podio de benchmarks, lo que mueve esta historia es el costo. Z.ai liberó los pesos centrales bajo licencia MIT, sin restricciones: una empresa puede bajarlo de Hugging Face, afinarlo a su gusto y correrlo localmente o en sus propias máquinas, pagando apenas el cómputo y la electricidad.

Para quien prefiere acceso hospedado, el modelo ya corre en la API de Z.ai y en más de 20 entornos de programación, entre ellos Claude Code, Cline, OpenCode, Roo Code, Goose, Crush, OpenClaw, Kilo Code y Ollama. VentureBeat calcula que usarlo cuesta cerca de una sexta parte de lo que cobra OpenAI por GPT-5.5, con planes que arrancan en torno a los 12,60 dólares al mes y el mismo precio de API que GLM-5.1.

A computer screen with a bunch of code on it
Photo by Jiří Navrátil / Unsplash

La reacción de la comunidad de desarrollo fue inmediata. El equipo de Cline, uno de los entornos de código abierto que lo integró desde el primer día, lo dijo sin medias tintas:

"GLM-5.2 es el primer modelo de pesos abiertos en superar el 80% en Terminal-Bench y le gana a cualquier otro modelo abierto disponible. También supera a Gemini, lo que lo vuelve un modelo de nivel frontera por una fracción del costo. Los pesos abiertos están de vuelta."

Para los desarrolladores y las empresas de habla hispana, el mensaje es directo. Un modelo de nivel frontera que se puede autoalojar baja la factura y, sobre todo, mantiene el código y los datos sensibles dentro de casa, sin mandarlos a una API extranjera.

Z.ai y la ofensiva china por la IA abierta y barata

GLM-5.2 no aparece en el vacío. Z.ai —con sede en Beijing— es una de las llamadas "tigres de la IA" de China y viene de un ritmo de lanzamientos vertiginoso: GLM-5 debutó el 11 de febrero de 2026, según Reuters, seguido de GLM-5.1 y ahora esta tercera versión de la familia en apenas unos meses.

La compañía cotiza en la Bolsa de Hong Kong, enfrenta sanciones de Estados Unidos y obtiene la mayor parte de sus ingresos del mercado chino, aunque su director ejecutivo, Zhang Peng, ha dicho que el negocio en el exterior empieza a ganar tracción. Su jugada es la misma que la de buena parte del ecosistema chino: soltar modelos potentes con licencias abiertas y precios agresivos para morderle terreno a OpenAI, Google y Anthropic.

El cálculo de fondo es sencillo. Si un modelo abierto y autoalojable se acerca al rendimiento de los mejores sistemas cerrados a una fracción del precio, elegir qué IA usar deja de ser solo una decisión técnica y pasa a ser de costo, control y soberanía sobre los datos. GLM-5.2 acaba de subir esa apuesta. Falta ver cuánto aguanta cuando la evaluación independiente ponga a prueba ese millón de tokens.

Fuentes: 1, 2

Ana Ambriz imagen de perfil
por Ana Ambriz

Leer más de Tecnología y Ciencia