Saltar al contenido

Meituan libera LongCat-2.0: 1.6 billones de parámetros entrenados en 50,000 chips chinos, sin nombrar fabricante

LongCat-2.0, de Meituan: 1.6 billones de parámetros entrenados por completo en chips chinos, sin decir cuáles.

por Dilis Salazar
Meituan libera LongCat-2.0: 1.6 billones de parámetros entrenados en 50,000 chips chinos, sin nombrar fabricante

TL;DR:

  • Meituan abrió LongCat-2.0, un modelo de IA de 1.6 billones de parámetros con ventana de contexto de 1 millón de tokens, pensado para programación y agentes autónomos.
  • La compañía asegura que es el primer modelo de su escala en completar entrenamiento e inferencia enteros en un clúster de 50,000 chips chinos, sin un solo procesador de Nvidia.
  • Meituan no reveló qué empresa fabricó esos chips ni liberó los pesos descargables del modelo, así que la afirmación todavía no se puede comprobar de forma independiente.

Meituan, el gigante chino del delivery que cotiza en Hong Kong como 3690.HK, liberó este martes 30 de junio LongCat-2.0 en código abierto: un modelo de inteligencia artificial de 1.6 billones de parámetros que, según la compañía, es el primero de su escala en completar entrenamiento e inferencia enteros en un clúster de 50,000 chips fabricados en China. El lanzamiento llega mientras las tecnológicas chinas —DeepSeek, Alibaba y ByteDance entre ellas— intentan depender menos de los semiconductores estadounidenses, golpeadas por los controles de exportación que Washington mantiene desde 2022. LongCat-2.0 apunta sobre todo a programación y tareas de agentes autónomos, con ventana de contexto de 1 millón de tokens. Meituan, eso sí, no dijo qué fabricante hizo los chips ni liberó los pesos descargables del modelo.

El primer billón de parámetros que se entrena sin un chip de Nvidia

LongCat-2.0 es un modelo de lenguaje de mezcla de expertos (MoE): en lugar de activar toda la red para responder cada palabra, enciende solo un grupo reducido de "expertos" internos por token, el mismo principio que usan Mixtral o DeepSeek para abaratar la inferencia. La ficha técnica que Meituan publicó en Hugging Face resume así la arquitectura:

  • 1.6 billones de parámetros totales, de los cuales cerca de 48,000 millones se activan por cada token procesado.
  • Ventana de contexto nativa de 1 millón de tokens, sostenida por una técnica propia llamada LongCat Sparse Attention, pensada para no perder de vista archivos o instrucciones lejanas dentro de un mismo repositorio de código.
  • Preentrenamiento sobre más de 35 billones de tokens y millones de horas de cómputo, sin caídas de entrenamiento ni picos de pérdida irrecuperables, según el propio reporte técnico de la compañía.
  • Todo el proceso —entrenamiento e inferencia— corrió en un clúster de 50,000 chips tipo ASIC (circuitos diseñados para una tarea puntual, no procesadores de uso general) fabricados en China.

Ese último punto es, según South China Morning Post, lo que distingue a LongCat-2.0 de su rival más cercano. DeepSeek-V4-pro, el modelo insignia que la propia DeepSeek lanzó en abril de 2026, usó chips chinos solo para la inferencia —la fase en la que el modelo ya entrenado responde a un usuario—, pero recurrió a otro tipo de hardware para el preentrenamiento, que es la etapa que más cómputo exige. Meituan asegura haber hecho ambas cosas en territorio nacional, algo que, según el medio hongkonés, ninguna otra compañía china había logrado todavía a esta escala.

La propia cuenta de LongCat en X confirmó el anuncio el martes:

La pieza que falta: ¿qué chip usó Meituan?

A pesar de dar una cifra tan precisa —50,000 chips— y de hablar de "superpods" de ASIC a gran escala, Meituan nunca reveló qué empresa los fabricó. Esa pieza, justamente, es la que más le importa a cualquiera que quiera comprobar la afirmación de forma independiente.

Meituan resumió el logro así en un comunicado:

"LongCat-2.0 ha demostrado que ahora tenemos la capacidad de entrenar modelos a gran escala en clústeres de cómputo domésticos."

Esa frase, publicada originalmente en la cuenta oficial de LongCat en WeChat y recogida por Reuters, es lo único que la compañía ofreció a modo de explicación técnica. No hay nombre de proveedor, no hay especificaciones del chip, no hay cifra de eficiencia comparada con una GPU de Nvidia. Reuters reporta que fabricantes chinos como Huawei y Enflame han ganado terreno justamente llenando el hueco que dejan las restricciones estadounidenses, aunque la agencia no vincula a ninguno de los dos directamente con el clúster de LongCat-2.0.

A computer chip with the letter ia printed on it
Photo by Igor Omilaev / Unsplash

La opacidad se extiende al modelo mismo. El repositorio en GitHub ya está disponible bajo licencia MIT y la API de pago ya está activa, pero tanto ese repositorio como la ficha en Hugging Face siguen marcando los pesos del modelo como "próximamente." Sin esos archivos descargables, ningún equipo externo puede replicar el entrenamiento ni confirmar la cifra de 50,000 chips por su cuenta.

De modelo anónimo en OpenRouter a abanderado declarado

Antes de presentarse oficialmente, una versión preliminar de LongCat-2.0 ya circulaba bajo el alias "Owl Alpha" en OpenRouter, una plataforma que agrupa modelos de distintos proveedores. Según Reuters, esa versión ya se había convertido en uno de los tres modelos más usados de la plataforma antes de que Meituan confirmara públicamente la conexión.

En benchmarks de programación, el modelo superó a Gemini 3.1 Pro y GPT-5.5 en dos pruebas específicas, aunque se quedó por debajo de Claude Opus 4.7 y 4.8, de acuerdo con datos recopilados por el medio especializado The Decoder:

  • SWE-bench Pro: 59.5
  • SWE-bench Multilingual: 77.3

En pruebas más generales —IFEval, IMO-AnswerBench y GPQA-diamond— LongCat-2.0 se quedó atrás de Gemini y GPT-5.5 por un margen considerable, según el mismo análisis. Meituan diseñó el modelo para funcionar como el "cerebro" de agentes de programación como Claude Code, OpenClaw y Hermes, y ya lo ofrece mediante una API compatible con los formatos de OpenAI y Anthropic, con un precio de 2.95 dólares por cada millón de tokens de salida, según TestingCatalog.

El momento no es casual. Meituan, comparada a menudo con DoorDash, llega tarde a un sector de IA chino ya saturado por DeepSeek y Doubao, de ByteDance: su equipo LongCat se formó apenas en 2023 y lanzó su primer modelo a finales de 2025. La compañía tampoco explicó cómo integrará LongCat-2.0 a sus propios productos, aunque versiones anteriores ya impulsan los asistentes de la app que recomiendan restaurantes, reservan hoteles y completan pedidos de comida —el mismo terreno de "comercio agéntico" que Alibaba ha empujado este año. Reuters apunta que Meituan busca diversificar ingresos en medio de un consumo débil y márgenes cada vez más ajustados, y LongCat-2.0 entra además a competir directamente con GLM-5.2, de Zhipu AI, lanzado el 13 de junio de 2026 bajo la misma licencia MIT.

El verdadero examen para LongCat-2.0 llega cuando esos pesos por fin estén disponibles para descarga. Solo entonces equipos externos podrán confirmar, chip por chip, si Meituan corrió de verdad sin Nvidia en igualdad de condiciones técnicas o si la cifra de 50,000 sigue siendo, por ahora, una declaración de la propia compañía sin nadie más que la respalde.

Fuentes: 1, 2, 3

Dilis Salazar imagen de perfil
por Dilis Salazar

Leer más de Tecnología y Ciencia