Cohere lanza Command A+: el modelo abierto Apache 2.0 que quiere llevar IA avanzada a servidores privados

Cohere lanza Command A+, su modelo abierto Apache 2.0 para IA empresarial y agentes.

John P. imagen de perfil
por John P.
Cohere lanza Command A+: el modelo abierto Apache 2.0 que quiere llevar IA avanzada a servidores privados

TL;DR:

Cohere liberó Command A+, su nuevo modelo MoE abierto para tareas agentic, razonamiento y documentos multimodales.
El modelo tiene 218,000 millones de parámetros totales, pero activa solo 25,000 millones por paso de generación.
Su licencia Apache 2.0 permite uso comercial, modificación y despliegue privado sin pagar una licencia propietaria.

Cohere presentó Command A+, un nuevo modelo de lenguaje abierto bajo licencia Apache 2.0 diseñado para empresas que quieren ejecutar IA avanzada en infraestructura propia. El lanzamiento importa porque combina tres piezas que rara vez llegan juntas: arquitectura Sparse MoE, procesamiento multimodal y una versión W4A4 de 4 bits que, según la compañía, puede correr en una NVIDIA B200 o en dos NVIDIA H100, reduciendo la barrera técnica para desplegar modelos grandes fuera de APIs cerradas.

Command A+ es un modelo de lenguaje Sparse Mixture-of-Experts que activa solo una parte de sus parámetros en cada generación para reducir costos de inferencia sin renunciar al tamaño total del sistema.

La apuesta de Cohere no va dirigida al usuario casual. Va contra un problema más caro: empresas, gobiernos y sectores regulados que quieren usar IA con datos internos, pero no siempre pueden mandarlos a servicios externos por razones de privacidad, cumplimiento o soberanía tecnológica.

Ese punto se volvió más claro tras el anuncio de abril de 2026, cuando Cohere y la alemana Aleph Alpha dijeron que unirían fuerzas para construir una alternativa de IA soberana entre Canadá y Europa, respaldada por un compromiso de financiamiento estructurado de 500 millones de euros, aproximadamente 600 millones de dólares, por parte de empresas de Schwarz Group.

a person walking in a large room
Photo by Yoan / Unsplash

Apache 2.0 cambia la conversación para empresas

La licencia no es un detalle menor. Modelos anteriores de Cohere, como Command R y Command R+, llegaron con licencias no comerciales. Con Command A+, la compañía permite descargar los pesos, modificarlos, distribuirlos y usarlos comercialmente bajo Apache 2.0.

Para una empresa en México o América Latina, eso abre una ruta distinta a la dependencia total de APIs externas: probar el modelo, afinarlo con datos propios y desplegarlo en un entorno privado o administrado. No significa que cualquier compañía pueda operarlo sin inversión técnica, pero sí reduce una de las barreras más pesadas: la licencia.

Cohere publicó el modelo en Hugging Face y también lo ofrece mediante Model Vault, su entorno de inferencia administrada. La ficha oficial confirma estos puntos clave:

  • Modelo: command-a-plus-05-2026
  • Licencia: Apache 2.0
  • Arquitectura: Sparse / MoE
  • Tamaño: 218B parámetros totales; 25B activos
  • Contexto: 128K tokens de entrada y hasta 64K de generación
  • Modalidades de entrada: texto, imagen y uso de herramientas
  • Idiomas: soporte para 48 idiomas
  • Frameworks: vLLM y Transformers
  • Hardware mínimo en W4A4: 1× B200 o 2× H100

La cuantización W4A4 es el dato que mueve la historia

La parte técnica más importante está en la cuantización. Cohere ofrece Command A+ en BF16, FP8 y W4A4, una versión de 4 bits que busca bajar el consumo de memoria y acelerar inferencia.

En modelos de razonamiento, comprimir demasiado suele cobrar factura: respuestas menos precisas, errores acumulados en razonamientos largos o peor desempeño en tareas complejas. Cohere dice que redujo ese riesgo al cuantizar selectivamente los expertos MoE a 4 bits, mientras mantiene la ruta de atención en precisión completa y usa Quantization-Aware Distillation para cerrar la brecha de calidad.

La promesa es fuerte, pero conviene leerla con precisión editorial: Cohere habla de diferencias de calidad “imperceptibles” o “casi sin pérdida” en sus propias mediciones. No es lo mismo que una validación independiente masiva en producción.

Aun así, el dato operativo pesa. La compañía afirma que Command A+ ofrece hasta 63% más tokens de salida por segundo y reduce hasta 17% el tiempo al primer token frente a Command A Reasoning, bajo las condiciones de prueba descritas por Cohere.

Más agentes, documentos y citas nativas

Command A+ fue diseñado para flujos agentic, es decir, tareas donde el modelo no solo responde texto, sino que puede llamar herramientas, consultar bases de datos, usar APIs o trabajar con archivos.

En benchmarks reportados por Cohere, el salto frente a Command A Reasoning fue considerable:

  • En τ²-Bench Telecom, pasó de 37% a 85%.
  • En Terminal-Bench Hard, subió de 3% a 25%.
  • En evaluaciones internas de North, Cohere reportó mejoras de 20% en Agentic Question Answering y 32% en análisis de hojas de cálculo.
  • En memoria dentro de North, Command A+ alcanzó 54%, frente a 39% de Command A Reasoning.
  • En multimodalidad, logró 63% en MMMU Pro y 75.1% en MMMU.
  • En MathVista, pasó de 73.5% a 80.6%.
  • En CharXiv reasoning, subió de 46.9% a 52.7%.

La otra pieza relevante son las citas nativas. Cuando el modelo usa resultados de herramientas externas, puede generar “grounding spans”: etiquetas que conectan fragmentos específicos de su respuesta con la fuente que los respalda, como una fila de base de datos o un documento consultado.

Eso no elimina las alucinaciones por arte de magia. Pero sí le da a una empresa una forma más auditable de revisar de dónde salió una afirmación, algo especialmente valioso en finanzas, salud, legal, manufactura o gobierno.

El nuevo tokenizer también baja costos fuera del inglés

Cohere también cambió el tokenizer de Command A+. Ese componente divide el texto en unidades que el modelo procesa; mientras menos tokens se necesiten para una misma respuesta, menor puede ser el costo de inferencia.

La compañía reportó mejoras de eficiencia de tokenización en idiomas no europeos:

  • Árabe: 20% menos tokens
  • Japonés: 18% menos tokens
  • Coreano: 16% menos tokens
  • Cobertura total: 48 idiomas

Para empresas multilingües, este detalle puede pesar tanto como un benchmark. Un modelo que cobra o consume recursos por token se vuelve más caro cuando procesa idiomas mal optimizados. En despliegues regionales, soporte para español más otras lenguas puede ser parte del costo real, no solo de la calidad lingüística.

Cohere quiere ganar por eficiencia, no por tamaño bruto

Command A+ no llega como el modelo abierto más grande ni como una garantía de dominio absoluto en todos los benchmarks. La lectura más útil es otra: Cohere está empujando un modelo empresarial que prioriza control, despliegue privado y eficiencia de hardware.

La propia compañía lo posiciona alrededor de IA soberana: modelos que organizaciones puedan ejecutar, adaptar y controlar dentro de sus propios entornos. Fujitsu, citada en el anuncio oficial, lo expresó así:

"Fujitsu cree que la arquitectura mixture-of-experts de Command A+ y su sólido desempeño agentic se alinean bien con nuestro compromiso de entregar soluciones de IA soberana seguras mediante Takane y Kozuchi Enterprise AI Factory. Esperamos aprovechar sus capacidades para acelerar la adopción de IA segura y escalable para nuestros clientes."

El reto ahora será comprobar fuera del laboratorio si esa mezcla de licencia abierta, bajo requerimiento de GPUs y citas nativas aguanta cargas reales. Para los equipos de IA empresarial, la pregunta ya no es solo qué modelo responde mejor, sino cuál pueden operar con control, trazabilidad y costos defendibles.

Fuentes: 1, 2, 3, 4

John P. imagen de perfil
por John P.

Leer más