DeepSeek deja permanente el descuento de 75% para V4-Pro y aprieta la guerra de precios en IA

DeepSeek mantendrá V4-Pro a $0.435 por input y $0.87 por output por millón de tokens.

John P. imagen de perfil
por John P.
DeepSeek deja permanente el descuento de 75% para V4-Pro y aprieta la guerra de precios en IA
Photo by Solen Feyissa / Unsplash

TL;DR:

DeepSeek mantendrá de forma permanente el descuento de 75% en su modelo V4-Pro.
El precio queda en $0.435 por millón de tokens de entrada sin caché y $0.87 por millón de tokens de salida.
La decisión baja el piso de precios para developers y mete presión a rivales que venden modelos premium con tarifas más altas.

DeepSeek hará permanente el descuento de 75% en su modelo insignia V4-Pro, una rebaja que originalmente estaba programada para terminar el 31 de mayo de 2026. La compañía dejará el precio en una cuarta parte de la tarifa original para su API, con $0.435 dólares por millón de tokens de entrada sin caché y $0.87 dólares por millón de tokens de salida. El movimiento importa porque no solo abarata el acceso a un modelo avanzado: también obliga a empresas, startups y equipos técnicos a recalcular cuánto cuesta construir productos de IA a escala.

La página oficial de precios de DeepSeek ya muestra la nueva estructura para deepseek-v4-pro. El ajuste convierte una promoción temporal en una tarifa estándar, al menos bajo las condiciones publicadas por la empresa, que también advierte que sus precios pueden cambiar y recomienda revisar la página oficial con regularidad.

Token es una unidad de texto que un modelo de IA procesa para leer una instrucción, generar una respuesta o analizar documentos. En APIs de inteligencia artificial, el cobro suele depender de cuántos tokens entran al modelo y cuántos salen como respuesta.

El recorte deja así la tabla clave para V4-Pro:

  • Input con caché: $0.003625 por millón de tokens.
  • Input sin caché: $0.435 por millón de tokens.
  • Output: $0.87 por millón de tokens.
  • Contexto: 1 millón de tokens.
  • Salida máxima: hasta 384,000 tokens.
  • Límite de concurrencia: 500.

La diferencia frente a la tarifa anterior es directa: DeepSeek listaba $1.74 por millón de tokens de entrada sin caché y $3.48 por millón de tokens de salida antes del descuento. Con el recorte permanente, el costo queda en una cuarta parte de esos niveles.

a very large array of electronic equipment in a room
Photo by Matthieu Beaumont / Unsplash

El precio convierte a V4-Pro en una referencia incómoda para la industria

El golpe de DeepSeek no está solo en el número bajo. Está en la permanencia. Una promoción puede ignorarse como una táctica de adquisición de usuarios; una tarifa establecida obliga a los compradores de API a usarla como punto de comparación en cada negociación.

Para developers en México y Latinoamérica, el dato es especialmente relevante. Muchos productos de IA no fallan por falta de ideas, sino por el costo de operar agentes, análisis de documentos largos, asistentes de código o flujos que consumen millones de tokens al día. Si un modelo competente baja el costo por token, también baja la barrera para lanzar servicios que antes necesitaban presupuesto de empresa grande.

La API de DeepSeek también mantiene compatibilidad con formatos de OpenAI y Anthropic, de acuerdo con su documentación. Eso reduce fricción técnica para equipos que ya usan SDKs o herramientas compatibles con esos ecosistemas. No elimina los costos de migración, pruebas o compliance, pero sí hace más sencillo evaluar el modelo sin rehacer toda la infraestructura.

Reuters reportó que DeepSeek no aclaró si el recorte permanente está relacionado con una mayor disponibilidad de chips Huawei Ascend 950, infraestructura que el medio vinculó con el rendimiento de V4. Ese punto importa porque, si el menor costo viene de mejor disponibilidad de cómputo, el precio puede ser algo más que una maniobra comercial. Aun así, DeepSeek no confirmó públicamente esa relación como causa directa.

Barato no significa decisión automática para empresas

El nuevo precio puede verse agresivo, pero no resuelve todo. En empresas reguladas, bancos, aseguradoras, firmas legales, gobiernos o compañías que manejan datos sensibles, el costo por millón de tokens es apenas una parte de la decisión.

Antes de mover cargas de trabajo a un proveedor de IA, los equipos suelen revisar:

  • Manejo de datos y políticas de retención.
  • Disponibilidad y confiabilidad del servicio.
  • Riesgo geopolítico, especialmente por tratarse de una empresa china.
  • Cumplimiento normativo según industria y país.
  • Calidad real del modelo en tareas propias, no solo en benchmarks.
  • Soporte técnico y estabilidad de precios a largo plazo.

Por eso el recorte no significa que todos los clientes empresariales vayan a migrar a DeepSeek. Sí significa que cualquier proveedor más caro tendrá que explicar con más claridad qué justifica la diferencia: mejor desempeño, más confianza, mejor soporte, garantías legales o integración superior.

La apuesta de DeepSeek es volumen, no margen premium

DeepSeek presentó V4-Pro en abril de 2026 como parte de la familia DeepSeek-V4, con 1.6 billones de parámetros totales y 49,000 millones activos para la versión Pro. La compañía también colocó el contexto de 1 millón de tokens como una de las piezas centrales del lanzamiento.

El precio permanente refuerza esa estrategia. En lugar de vender cada token como un producto premium, DeepSeek busca que su API sea lo bastante barata para integrarse en flujos intensivos: agentes, programación asistida, análisis de grandes bases documentales, investigación interna y automatización.

Ahí está el cambio de fondo. Si la IA se vuelve infraestructura, gana quien pueda entregar suficiente capacidad a menor costo. DeepSeek está empujando esa lógica con una tarifa difícil de ignorar.

Para el mercado, el mensaje es claro: la guerra de precios en IA ya no gira solo alrededor de modelos pequeños o versiones “flash”. Ahora también toca a modelos insignia. Y cuando el precio de referencia cae tan fuerte, todo el ecosistema tiene que recalcular cuánto vale realmente un token.

Fuentes: 1, 2, 3, 4, 5

John P. imagen de perfil
por John P.

Leer más de Tecnología y Ciencia