Saltar al contenido

AWS sube 20% sus precios de GPU Nvidia para cómputo de IA — el segundo aumento en seis meses

AWS sube 20% los precios de EC2 Capacity Blocks para GPU Nvidia a partir del 1 de julio; los chips Trainium propios no cambian.

por Patricia Rodriguez
AWS sube 20% sus precios de GPU Nvidia para cómputo de IA — el segundo aumento en seis meses
Photo by Brecht Corbeel / Unsplash

TL;DR:

  • Amazon Web Services anuncia una subida del 20% en EC2 Capacity Blocks para instancias con GPU Nvidia, efectiva el 1 de julio de 2026.
  • El alza cubre todas las generaciones disponibles: Blackwell B300 y B200, H200, H100 y A100; los chips Trainium de fabricación propia de AWS no se tocan.
  • Es la segunda subida en menos de seis meses: en enero de 2026, las instancias con H200 ya habían subido ~15%, lo que acumula un incremento superior al 38% en ese segmento.

Quien necesite compute garantizado de Nvidia en la nube de Amazon pagará, a partir del 1 de julio de 2026, un 20% más que hoy. Amazon Web Services actualizó este viernes su página oficial de precios de EC2 Capacity Blocks for ML con los nuevos valores aplicables a toda la familia de instancias aceleradas con hardware de Nvidia —Blackwell, H200, H100 y A100— con un ajuste uniforme del 20%.

EC2 Capacity Blocks es el servicio de AWS que permite a empresas reservar capacidad de cómputo en clusters de GPU con antelación: pagas por adelantado y el acceso a esa infraestructura queda asegurado en las fechas que necesitas, sin importar la demanda de ese momento. Es la respuesta de Amazon a la escasez estructural de GPU de alto rendimiento que lleva dos años tensando el mercado de cómputo para inteligencia artificial.

El movimiento, reportado primero por The Information, llega en medio de lo que la publicación describe como un freno global del cómputo que está encareciendo costos en toda la cadena de suministro tecnológica.

the nvidia logo is displayed on a table
Photo by Mariia Shalabaieva / Unsplash

Los nuevos precios, acelerador por acelerador, desde el 1 de julio

El ajuste es exactamente el mismo en todos los casos: 20% sobre las tarifas actuales. Las nuevas tarifas por hora y por acelerador, según la página oficial de AWS, son:

  • P6-B300 (Blackwell B300): $14.04 USD (era $11.70 USD) — todas las regiones salvo AWS GovCloud
  • P6-B200 (Blackwell B200): $12.355 USD (era $10.296 USD) — todas las regiones salvo GovCloud
  • P5 con H100 (regiones EE. UU.): $5.191 USD (era $4.326 USD)
  • P5 con H100 (fuera de EE. UU.): $4.72 USD (era $3.933 USD)
  • P5e con H200: $5.97 USD (era $4.975 USD)
  • P5en con H200 (EE. UU.): $6.865 USD (era $5.721 USD)
  • P5en con H200 (fuera de EE. UU.): $6.241 USD (era $5.201 USD)
  • P4de con A100 (EE. UU.): $2.214 USD (era $1.845 USD)

AWS indica que todos los demás precios permanecen sin cambios.

Trainium se queda intacto — y el contraste es elocuente

Hay un dato que el anuncio deja en evidencia: los chips Trainium de Amazon —tanto la generación Trn1 como la Trn2— no registran ningún movimiento. El Trn1 se queda en $0.596 por acelerador por hora; el Trn2, en $2.235. Sin cambios.

La diferencia es notable. Quien opere cargas de IA con GPU Nvidia en AWS pagará 20% más a partir de julio. Quien haya apostado por Trainium no ve alteración en su factura. AWS lleva años desarrollando su propio silicio como alternativa al ecosistema de Nvidia, y este tipo de asimetría en la política de precios construye un incentivo real —sin necesidad de comunicados de prensa— para que los equipos de ingeniería evalúen la migración.

El límite práctico de esa opción, claro, sigue siendo técnico: Trainium está optimizado para entrenamiento a escala, pero para modelos de frontera, inferencia crítica o arquitecturas que dependen de CUDA, el H100 y el H200 no se sustituyen con facilidad.

El segundo golpe en seis meses: las H200 ya habían subido ~15% en enero

Esta no es la primera alza de precios en EC2 Capacity Blocks. En los primeros días de enero de 2026, AWS incrementó silenciosamente las tarifas de las instancias con H200 en torno a un 15%, sin comunicado de prensa y sin anticipar si el ajuste seria al alza o a la baja. La instancia p5e.48xlarge —ocho H200 por instancia— pasó de $34.61 a $39.80 por hora en la mayoría de regiones; la p5en.48xlarge subió de $36.18 a $41.61.

La reacción en la industria fue escéptica. El analista cloud Corey Quinn señaló en LinkedIn que el movimiento no respondía a la dinámica normal de oferta y demanda, sino a una decisión de política de precios: tarifas de lista actualizadas de forma uniforme en todas las regiones. AWS defendió el cambio con el mismo argumento que aplica ahora: los precios de Capacity Blocks son dinámicos y reflejan los patrones de oferta y demanda esperados para cada trimestre.

Con la subida del 1 de julio, las instancias con H200 acumulan un incremento total superior al 38% en menos de seis meses. Para una empresa que corre entrenamiento de modelos grandes en clusters de p5en.48xlarge a una escala de decenas o cientos de instancias, el impacto en presupuesto es difícil de ignorar.

Cabe subrayar la distinción que AWS ha defendido en ambas ocasiones: los modelos On-Demand y los Savings Plans mantienen sus precios. La volatilidad está concentrada en el segmento de reserva garantizada, que es precisamente el que usan quienes necesitan planificar workloads intensivos con semanas de anticipación —y que, por lo tanto, tienen menos margen para reaccionar cuando el precio sube.

Según la página oficial de AWS, los precios vigentes están sujetos a revisión periódica basada en la dinámica del mercado. Dos ciclos seguidos al alza no cambian esa política, pero sí dejan claro en qué dirección apunta la presión de la escasez.

Fuentes: 1, 2

Patricia Rodriguez imagen de perfil
por Patricia Rodriguez

Solo puedo decir que soy una apasionada con todo lo que tiene que ver con el mundo Digital me encanta todo lo que es escritura, IA, Ediciones de Video Reels y más. Me considero una persona "DIVERGENTE"

Leer más de Tecnología y Ciencia