Amazon apaga Kirorank: su ranking de IA premió consumo de tokens, no productividad
Amazon retiró Kirorank tras detectar uso artificial de IA que elevaba costos de tokens.
En resumen:
Amazon eliminó su ranking interno de uso de inteligencia artificial "Kirorank"
Se informó que los empleados utilizaron agentes de inteligencia artificial para completar diversas tareas sin sentido, lo que mejoró el ranking
Esto sugiere el riesgo de medir el uso de inteligencia artificial por separado pasando por alto el software útil y los ahorros de costos reales.
El Financial Times informó que Amazon cerró su ranking "Kirorank", que mide el uso de su plataforma interna de desarrollo de inteligencia artificial "Kiro", después de descubrir que los empleados utilizaban agentes autónomos, Completa una gran cantidad de tareas sin sentido, lo que lleva a una alta clasificación
Amazon dice que Dashboard está en fase de prueba, ni es una herramienta oficial ni aprobada, y ha sido eliminada
Esta historia es destacable porque revela un problema que enfrentan las grandes empresas tecnológicas: medir el uso de la IA por cantidad puede dar lugar a incentivos que desperdicien tokens y no mejoren la calidad del software.
Kiro es una plataforma de desarrollo de IA que integra IDE, CLI e interfaz Web para brindar soporte a los programadores desde el desarrollo de prototipos hasta el código listo para la producción, documentación y pruebas.
El problema no es Kiro en sí, sino "Kirorank", un sistema de clasificación de uso de IA.
Según se informa, algunos empleados asignan tareas no productivas a agentes de IA, Esto aumenta su actividad y mejora su posición en el ranking.
Como resultado, aumenta el consumo de tokens (unidades de datos procesadas por el modelo), lo que aumenta los costos informáticos
"Por favor, por amor de Dios, la IA no es solo para usar IA", dijo Dave Treadwell a sus empleados
Amazon ha confirmado que el dashboard no funciona actualmente
"El dashboard beta no es ni una herramienta oficial ni aprobado y ahora ha sido eliminado" Amazon explica
Un error de juicio de incentivos: consumo de tokens en lugar de trabajo significativo
La historia de Kirorank es más que una anécdota sobre la cultura corporativa, es una advertencia sobre cómo las métricas erróneas pueden convertir a la IA en una ilusión de productividad
Amazon supuestamente presionó a más del 80% de sus desarrolladores cada semana para que la utilicen si se utiliza para mejorar la colaboración
Como resultado de menos errores y ciclos de desarrollo más cortos, este objetivo es completamente razonable.
Sin embargo, si las clasificaciones evalúan la actividad pura, los usuarios naturalmente intentarán mostrar hasta qué punto están usando la IA, no cuánto están haciendo con ella.
El núcleo de este caso es claro:
- Kirorank calificó a algunos empleados en función del uso de la IA de los usuarios de Kiro.
- Algunos empleados pueden dejar que los agentes de IA realicen tareas innecesarias.
- Esta práctica, conocida internamente como maximización de tokens, es simplemente para aumentar artificialmente la cantidad de tokens.
- Amazon explica que las clasificaciones se introdujeron para visualizar cómo la IA puede acelerar el trabajo.
- Según los informes, Amazon ahora está utilizando métricas de "despliegue estandarizado" para medir cómo la IA continúa usando la IA para generar código realmente útil.
El enfoque está en cambiar el enfoque de cálculos de consejos, tokens y llamadas a modelos a medir despliegues.
Esto realmente impulsa los productos en un momento en el que los costos ya no pasan por alto, y esta decisión de Amazon se toma en un momento delicado.
Reuters informa que Amazon planea invertir 200 mil millones de dólares en gastos de capital en 2026 para fortalecer su inteligencia artificial y infraestructura en la nube, frente a los 131 mil millones de dólares en 2025.
Esto también ocurre poco después de una serie de despidos en enero de 2026, y Reuters informa que Amazon confirmó otros 16.000 despidos, completando así el total de alrededor de 30.000 despidos previstos desde octubre.
En este contexto, cada anuncio y señal estará sujeto a presión externa.
Además, Amazon Anthropic, líder en el ecosistema de modelos, documentó la estructura de precios para el uso adicional de las tarifas de API estándar.
También anunció que, A partir del 15 de junio de 2026, las suscripciones a Agent SDK y Claude-P consumirán un saldo mensual fijo, independientemente de su uso en operaciones de conversación.
Para las empresas que ya utilizan herramientas de inteligencia artificial en México y América Latina, la lección es clara: seNo basta con que los equipos digan "usamos inteligencia artificial".
Tienen que preguntarse cuánto tiempo se ha ahorrado o si la calidad o los resultados han mejorado.
La pregunta que Kirorank plantea a toda la industria es incómoda: muestra cómo un solo indicador puede influir en el comportamiento de una organización más rápido que cualquier directiva interna, si el indicador es un mecanismo para medir el consumo, la factura precede a la productividad