Saltar al contenido

Arena, el ranking de IA que todos los grandes laboratorios usan, ya factura 100 millones de dólares al año

por Dilis Salazar
Arena, el ranking de IA que todos los grandes laboratorios usan, ya factura 100 millones de dólares al año

TL;DR:

  • Solo ocho meses después de lanzar su servicio comercial, en septiembre de 2025, Arena alcanzó $100 millones en ingresos anualizados.
  • La cifra es más del triple que los $30M que reportaba en enero, cuando cerró su Serie A de $150M a una valuación de $1,700 millones.
  • El ingreso es por consumo —no recurrente— y Arena opera sin competidores directos tras el cierre de Yupp en marzo de 2026.

Arena nació en 2023 como proyecto de investigación en la Universidad de California Berkeley. La mecánica era simple: mostrarle al usuario dos respuestas anónimas de modelos de IA y dejar que eligiera la mejor. Más de 10 millones de evaluaciones humanas después, esa plataforma gratuita se convirtió en el árbitro de facto de la carrera de los modelos de IA. Ahora también es un negocio que factura $100 millones en ingresos anualizados, alcanzados apenas ocho meses después de lanzar su primer producto de pago.

La palanca comercial es AI Evaluations, el servicio que Arena presentó en septiembre de 2025 para ofrecer a laboratorios de IA y empresas análisis de rendimiento detallados extraídos de las interacciones de su comunidad. En enero de 2026, cuando la startup cerró una Serie A de $150 millones a una valuación de $1,700 millones, sus ingresos anualizados llegaban a $30 millones. En seis meses los triplicó.

Hay un matiz que el propio CEO señaló antes de que alguien pudiera malinterpretarlo. Aunque Arena usa el término ARR —sigla que en el ecosistema de startups suele leerse como ingresos recurrentes— la realidad es que sus clientes pagan por consumo, no mediante suscripción.

"Mucha gente ni siquiera entiende que nuestro negocio está generando dinero; todavía nos ven como un proyecto de código abierto"

admitió Anastasios Angelopoulos, co-fundador y CEO, en declaraciones a TechCrunch. La aclaración importa: la cifra describe la tasa anualizada del ritmo actual, no ingresos contratados por adelantado.

El árbitro que también cobra entrada

La lógica del negocio de Arena descansa en una paradoja elegante. Su leaderboard es completamente gratuito —cualquiera puede entrar, escribir un prompt y votar entre dos respuestas anónimas— y eso es exactamente lo que le da valor al producto de pago.

AI Evaluations no lo compra el usuario casual. Lo contratan los mismos laboratorios que quieren posicionarse bien en el ranking. OpenAI, Anthropic y Google ya citan los resultados de Arena en sus propios anuncios de lanzamiento; Arena les vende el acceso detallado a esos datos para refinar sus modelos durante el post-entrenamiento, la fase donde la IA se pule antes de llegar al público.

Angelopoulos fue directo sobre el campo de batalla: Arena no compite con otras plataformas de leaderboard —ya no quedan. Yupp, la única startup rival con un modelo similar de evaluación por votación humana, cerró en marzo de 2026 después de haber recaudado $33 millones con respaldo de a16z. El verdadero competidor, según el CEO, son empresas de etiquetado humano como Mercor, Surge y Scale AI, todas disputando el mismo presupuesto de post-entrenamiento de los laboratorios.

Ese mercado crece sin pausa. Los ingresos de Handshake por entrenamiento de IA casi se duplicaron entre enero y abril de 2026, pasando de $550 millones a cerca de $1,000 millones anualizados, de acuerdo con The Information. Mercor también superó los $1,000 millones anualizados en lo que va del año, aunque una brecha de seguridad complicó su relación con Meta.

Los tres fundadores que construyeron el marcador de la IA

La compañía fue fundada por investigadores de Berkeley. Anastasios Angelopoulos y Wei-Lin Chiang —ambos estudiantes postdoctorales— arrancaron el proyecto en 2023. A ellos se sumó Ion Stoica, catedrático de la misma universidad y co-fundador de Databricks, quien asesoró el proyecto antes de que se incorporara formalmente como empresa en abril de 2025. Chiang ocupa el cargo de CTO.

En total, Arena ha levantado $250 millones de inversores que incluyen a Felicis, Andreessen Horowitz, Kleiner Perkins, Lightspeed Venture Partners, The House Fund y UC Investments.

La plataforma califica modelos en texto, código, visión y generación de imágenes. Su incorporación más reciente es Agent Mode, que permite evaluar flujos de trabajo complejos donde la IA opera como agente autónomo.

Convertir en negocio la posición de árbitro —ser la vara con la que los laboratorios miden sus modelos y se comparan entre sí— deja una pregunta abierta: si evaluar IA ya rinde casi tanto como construirla, ¿cuánto vale ese árbitro cuando los modelos se vuelvan aún más difíciles de distinguir entre sí?

Fuentes: 1, 2

Dilis Salazar imagen de perfil
por Dilis Salazar

Leer más de Tecnología y Ciencia