Anthropic flexibiliza Mythos: el dilema de compartir ciberamenazas sin abrir la puerta a atacantes

Anthropic flexibiliza Mythos y reabre el debate sobre IA, vulnerabilidades y acceso seguro

John P. imagen de perfil
por John P.
Anthropic flexibiliza Mythos: el dilema de compartir ciberamenazas sin abrir la puerta a atacantes

TL;DR:

Anthropic empezó a permitir que usuarios de Mythos compartan hallazgos de ciberseguridad con terceros vulnerables.
Project Glasswing mantiene acceso restringido al modelo y Anthropic ha extendido el programa a más de 40 organizaciones adicionales.
El debate ahora se centra en cómo alertar a más empresas sin divulgar detalles que puedan acelerar ataques.

Anthropic modificó las reglas de uso de Claude Mythos Preview para que participantes de Project Glasswing puedan compartir información sobre ciberamenazas con otras entidades que enfrenten vulnerabilidades similares, de acuerdo con el reporte citado por The Wall Street Journal. La decisión importa porque Mythos puede encontrar fallas de software a una escala difícil de manejar para equipos humanos, pero sus hallazgos también pueden servir a atacantes si se difunden sin control.

Claude Mythos Preview es un modelo de IA de frontera de Anthropic enfocado en tareas avanzadas de programación, razonamiento y ciberseguridad. La compañía no lo lanzó de forma pública: lo mantiene como research preview con acceso por invitación para flujos defensivos de ciberseguridad dentro de Project Glasswing.

El giro de Anthropic toca una tensión incómoda: si restringe demasiado la información, deja fuera a empresas pequeñas, proveedores y organizaciones que podrían estar expuestas. Si la abre demasiado, puede convertir una alerta defensiva en un mapa útil para atacantes.

El cambio rompe una tensión que Anthropic había creado desde Glasswing

Los usuarios de Mythos habían firmado acuerdos de confidencialidad para evitar que información de riesgo cibernético saliera del programa, según el reporte citado. La nueva postura permite compartir datos sobre amenazas y hallazgos, siempre que se haga de forma responsable.

"Las protecciones de confidencialidad fueron algo que los socios pidieron desde el inicio y se incorporaron en los acuerdos que firmaron. Conforme el programa ha madurado, las hemos adaptado para asegurar que la información clave pueda compartirse ampliamente —incluido fuera del programa— para lograr el máximo impacto defensivo", dijo una portavoz de Anthropic, según el reporte.

La página oficial de Project Glasswing describe un acceso todavía muy controlado. Anthropic afirma que Mythos Preview ya encontró miles de vulnerabilidades de alta severidad, incluidas algunas en sistemas operativos y navegadores importantes, y que extendió el acceso a más de 40 organizaciones que construyen o mantienen infraestructura crítica de software.

La compañía también comprometió hasta 100 millones de dólares en créditos de uso de Mythos Preview y 4 millones de dólares en donaciones directas a organizaciones de seguridad open source. La apuesta es clara: poner el modelo en manos defensivas antes de que capacidades parecidas lleguen a actores menos cuidadosos.

man wearing black dress shirt
Photo by Compagnons / Unsplash

Por qué Mythos preocupa a empresas y gobiernos

Anthropic sostiene que Mythos Preview puede detectar, reproducir y ayudar a corregir vulnerabilidades reales, pero también reconoce límites estrictos de divulgación: en su análisis técnico, la empresa dijo que más del 99% de las vulnerabilidades encontradas todavía no habían sido parchadas, por lo que no podía publicar detalles sensibles.

Ese punto explica el corazón del debate. Un modelo capaz de encontrar fallas críticas puede ayudar a proteger infraestructura, bancos, hospitales, navegadores y software open source. Pero si los hallazgos salen con demasiada precisión, también pueden facilitar ataques más rápidos.

La preocupación ya llegó al sector financiero global. Reuters reportó el 18 de mayo de 2026 que Anthropic se preparaba para informar al Financial Stability Board, organismo que coordina reglas financieras para economías del G20, sobre vulnerabilidades cibernéticas detectadas por Mythos. El acercamiento habría ocurrido después de una solicitud de Andrew Bailey, gobernador del Banco de Inglaterra y presidente del FSB.

La presión se concentra en cuatro frentes:

  • Acceso: quién puede usar modelos capaces de detectar y explotar fallas.
  • Divulgación: qué información debe compartirse con empresas vulnerables.
  • Riesgo operativo: cómo evitar que exploits, pruebas de concepto o cadenas de vulnerabilidades circulen sin control.
  • Equidad defensiva: cómo proteger a organizaciones que no forman parte del círculo de grandes socios.

El punto delicado: alertar sin publicar el mapa de ataque

El representante demócrata Josh Gottheimer presionó a Anthropic para que los usuarios de Mythos pudieran advertir a pares de sus industrias cuando detectaran riesgos urgentes.

"Ninguna entidad debería estar contractualmente restringida de advertir a otros, coordinar mitigaciones o informar a actores relevantes y confiables sobre riesgos cibernéticos urgentes", escribió Gottheimer en una carta a Dario Amodei, CEO de Anthropic, según el texto citado por The Wall Street Journal.

El problema no es si las amenazas deben compartirse. El problema es cómo. Una alerta útil para un hospital, una empresa de energía o un proveedor de software puede volverse peligrosa si incluye demasiado detalle técnico. El mismo hallazgo que permite defender una red también puede acelerar un ataque contra otra.

Por eso la nueva política de Anthropic no elimina la fricción. La mueve a otra parte: de la confidencialidad absoluta a la gobernanza de la divulgación. Ahora el reto será definir quién recibe qué información, bajo qué condiciones y con qué nivel de detalle.

Qué significa para empresas fuera del club de Mythos

Para compañías en México y América Latina, la discusión importa aunque Mythos no esté disponible de forma directa. Muchas organizaciones regionales dependen de software global, proveedores cloud, navegadores, sistemas financieros, herramientas de identidad y librerías open source que podrían aparecer en los hallazgos de modelos como este.

El valor real de la nueva postura de Anthropic dependerá de algo muy concreto: si las alertas que salen de Project Glasswing llegan a quienes deben parchar, sin exponer instrucciones de explotación. Para empresas medianas, gobiernos locales, hospitales y proveedores con poco personal de seguridad, esa diferencia puede ser enorme.

La decisión de Anthropic no resuelve el dilema. Lo hace visible. La próxima frontera de la ciberseguridad con IA no será solo quién tiene el modelo más potente, sino quién logra convertir sus hallazgos en defensas compartidas antes de que otros los conviertan en ataques.

Fuentes: 1, 2, 3, 4, 5

John P. imagen de perfil
por John P.

Suscríbete GRATIS

Recibe las noticias más importantes de política, tecnología, negocios, deportes, entretenimiento y cultura directamente en tu correo.

¡Listo! Revisa tu correo

Para completar la suscripción, haz clic en el enlace de confirmación que enviamos a tu correo. Si no llega en 3 minutos, revisa tu carpeta de spam.

Ok, gracias

Leer más