Saltar al contenido

OpenAI mejora GPT-5.5-Cyber y crea Patch the Planet con Trail of Bits para parchear código abierto

OpenAI libera la versión completa de GPT-5.5-Cyber y crea Patch the Planet para blindar software libre.

por Dilis Salazar
OpenAI mejora GPT-5.5-Cyber y crea Patch the Planet con Trail of Bits para parchear código abierto

TL;DR:

  • OpenAI liberó la versión completa de GPT-5.5-Cyber para defensores verificados y amplió Daybreak, su plataforma de ciberdefensa.
  • El modelo marcó 85.6% en el benchmark CyberGym frente al 81.8% de GPT-5.5, su mejor registro en esa prueba.
  • Patch the Planet, fundada con Trail of Bits, cerró su primera semana con 64 pull requests, 51 reportes y 37 parches fusionados en 19 proyectos de código abierto.

OpenAI presentó este 22 de junio de 2026 una expansión de Daybreak, su conjunto de herramientas de ciberseguridad, con la versión completa de GPT-5.5-Cyber y una nueva iniciativa, Patch the Planet, fundada junto a la firma de seguridad Trail of Bits. El anuncio llega en un momento incómodo para el sector: los modelos cyber más potentes de su rival Anthropic —Mythos 5 y Fable 5— siguen fuera de servicio por una orden de control de exportaciones del gobierno de Estados Unidos. OpenAI abre así más acceso a sus capacidades defensivas para investigadores y empresas verificadas justo cuando se calienta la carrera por poner inteligencia artificial avanzada en manos de quienes defienden redes. La apuesta de fondo es clara: dejar de solo cazar vulnerabilidades y empezar a repararlas a velocidad de máquina.

GPT-5.5-Cyber es un modelo de OpenAI diseñado para trabajo de ciberseguridad avanzado y autorizado, más permisivo y más capaz que el modelo general en tareas de seguridad. Tras un primer adelanto pensado sobre todo para reducir los rechazos innecesarios en flujos especializados, la compañía liberó ahora la versión completa, disponible solo para empresas e investigadores de seguridad verificados. Puede sostener un análisis profundo en bases de código grandes: detecta componentes sensibles, rastrea si el código vulnerable es alcanzable, valida fallas probables en entornos controlados y desarrolla y prueba los parches.

En las pruebas que publicó OpenAI, la nueva versión superó a GPT-5.5 en tres bancos de evaluación:

  • CyberGym (reproducir vulnerabilidades conocidas): 85.6% frente a 81.8% de GPT-5.5. Es el puntaje más alto que OpenAI dice haber medido en un solo modelo.
  • ExploitGym (convertir fallas conocidas en exploits funcionales): 39.5% frente a 25.95%.
  • SEC-bench Pro (descubrimiento de fallas de largo aliento y pruebas de concepto): 69.8% frente a 63.1%.

El cuello de botella ya no es encontrar fallas, sino parcharlas

Durante años, dar con una vulnerabilidad seria exigía tiempo, experiencia escasa y un conocimiento íntimo de sistemas complejos. Esa parte se abarató. Hoy los modelos de frontera recorren bases de código enormes, razonan rutas de ataque y destapan problemas que antes pasaban inadvertidos. El resultado, según OpenAI, es que los defensores ya no se ahogan por falta de hallazgos, sino por exceso: el embudo se movió hacia el otro extremo, el de reparar.

Un reporte de vulnerabilidad, por sí solo, no protege a nadie. El valor aparece al validar el problema, medir su impacto, escribir y probar un parche, coordinar la divulgación y ayudar a desplegar el arreglo. Ahí dice OpenAI estar invirtiendo con sus socios, para convertir la capacidad del modelo en reducción real de riesgo. La compañía también actualizó Codex Security, su complemento para hallar y parchear fallas dentro del flujo de desarrollo. Desde que entró en vista previa en marzo, escaneó más de 30 millones de commits en más de 30,000 bases de código; revisores humanos marcaron a mano más de 70,000 hallazgos como corregidos y otros 500,000 se determinaron corregidos de forma automática.

Patch the Planet llega con parches, no solo con reportes de bugs

El anuncio que más toca a la comunidad de software libre es Patch the Planet, una iniciativa fundada con Trail of Bits y desarrollada en colaboración con HackerOne y Calif. La idea: financiar a investigadores de seguridad expertos, equiparlos con Codex Security y los modelos avanzados de OpenAI, y ponerlos a trabajar codo a codo con los mantenedores de proyectos abiertos.

black flat screen computer monitor
Photo by Jake Walker / Unsplash

El problema que intenta resolver es viejo. Una falla en una librería de red muy usada puede arrastrar a miles de sistemas que dependen de ella, y muchos de esos proyectos los sostienen equipos diminutos. Una investigación de la Linux Foundation y Harvard citada por OpenAI encontró que el 94% de los proyectos muy usados que estudió tenía menos de diez desarrolladores responsables de más del 90% del código sumado en un año. Por eso la avalancha de hallazgos que produce una IA puede volverse una carga: más reportes, muchos de ellos falsos positivos, y los mismos mantenedores sin tiempo extra para atenderlos. Patch the Planet se apoya en revisión humana que valida y deduplica vulnerabilidades y parches antes de que lleguen al mantenedor. Los proyectos participantes reciben ChatGPT Pro, acceso condicionado a Codex Security y créditos de API.

Trail of Bits publicó los números de la primera semana del sprint, que cubrió 19 proyectos entre criptografía, redes, infraestructura de lenguajes y cadena de suministro de software —entre ellos cURL, Go, Python y python.org, PyPI, urllib3, aiohttp, Sigstore, RustCrypto y Valkey:

  • Cientos de bugs descubiertos.
  • 64 pull requests abiertos y 51 reportes (issues) presentados.
  • 37 parches ya fusionados, con muchos más en camino.
  • Más de 30 proyectos comprometidos a sumarse, con lista de espera.

Algunos casos dan la medida del cambio de ritmo. En aiohttp, los mantenedores escribieron y fusionaron ocho correcciones en cuestión de horas, siete de ellas dentro de una misma ventana de cinco horas. En otro proyecto, según Trail of Bits, GPT-5.5-Cyber montó por su cuenta un laboratorio de fuzzing completo en menos de un día —algo que a un experto humano le habría tomado de dos a tres semanas— y, más importante, mostró criterio para decidir qué probar y qué reportar.

El acceso se reparte por socios y gobiernos, no a cualquiera

Junto a la iniciativa abierta, OpenAI lanzó el Daybreak Cyber Partner Program, que permite a proveedores de seguridad usar GPT-5.5 con Trusted Access for Cyber dentro de los productos y servicios que ofrecen a sus clientes. Hasta ahora, las organizaciones aprobadas usaban los modelos cyber sobre todo en sistemas propios o que estaban autorizadas a probar; el programa extiende ese alcance, pero deja el acceso directo al modelo en manos de los socios. Entre ellos figuran nombres como CrowdStrike, Cloudflare, Cisco, Palo Alto Networks e IBM.

La empresa también dice haber establecido en el último mes acuerdos de Trusted Access for Cyber con Australia, Canadá, Francia, Alemania, Japón, Corea del Sur e instituciones de la Unión Europea como ENISA, además de una colaboración con el Reino Unido. Afirma trabajar con operadores de infraestructura crítica y redes de gobierno, y mantener diálogo con agencias estadounidenses —el CAISI, la Oficina del Director Nacional Cibernético y la de Política Científica y Tecnológica— en torno a la evaluación previa de sus modelos y a la implementación de la reciente orden ejecutiva sobre innovación y seguridad en IA.

Por qué el momento favorece a OpenAI: Anthropic sigue en pausa

El telón de fondo explica buena parte del timing. El 12 de junio, el Departamento de Comercio de Estados Unidos emitió una orden de control de exportaciones que suspendió el acceso a Mythos 5 y Fable 5 de Anthropic para cualquier ciudadano extranjero, citando motivos de seguridad nacional. Para cumplir, Anthropic deshabilitó ambos modelos para todos sus clientes en el mundo. Mythos había debutado en abril como una herramienta tan potente para hallar vulnerabilidades que la empresa limitó su acceso a un grupo reducido de organizaciones; Fable era la versión pública con salvaguardas estrictas en biología, química y ciberseguridad.

Anthropic dijo no haber recibido detalles concretos de la preocupación del gobierno y discrepó de la medida, al sostener que un posible "jailbreak" acotado no justifica retirar un modelo comercial. Del otro lado, el asesor de la Casa Blanca David Sacks señaló que la administración espera que Anthropic corrija el problema de seguridad para levantar el control cuanto antes. En medio, 54 profesionales de ciberseguridad —entre ellos Alex Stamos, Bruce Schneier y Andy Jassy, director ejecutivo de Amazon— firmaron una carta abierta pidiendo revertir la restricción.

El argumento de los firmantes engancha justo con la tesis de OpenAI. La experta Katie Moussouris sostuvo que pedirle a un modelo que arregle el código, explique por qué importa el parche y escriba pruebas que lo confirmen no es burlar una salvaguarda, sino lo más valioso que una IA puede hacer por la defensa: ejecutar el ciclo de encontrar, arreglar y verificar que los defensores corren todos los días. La carta agrega que esas mismas capacidades pueden replicarse en otros modelos, incluido el propio GPT-5.5 de OpenAI.

Con Anthropic en pausa y la mira puesta en parchear más que en encontrar, OpenAI mueve ficha para quedarse con un terreno que su rival abrió. La pregunta sigue abierta: las mismas capacidades que ayudan a un defensor a cerrar un hueco sirven, en otras manos, para encontrarlo primero. Por ahora, los proyectos de código abierto que sostienen media internet —y que se usan a diario en bancos, comercios y dependencias de gobierno de toda la región hispanohablante— ganan un puñado de parches que de otro modo habrían tardado meses.

Fuentes: 1, 2, 3

Dilis Salazar imagen de perfil
por Dilis Salazar

Leer más de Tecnología y Ciencia