Anthropic dice que Claude ya escribe 80% de su código y abre el debate sobre IA que se mejora sola
Claude ya firma 80% del código de Anthropic; el foco pasa de programar a verificar la IA.
TL;DR:
Anthropic publicó nuevos datos internos sobre cómo Claude ya acelera el desarrollo de sus propios sistemas de IA.
La compañía asegura que más de 80% del código que integra a su base fue escrito por Claude en mayo de 2026.
El debate ya no es solo si la IA programa mejor, sino quién verifica, dirige y frena a sistemas capaces de construir sucesores más potentes.
Anthropic encendió una alerta seria dentro de la industria de IA: Claude ya no solo ayuda a sus ingenieros a escribir código, sino que participa de forma directa en el desarrollo de los propios sistemas de la compañía. En un nuevo texto del Anthropic Institute, la empresa afirmó que más de 80% del código que hoy se integra a su codebase fue escrito por Claude, y planteó que esa tendencia podría acercar a la industria a la llamada mejora recursiva automática, un escenario donde una IA diseña, prueba y entrena a su propio sucesor.
La mejora recursiva automática es un proceso en el que un sistema de IA mejora su propia arquitectura, herramientas o modelos sucesores con intervención humana cada vez menor.
Anthropic no asegura que el escenario ya exista. Anthropic dice que “no hemos llegado ahí” y que la mejora recursiva “no es inevitable”. Anthropic muestra un punto: la línea entre la “herramienta para programar” y el “sistema que acelera la construcción de IA” avanza rápido.
El dato que más pesa es interno. Según Anthropic, antes del lanzamiento de Claude Code en versión research preview, en febrero de 2025, la proporción de código escrito por Claude estaba en dígitos bajos. Para mayo de 2026, ya superaba el 80%.
Eso no significa que los ingenieros humanos hayan desaparecido. Significa que su trabajo cambió: ahora formulan objetivos, revisan resultados y deciden qué vale la pena construir.
El dato clave no es el 80%, sino el cambio de rol humano
Anthropic asegura que el ingeniero típico de la compañía integró en el segundo trimestre de 2026 alrededor de 8 veces más código por día que en 2024. La empresa reconoce una limitación importante: medir líneas de código no equivale a medir productividad real, porque cantidad no siempre significa calidad.
Aun así, el salto sí muestra un cambio operativo. Claude dejó de ser una caja de sugerencias para convertirse en un agente que puede editar archivos, correr código, probar soluciones y delegar tareas a otros agentes.
Los números que Anthropic presentó dibujan la aceleración:
- Más de 80% del código integrado a la base de Anthropic fue escrito por Claude en mayo de 2026.
- Los ingenieros integraron 8 veces más código por día en el segundo trimestre de 2026 frente a 2024.
- En una encuesta interna de marzo de 2026, 130 empleados de equipos de investigación estimaron una mejora mediana de 4 veces en producción con Mythos Preview.
- En abril de 2026, Claude envió más de 800 fixes que redujeron una clase de errores de API por un factor de 1,000.
- En tareas abiertas de programación, la tasa de éxito de Claude llegó a 76% en mayo de 2026, con un avance de 50 puntos porcentuales en seis meses.
La compañía baja el tono donde debe hacerlo: el aumento de líneas de código “casi seguro” exagera la productividad. Con la advertencia, el mensaje es claro. El cuello de botella pasa de “quién escribe el código” a “quién revisa si el código debe existir”.
“Empecé a apoyarme fuerte en ‘Claudificar’ hace como un año. Ha sido una aventura brutal y ya van unos cinco meses desde la última vez que escribí código yo mismo”.
La cita, atribuida por Anthropic a un empleado de la compañía, resume bien el cambio cultural: el trabajo técnico empieza a parecer menos una tarea de producción directa y más una labor de dirección, auditoría y criterio.
Claude ya no solo programa: también acelera experimentos
El texto de Anthropic habla de dos áreas: ingeniería y investigación. En la ingeniería, la empresa dice que Claude ya puede recibir los problemas sin definir bien y buscar la forma de resolverlos. En la investigación, el progreso es más irregular. Claude puede hacer los experimentos bien planteados, pero todavía tiene lagunas al decidir qué preguntas son importantes.
Ese matiz es central. Una IA que optimiza código no es lo mismo que una IA con buen juicio científico. La primera puede acelerar una empresa; la segunda podría cambiar la velocidad del desarrollo tecnológico.
Anthropic ofrece un ejemplo concreto: cada vez que se lanza un nuevo modelo, el código para entrenar a Claude es probado y optimizado repetidamente utilizando un pequeño modelo de IA. En mayo de 2025, el rendimiento de Claude Opus 4 mejoró aproximadamente tres veces. En abril de 2026, Claude Mythos Preview mejoró casi 52 veces. Según la compañía, un investigador humano experimentado tardaría de 4 a 8 horas en lograr el mismo cuadruple
La señal es fuerte, pero no absoluta. Anthropic todavía reconoce que los humanos mantienen ventaja en “research taste”: elegir problemas, desconfiar de resultados dudosos y abandonar caminos prometedores solo en apariencia.
“La ventaja comparativa de los humanos, por ahora, sigue estando en ver el panorama completo y pensar más allá de los límites de la tarea inmediata”.
La revisión humana ya aparece como el nuevo cuello de botella
Según Axios, Anthropic quiere llamar la atención de los legisladores sobre sus "mejoras automáticas y recursivas" antes de que el debate público se vuelva más urgente. "La industria necesita herramientas para asegurar que la inteligencia artificial trabaje correctamente y de acuerdo con la voluntad humana", dijo Jack Clark, cofundador de Anthropic y coautor del artículo, a la compañía de medios.
Ahí está el punto más delicado. Si Claude puede producir código, revisar código y proponer experimentos a una velocidad superior a la humana, la revisión humana puede quedar rebasada. Anthropic ya lo admite: conforme más código circula dentro de la organización, el code review se convierte en una restricción.
La compañía dijo que antes de implementar los cambios, se llevará a cabo un proceso de auditoría automatizado basado en claudeai para detectar errores, vulnerabilidades y fallas. Mirando hacia atrás, Anthropic estima que con este sistema, aproximadamente un tercio de los errores que causaron problemas con claudeai en el pasado podrían ser detectados antes de su publicación
Eso abre una pregunta incómoda: si una IA escribe el código y otra IA lo revisa, ¿dónde queda la supervisión humana real?
Los tres escenarios que Anthropic pone sobre la mesa
Anthropic plantea tres futuros posibles, sin presentar ninguno como destino inevitable. La diferencia entre ellos está en si la curva de avance se frena, se mantiene o se vuelve autónoma.
- La tendencia se estanca: las capacidades actuales se difunden, pero la IA no logra el juicio necesario para dirigir investigación avanzada por sí sola.
- Los laboratorios siguen ganando eficiencia: la IA automatiza gran parte del trabajo, pero humanos aún definen prioridades y validan resultados.
- La IA logra mejora recursiva completa: los sistemas empiezan a construir sucesores más capaces con intervención humana reducida.
Anthropic considera más probable el segundo escenario: laboratorios cada vez más eficientes, con humanos encargados de dirección y verificación. Pero también advierte que el tercer escenario exigiría mecanismos de control mucho más sólidos.
El texto menciona incluso la posibilidad de una pausa o desaceleración coordinada entre laboratorios de frontera. La empresa dice que una pausa unilateral tendría impacto limitado, porque solo cambiaría quién lidera la carrera. Para que funcionara, tendría que ser verificable y contar con varios actores de distintos países.
Este problema no puede ser ignorado en México y América Latina, ya que su impacto no se limita a Silicon Valley, si las empresas de inteligencia artificial pueden multiplicar las capacidades de los pequeños equipos, este desarrollo abarcará startups locales, bancos, seguros, medios de comunicación, bufetes de abogados, gobiernos e incluso el sector del software empresarial, con un potencial enorme, al mismo tiempo que el riesgo de depender de sistemas que solo pueden ser probados por unos pocos
El anuncio de Anthropics oculta el hecho de que Claude ya tiene la capacidad de crear sucesores, más precisamente, que el trabajo que antes hacía todo el equipo ahora se concentra en un puñado de personas que encabezan una especie de pirámide de agentes. En este cambio, la programación ya no es el foco y el nuevo conflicto es quién sigue teniendo el poder de decidir "qué desarrollar", "qué arreglar" y "qué detener"