La programación es el nuevo tablero de la IA: OpenAI y Anthropic lo han dejado claro con GPT-5.3-Codex y Claude Opus 4.6

2
  • OpenAI y Anthropic lanzan casi a la vez sus modelos más avanzados para programar con IA
  • Las pruebas comparables muestran ventajas distintas según el tipo de tarea técnica

Cuando ChatGPT irrumpió en noviembre de 2022, OpenAI parecía no tener rival. Y, en buena medida, así era. Aquel chatbot, pese a sus errores y limitaciones, inauguró una categoría propia. Sin embargo, en el sector tecnológico las ventajas rara vez son permanentes y, en 2026, la posición de la compañía liderada por Sam Altman dista mucho de la que tenía entonces.

Google ha conseguido atraer al gran público con Nano Banana Pro, mientras Gemini gana terreno de forma sostenida como chatbot de inteligencia artificial. Al mismo tiempo, la cuota de mercado de ChatGPT ha retrocedido de manera apreciable en algunos mercados. Anthropic, por su parte, se ha consolidado como una referencia en ingeniería de software y se ha convertido en una de las herramientas preferidas entre los programadores.

En esta carrera por marcar el ritmo de la IA, este jueves hemos asistido a un movimiento curioso: la llegada casi simultánea de dos modelos centrados en programación, GPT-5.3-Codex y Claude Opus 4.6. La coincidencia no parece casual y refleja hasta qué punto los grandes actores del sector compiten por definir el siguiente paso, en un escenario donde los principales beneficiados somos, una vez más, los usuarios.

Con estos nuevos modelos ya sobre la mesa, la cuestión pasa a ser qué aportan realmente. Sobran las promesas y también empiezan a aparecer benchmarks comparables que ayudan a situarlos. Así que, por tanto, toca mirar con algo más de detalle qué proponen OpenAI y Anthropic para quienes utilizan la IA como herramienta de desarrollo.

GPT-5.3-Codex y Opus 4.6 entran en escena: qué promete cada uno a los desarrolladores

GPT-5.3-Codex se presenta como un modelo enfocado en agentes de programación que busca ampliar el alcance de lo que un desarrollador puede delegar en la IA. OpenAI afirma que combina mejoras en rendimiento de código, razonamiento y conocimiento profesional respecto a generaciones anteriores y que es un 25% más rápido.

Con ese equilibrio, el sistema está orientado a tareas prolongadas que implican investigación, uso de herramientas y ejecución compleja, manteniendo además la posibilidad de intervenir y guiar el proceso en tiempo real sin que se pierda el hilo de trabajo.

Uno de los elementos más llamativos que OpenAI destaca en esta generación es el papel que el propio Codex habría tenido en su desarrollo. El equipo utilizó versiones tempranas del modelo para depurar el entrenamiento, gestionar el despliegue y analizar resultados de pruebas y evaluaciones, un enfoque que aceleró los ciclos de investigación e ingeniería.

Más allá de ese proceso interno, GPT-5.3-Codex también muestra avances en tareas prácticas como la creación autónoma de aplicaciones y juegos web. La compañía ha publicado dos ejemplos que podemos probar ahora mismo pulsando sobre los enlaces: un juego de carreras con ocho mapas y un juego de buceo para explorar arrecifes

El turno de Anthropic llega con Claude Opus 4.6, una actualización que la compañía presenta como una mejora directa en planificación, autonomía y fiabilidad dentro de grandes bases de código. El modelo, afirman, puede sostener tareas agénticas durante más tiempo, revisar y depurar su propio trabajo con mayor precisión.

La idea es que podamos usar esas capacidades en tareas como análisis financieros, investigación documental o creación de presentaciones. A ello se suma una ventana de contexto de hasta un millón de tokens en fase beta, un salto que busca reducir la pérdida de información en procesos largos y reforzar la utilidad del sistema.

Más allá del núcleo del modelo, Anthropic acompaña Opus 4.6 con una serie de cambios orientados a prolongar su utilidad en flujos reales de trabajo. Entre ellos aparecen mecanismos como el llamado “pensamiento adaptativo”, que permite al sistema ajustar automáticamente la profundidad de su razonamiento según el contexto.