OpenAI acaba de lanzar GPT-5.4, apenas dos días después de GPT-5.3 Instant. No es un update menor: es el primer modelo de OpenAI con uso nativo de computador, ventana de contexto de 1 millón de tokens en la API, y una reducción de hasta 47% en consumo de tokens. Viene en dos versiones: GPT-5.4 Thinking (para suscriptores Plus en adelante) y GPT-5.4 Pro (solo Pro y Enterprise).
El ritmo de lanzamientos de OpenAI ya no es agresivo — es frenético. Y esta vez, la noticia no es solo “el modelo es mejor”, sino que cambia fundamentalmente lo que puede hacer.
¿Qué puede hacer GPT-5.4 que no podía antes?
Lo más disruptivo: Computer Use nativo. GPT-5.4 puede operar tu computador como un humano — navegar la web, mover el mouse, escribir en aplicaciones, trabajar en múltiples programas a la vez. No es un demo experimental como el que mostró Anthropic con Claude: viene integrado directamente en la API y en Codex.
Los benchmarks lo respaldan:
- OSWorld-Verified: 75% de éxito en navegación de escritorio, contra 47.3% de GPT-5.2. El rendimiento humano reportado es 72.4% — GPT-5.4 lo supera.
- BrowseComp: mejora de 17% absoluto en navegación web persistente. GPT-5.4 Pro alcanza 89.3%, nuevo estado del arte.
- WebArena-Verified: 67.3% en interacción web compleja.
Además, OpenAI introdujo plugins nativos para Excel y Google Sheets — GPT-5.4 puede trabajar directamente dentro de celdas, haciendo análisis financiero y automatizando tareas. Si suena familiar, es porque Codex ya apuntaba en esa dirección con Artifacts para Excel y PowerPoint.
Tool Search: la API se vuelve más inteligente (y más barata)
Un cambio técnico que importa más de lo que parece: Tool Search. Hasta ahora, cada llamada a la API incluía las definiciones de todas las herramientas disponibles en el prompt — un desperdicio enorme cuando tienes docenas de tools conectados.
GPT-5.4 cambia el enfoque: recibe una lista liviana de herramientas y busca las definiciones completas solo cuando las necesita. En pruebas con 36 servidores MCP, esto redujo el consumo de tokens en un 47% manteniendo la misma precisión. Para cualquier desarrollador construyendo agentes, esto es dinero directo ahorrado.
Menos errores, más eficiencia
OpenAI reporta que GPT-5.4 es 33% menos propenso a errores factuales por claim individual comparado con GPT-5.2, y las respuestas completas tienen 18% menos probabilidad de contener errores. Continúa la línea de GPT-5.3 Instant que ya había reducido alucinaciones.
También hay mejoras en la cadena de pensamiento: una nueva evaluación de seguridad muestra que GPT-5.4 Thinking es menos propenso a “engañar” en su razonamiento — algo que investigadores de Anthropic ya habían demostrado que podía ocurrir en modelos de razonamiento.
¿Cuánto cuesta y quién puede usarlo?
- GPT-5.4 Thinking: disponible para ChatGPT Plus ($20/mes), Team y Enterprise. También en la API.
- GPT-5.4 Pro: solo ChatGPT Pro ($200/mes) y Enterprise. API a $30/$180 por millón de tokens input/output — el modelo más caro de OpenAI hasta la fecha.
- ChatGPT Free: acceso limitado cuando el auto-routing selecciona GPT-5.4.
- Contexto: hasta 1M tokens en API y Codex. Costo se duplica sobre 272K tokens.
- GPT-5.2 Thinking: seguirá disponible hasta junio.
Por qué importa
GPT-5.4 no es solo “más inteligente” — es un modelo diseñado para trabajar, no solo para conversar. El Computer Use nativo, los plugins de Excel/Sheets y Tool Search apuntan todos a la misma dirección: agentes que ejecutan tareas completas en tu computador, con múltiples herramientas, durante períodos largos.
El mensaje competitivo es claro. Anthropic lanzó Claude Computer Use como preview experimental; OpenAI lo lanza como feature de producción. Google tiene Gemini con contexto de 2M tokens; OpenAI responde con 1M pero optimizado para ser más barato. La carrera ya no es por quién tiene el modelo “más inteligente” — es por quién construye el mejor agente de trabajo.
Para usuarios de ChatGPT Plus, el upgrade es automático: ya puedes seleccionar GPT-5.4 Thinking en el selector de modelos. Para desarrolladores, las nuevas capacidades de Computer Use y Tool Search abren posibilidades que hasta hace una semana eran ciencia ficción.

