GPT-5.4: OpenAI lanza su primer modelo con control nativo de computador, 1M de contexto y plugins para Excel

Share

OpenAI acaba de lanzar GPT-5.4, apenas dos días después de GPT-5.3 Instant. No es un update menor: es el primer modelo de OpenAI con uso nativo de computador, ventana de contexto de 1 millón de tokens en la API, y una reducción de hasta 47% en consumo de tokens. Viene en dos versiones: GPT-5.4 Thinking (para suscriptores Plus en adelante) y GPT-5.4 Pro (solo Pro y Enterprise).

El ritmo de lanzamientos de OpenAI ya no es agresivo — es frenético. Y esta vez, la noticia no es solo “el modelo es mejor”, sino que cambia fundamentalmente lo que puede hacer.

¿Qué puede hacer GPT-5.4 que no podía antes?

Lo más disruptivo: Computer Use nativo. GPT-5.4 puede operar tu computador como un humano — navegar la web, mover el mouse, escribir en aplicaciones, trabajar en múltiples programas a la vez. No es un demo experimental como el que mostró Anthropic con Claude: viene integrado directamente en la API y en Codex.

Los benchmarks lo respaldan:

OSWorld-Verified: 75% de éxito en navegación de escritorio, contra 47.3% de GPT-5.2. El rendimiento humano reportado es 72.4% — GPT-5.4 lo supera.
BrowseComp: mejora de 17% absoluto en navegación web persistente. GPT-5.4 Pro alcanza 89.3%, nuevo estado del arte.
WebArena-Verified: 67.3% en interacción web compleja.

Además, OpenAI introdujo plugins nativos para Excel y Google Sheets — GPT-5.4 puede trabajar directamente dentro de celdas, haciendo análisis financiero y automatizando tareas. Si suena familiar, es porque Codex ya apuntaba en esa dirección con Artifacts para Excel y PowerPoint.

Tool Search: la API se vuelve más inteligente (y más barata)

Un cambio técnico que importa más de lo que parece: Tool Search. Hasta ahora, cada llamada a la API incluía las definiciones de todas las herramientas disponibles en el prompt — un desperdicio enorme cuando tienes docenas de tools conectados.

GPT-5.4 cambia el enfoque: recibe una lista liviana de herramientas y busca las definiciones completas solo cuando las necesita. En pruebas con 36 servidores MCP, esto redujo el consumo de tokens en un 47% manteniendo la misma precisión. Para cualquier desarrollador construyendo agentes, esto es dinero directo ahorrado.

Menos errores, más eficiencia

OpenAI reporta que GPT-5.4 es 33% menos propenso a errores factuales por claim individual comparado con GPT-5.2, y las respuestas completas tienen 18% menos probabilidad de contener errores. Continúa la línea de GPT-5.3 Instant que ya había reducido alucinaciones.

También hay mejoras en la cadena de pensamiento: una nueva evaluación de seguridad muestra que GPT-5.4 Thinking es menos propenso a “engañar” en su razonamiento — algo que investigadores de Anthropic ya habían demostrado que podía ocurrir en modelos de razonamiento.

¿Cuánto cuesta y quién puede usarlo?

GPT-5.4 Thinking: disponible para ChatGPT Plus ($20/mes), Team y Enterprise. También en la API.
GPT-5.4 Pro: solo ChatGPT Pro ($200/mes) y Enterprise. API a $30/$180 por millón de tokens input/output — el modelo más caro de OpenAI hasta la fecha.
ChatGPT Free: acceso limitado cuando el auto-routing selecciona GPT-5.4.
Contexto: hasta 1M tokens en API y Codex. Costo se duplica sobre 272K tokens.
GPT-5.2 Thinking: seguirá disponible hasta junio.

Por qué importa

GPT-5.4 no es solo “más inteligente” — es un modelo diseñado para trabajar, no solo para conversar. El Computer Use nativo, los plugins de Excel/Sheets y Tool Search apuntan todos a la misma dirección: agentes que ejecutan tareas completas en tu computador, con múltiples herramientas, durante períodos largos.

El mensaje competitivo es claro. Anthropic lanzó Claude Computer Use como preview experimental; OpenAI lo lanza como feature de producción. Google tiene Gemini con contexto de 2M tokens; OpenAI responde con 1M pero optimizado para ser más barato. La carrera ya no es por quién tiene el modelo “más inteligente” — es por quién construye el mejor agente de trabajo.

Para usuarios de ChatGPT Plus, el upgrade es automático: ya puedes seleccionar GPT-5.4 Thinking en el selector de modelos. Para desarrolladores, las nuevas capacidades de Computer Use y Tool Search abren posibilidades que hasta hace una semana eran ciencia ficción.

Fuentes

Rodrigo Rojo http://descubre.ai

Tabla de contenidos [hide]

¿Qué puede hacer GPT-5.4 que no podía antes?
Tool Search: la API se vuelve más inteligente (y más barata)
Menos errores, más eficiencia
¿Cuánto cuesta y quién puede usarlo?
Por qué importa
Fuentes

GPT-5.4: OpenAI lanza su primer modelo con control nativo de computador, 1M de contexto y plugins para Excel

¿Qué puede hacer GPT-5.4 que no podía antes?

Tool Search: la API se vuelve más inteligente (y más barata)

Menos errores, más eficiencia

¿Cuánto cuesta y quién puede usarlo?

Por qué importa

Fuentes

Tabla de contenidos [hide]

Lio recauda $30M de a16z para reemplazar equipos de compras con agentes de IA

1.000 llamadas a clientes antes de pedir dinero: la estrategia de Narada para construir IA empresarial que funciona

Nvidia frena sus inversiones en OpenAI y Anthropic — y la razón oficial no convence a nadie

Es La Hora de Aprender #3: LatamGPT, IA militar y el futuro del empleo

OpenAI Codex llega a Windows y anuncia Artifacts: el agente de código que quiere hacer tu trabajo completo

Otras noticias

Lio recauda $30M de a16z para reemplazar equipos de compras con agentes de IA

1.000 llamadas a clientes antes de pedir dinero: la estrategia de Narada para construir IA empresarial que funciona

Nvidia frena sus inversiones en OpenAI y Anthropic — y la razón oficial no convence a nadie

Es La Hora de Aprender #3: LatamGPT, IA militar y el futuro del empleo

Lio recauda $30M de a16z para reemplazar equipos de compras con agentes de IA

1.000 llamadas a clientes antes de pedir dinero: la estrategia de Narada para construir IA empresarial que funciona

Nvidia frena sus inversiones en OpenAI y Anthropic — y la razón oficial no convence a nadie