Terminal Use (YC W26): el Vercel para agentes de IA que necesitan trabajar con archivos

Share

Desplegar un agente de IA que necesita leer y escribir archivos en producción sigue siendo un caos de ingeniería: empaquetado, sandboxing, streaming, persistencia de estado, gestión de almacenamiento. Terminal Use, recién salido del batch W26 de Y Combinator, promete resolver todo eso con una plataforma de hosting especializada en agentes basados en sistemas de archivos. El nombre que usan ellos mismos: “el Vercel para filesystem-based agents.”

La comparación es exacta. Así como Vercel abstrajo el despliegue de aplicaciones web hasta hacerlo trivial, Terminal Use apunta a hacer lo mismo con los agentes de IA que necesitan explorar, leer y modificar archivos como parte de su trabajo.

El problema real: contexto, persistencia y seguridad

Los agentes de IA modernos enfrentan un conjunto de fricciones técnicas recurrentes cuando trabajan con datos estructurados y sistemas de archivos:

  • Límites de contexto: cargar todo el contenido de un proyecto en el prompt del modelo consume ventanas de contexto enormes y dispara los costos.
  • Búsqueda vectorial imprecisa: los embeddings son útiles para búsqueda semántica, pero fallan en consultas que requieren coincidencias exactas como IDs, rutas de archivo o jerarquías CRM.
  • Persistencia entre turnos: cuando el agente necesita recordar qué archivos modificó hace tres pasos, los sistemas actuales no tienen una solución elegante.
  • Seguridad en ejecución: un agente con acceso irrestricto al sistema de producción es un riesgo real. Cada ejecución debería ocurrir en un entorno aislado.

Terminal Use aborda todos estos frentes con un enfoque que coloca el sistema de archivos como la capa de contexto principal del agente.

Cómo funciona: MicroVMs y lazy context loading

El flujo técnico central de Terminal Use funciona así:

  1. El agente recibe una tarea y se despliega en una MicroVM Linux aislada —un entorno efímero que garantiza que no hay acceso al sistema de producción.
  2. En lugar de cargar todo el contexto en el prompt, el agente explora el filesystem con comandos Unix estándar: ls, find, grep, cat.
  3. Solo el fragmento relevante se envía al LLM (Claude, Codex u otro) junto con la tarea específica.
  4. El LLM devuelve una acción estructurada que el agente ejecuta dentro del sandbox.

Este enfoque de lazy context loading —cargar solo lo necesario— reduce drásticamente el consumo de tokens. Según experimentos publicados por el equipo de Vercel, los agentes basados en herramientas de filesystem alcanzan un 63% de precisión en consultas estructuradas, y al combinarse con SQL en un enfoque híbrido, llegan al 100%.

Características de la plataforma

  • Branching de filesystems: el agente puede crear “ramas” del sistema de archivos para probar cambios sin afectar el estado principal, similar a git branches pero para datos.
  • Streaming de logs en tiempo real: el desarrollador puede ver exactamente qué archivos está leyendo el agente y qué comandos ejecuta, lo que resuelve el problema histórico de trazabilidad en debugging de agentes.
  • Persistencia entre sesiones: el estado del filesystem se mantiene entre ejecuciones, permitiendo agentes que retoman tareas largas sin perder contexto.
  • Gestión de storage escalable: la plataforma maneja el ciclo de vida del almacenamiento automáticamente.

Por qué importa ahora

La infraestructura para agentes de IA está en el mismo punto donde estaba la infraestructura para aplicaciones web antes de Vercel, Netlify o Render: técnicamente posible, pero solo para quienes saben lo que hacen. Eso limita quién puede construir agentes útiles en producción.

El batch W26 de YC incluye múltiples startups de infraestructura para agentes, lo que confirma que el mercado lo está viendo como una capa necesaria. Terminal Use no es la única empresa en este espacio —E2B, Modal y Fly.io también ofrecen sandboxing para código— pero el foco específico en filesystems como capa de contexto es diferenciador.

Para founders latinoamericanos que están construyendo productos con agentes de IA —automatización de procesos, análisis de documentos, asistentes con acceso a datos estructurados— este tipo de infraestructura puede eliminar semanas de trabajo de plomería.

Vale la pena revisar también el trabajo que se está haciendo en autonomía práctica de agentes: Anthropic encontró que los agentes más efectivos usan auto-approve de forma selectiva y trabajan en sesiones de hasta 45 minutos. Infraestructura como Terminal Use hace ese tipo de sesiones largas mucho más manejables.


Fuentes

Leer más

Otras noticias