¿Cuánto te costó realmente esa sesión de Claude Code? ¿Por qué leyó el mismo archivo 15 veces seguidas? Argus es una extensión gratuita para VS Code que responde exactamente esas preguntas, convirtiendo las sesiones opacas de tu agente de IA en un desglose interactivo de costos, acciones y rendimiento.
La herramienta fue publicada esta semana en GitHub por el desarrollador yessGlory17 bajo licencia MIT, y llegó a Hacker News como “Show HN” generando interés inmediato entre equipos que usan Claude Code en producción. El dolor era conocido: los agentes de IA son cajas negras que consumen tokens sin darte visibilidad real sobre por qué.
¿Qué hace Argus exactamente?
Argus se instala como extensión en VS Code y lee los logs del directorio .claude local que genera Claude Code al trabajar. Con esa información construye varias vistas de análisis:
- Timeline paso a paso: un desglose cronológico interactivo de cada acción que Claude ejecutó: qué herramientas llamó, qué inputs procesó, en qué orden y con qué resultados. Convierte una sesión en una línea de tiempo navegable, ideal para diagnosticar loops o decisiones inesperadas del agente.
- Análisis de costos por herramienta: muestra qué acciones específicas consumieron más tokens. El autor identificó en sus propias sesiones que las lecturas duplicadas de archivos representan hasta el 40% del costo total, y que cada retry loop cuesta aproximadamente $0.15.
- Métricas de rendimiento: retry loops, lecturas duplicadas innecesarias, presión de contexto (cuando la sesión se acerca al límite) y cache hit ratio, que puede variar entre el 10% y el 80% según cómo estructures tus prompts.
- Visualizaciones con Chart.js: gráficos de uso de tokens, histogramas de caché y diagramas de dependencias entre archivos, todo renderizado dentro de VS Code con un stack moderno: TypeScript, React 19, Chart.js y Vite.
El resultado es lo más cercano a un “time machine debugger” que existe hoy para Claude Code: puedes navegar hacia atrás en la sesión, ver exactamente qué hizo el agente en cada paso y entender dónde se fue el dinero.
Los números que justifican instalarlo ahora mismo
Los datos que compartió el autor en Hacker News son contundentes. En sus propias sesiones encontró que el 40% del costo venía de lecturas de archivos duplicadas: Claude Code leyendo el mismo fichero múltiples veces sin necesidad. Cada retry loop (cuando Claude reintenta una acción fallida) costaba $0.15 en promedio. Y el cache hit ratio mostraba variaciones enormes entre sesiones similares, lo que indica que pequeños cambios en cómo escribes tus prompts tienen impacto real en el gasto.
Para un equipo que usa Claude Code diariamente, esto no es trivia. Si tienes 5 desarrolladores haciendo sesiones de una hora cada uno, el ahorro potencial de eliminar lecturas duplicadas puede ser de cientos de dólares al mes. Argus te da la visibilidad para encontrar ese desperdicio.
Casos de uso reales para startups y equipos técnicos
Hay tres escenarios donde Argus tiene el mayor impacto inmediato:
- Auditoría de costos de IA: si tu equipo usa Claude Code en múltiples proyectos y el gasto se está acumulando sin explicación clara, Argus permite identificar exactamente qué patrones de uso generan el mayor costo. No es necesario cambiar de herramienta, solo cambiar cómo la usas.
- Debugging de flujos fallidos: cuando Claude produce un resultado inesperado o entra en un loop, el diagnóstico tradicional es difícil porque no hay un stack trace claro. El timeline de Argus permite reproducir paso a paso lo que ocurrió y encontrar el punto exacto del problema, algo que antes requería revisar logs a mano.
- Onboarding al desarrollo con IA: para equipos que están integrando agentes de IA por primera vez, ver el desglose de acciones de una sesión real es educativo. Los desarrolladores entienden cómo “piensa” Claude Code y aprenden a darle mejores instrucciones desde el inicio, reduciendo la curva de aprendizaje.
Si ya leíste sobre cómo los roles de ingeniería están cambiando en la era de la IA, Argus es el tipo de herramienta que representa ese cambio: ya no basta con escribir código, también hay que saber gestionar y optimizar agentes que escriben código por ti.
Limitaciones a tener en cuenta
Argus funciona leyendo el directorio .claude con reglas heurísticas sobre un formato que Anthropic no documenta oficialmente. Esto significa dos cosas: primero, que una actualización de Claude Code podría romper la compatibilidad temporalmente. Segundo, que algunas inferencias del análisis son aproximadas, no exactas. Además, solo soporta sesiones locales, no remotas.
Son las limitaciones esperables de un proyecto open source en etapa temprana. No es una herramienta de producción certificada, es una extensión indie que llena un vacío real. El autor es explícito en esto y pide feedback de la comunidad. Dado que el código está disponible en GitHub bajo MIT, los equipos con capacidad técnica pueden adaptarla o contribuir.
Vale la pena mencionar que existe otro proyecto con nombre similar, argus-claude de josstei, que es diferente: ese ejecuta agentes paralelos para revisión de calidad de código y arquitectura. Argus (el que nos ocupa) es exclusivamente para análisis de sesiones.
Por qué importa
El mayor problema de los agentes de IA en producción no es la calidad de los modelos, es la invisibilidad. Cuando algo sale mal o cuesta más de lo esperado, no tienes datos para diagnosticar el problema. Argus resuelve eso para Claude Code con una solución que te instala en 30 segundos.
Esto se conecta con un patrón más amplio: el código que produce IA parece correcto pero no siempre lo es, y la única forma de mejorar sistemáticamente es tener visibilidad sobre lo que hace el agente. Argus es esa visibilidad para el flujo de trabajo, no para el output.
Para equipos que ya tienen Claude Code integrado en su flujo de trabajo, agregar Argus es una decisión obvia: open source, sin costo, fácil de instalar y con potencial de ahorro inmediato. Para los que están evaluando si vale la pena pagar por Claude Code, Argus ofrece exactamente el nivel de transparencia que necesitas para justificar (o cuestionar) el gasto.
En un ecosistema donde Cursor y otros IDEs con agentes están compitiendo por convertirse en el entorno de desarrollo estándar, herramientas como Argus son las que empujan a todo el ecosistema hacia mayor profesionalismo. La caja negra empieza a tener ventanas.

