ScaleOps levanta $130M: el desperdicio de GPU que nadie habla

Share

La IA está en boom, pero detrás de escena las empresas están desperdiciando cantidades enormes de cómputo caro. Las GPUs están ociosas. Los workloads están sobre-aprovisionados. Los costos de nube siguen subiendo. ScaleOps tiene una tesis simple para este problema: no es escasez — es mala gestión.

La startup neoyorquina, fundada en 2022, levantó $130 millones en una Serie C liderada por Insight Partners a una valoración de $800 millones. Lightspeed Venture Partners, NFX, Glilot Capital Partners, y Picture Capital también participaron. El total acumulado de la compañía llega a ~$210 millones. Su plataforma promete reducir los costos de infraestructura cloud y de IA hasta un 80% mediante gestión autónoma y en tiempo real de recursos computacionales.

El problema de Kubernetes que nadie resolvió bien

Kubernetes (K8s) es el orquestador de contenedores dominante — la capa que coordina cómo los workloads se distribuyen sobre clusters de servidores. El problema es que Kubernetes fue diseñado para ser altamente configurable, lo que en la práctica significa que depende de configuraciones estáticas que los equipos definen manualmente. Las aplicaciones modernas de IA son dinámicas: la demanda cambia constantemente, los patrones de inferencia varían, los workloads de entrenamiento tienen peaks imprevisibles. Esa brecha entre configuración estática y demanda dinámica es donde se desperdicia el dinero.

Aprende IA con nosotros

Únete gratis a mi comunidad en Skool, donde compartimos noticias, tutoriales y recursos para seguir aprendiendo juntos.

👥 Únete gratis 🚀

Yodar Shafrir, CEO y co-fundador de ScaleOps, llegó a este problema desde adentro. Antes de fundar ScaleOps, fue ingeniero en Run:ai — la startup de orquestación de GPUs que Nvidia adquirió en 2024. “Cuando amplié la vista, me di cuenta de que el problema no eran solo las GPUs. Se extendía al cómputo, memoria, almacenamiento y red. Los mismos patrones se repetían constantemente: los equipos fallaban en gestionar los recursos eficientemente,” explicó a TechCrunch.

La mayoría de las herramientas existentes en el espacio ofrecen visibilidad del problema — te dicen cuánto está costando cada workload — pero no lo resuelven. ScaleOps apuesta a la autonomía completa: su plataforma conecta las necesidades de las aplicaciones con las decisiones de infraestructura en tiempo real y gestiona el stack de extremo a extremo, sin intervención manual.

450% de crecimiento y clientes que no son pequeños

Los números que reporta ScaleOps son llamativos: más de 450% de crecimiento año sobre año, triplicación del headcount en los últimos 12 meses, y planes de volver a triplicarlo para fin de año. Sus clientes incluyen Adobe, Wiz, DocuSign, Salesforce, y Coupa — un mix de empresas grandes con infraestructura Kubernetes compleja, exactamente el tipo de cliente que sufre más con la ineficiencia computacional.

La Serie C llega menos de 18 meses después de su Serie B de $58 millones en noviembre de 2024. Ese ritmo de ronda a ronda refleja que la demanda del mercado está validando la tesis más rápido de lo esperado. El timing tiene sentido: 2024-2026 es el período en que la mayoría de las empresas enterprise pasaron de experimentar con IA a desplegarla en producción a escala — y es exactamente cuando los problemas de infraestructura que ScaleOps resuelve se vuelven costosos y urgentes.

El mercado de optimización de K8s: ya hay competencia

ScaleOps no es la única apuesta en este espacio. Cast AI levantó $108M en abril de 2025 con un enfoque similar. Kubecost fue adquirida por IBM en septiembre de 2024. Spot (antes Spotinst) fue adquirida por NetApp. El hecho de que varias de las soluciones anteriores hayan terminado siendo adquiridas por grandes jugadores —IBM, NetApp, Nvidia— dice algo sobre la dirección del mercado: este tipo de infraestructura se vuelve estratégica lo suficientemente rápido como para que los hyperscalers y plataformas quieran tenerla internalizada.

La diferenciación que ScaleOps afirma frente a competidores es la autonomía con contexto. Según Shafrir: “Muchas compañías introdujeron herramientas de automatización, pero operan sin contexto completo, lo que puede causar problemas de performance e incluso downtime.” La plataforma de ScaleOps fue construida desde cero para entornos de producción: es autónoma, consciente del contexto de cada aplicación, y funciona out of the box sin configuración manual. Si eso se sostiene a escala, es una diferencia real — el downtime causado por reoptimizaciones automáticas es el miedo principal de los equipos que evalúan estas herramientas.

Por qué la ineficiencia computacional es el problema menos hablado de la IA

Hay una narrativa dominante sobre la IA y los costos de infraestructura: que el problema es la escasez de GPUs, que los chips son caros, que los data centers no se construyen suficientemente rápido. Esa narrativa es parcialmente correcta — pero oculta que una parte significativa del problema es que las GPUs que ya existen no se usan bien.

Investigaciones del sector estiman que entre el 30% y el 60% de la capacidad computacional en clusters enterprise típicamente está ociosa o mal utilizada en cualquier momento dado. Para una empresa que gasta $10 millones al año en infraestructura cloud, eso es entre $3 y $6 millones desperdiciados. A escala de la industria completa, el número es astronómico.

La solución no es solo comprar más GPUs o migrar a un hyperscaler más barato — es gestionar mejor lo que ya tienes. Eso es exactamente el mercado que ScaleOps está capturando, y el timing con el que lo hace es estratégico: las empresas están en el momento de máxima presión para justificar sus gastos de IA ante sus boards y CFOs. “Reducimos hasta 80% los costos de infraestructura” es un mensaje que funciona muy bien en ese contexto.

Lo que esto significa para equipos de ingeniería fuera de Silicon Valley

Para startups y equipos tech en LATAM que corren sobre Kubernetes, el mensaje de ScaleOps tiene relevancia práctica inmediata. Los costos de cloud son uno de los mayores problemas de unit economics para startups en crecimiento — y la mayoría no tiene los equipos de infraestructura dedicados que tienen los grandes corporativos americanos para optimizar manualmente sus clusters.

Herramientas como ScaleOps apuntan a democratizar algo que antes requería un equipo de SREs dedicados: la gestión inteligente de recursos. Goldman Sachs señaló que la IA todavía no se refleja en productividad agregada — parte de esa paradoja se explica por el desperdicio de infraestructura que ScaleOps mide directamente.

Para los equipos que están construyendo con IA en producción, la ecuación es simple: cada dólar que no se gasta en infraestructura desperdiciada es un dólar que puede ir a producto, a clientes, o a runway. La capa de optimización de infraestructura está creciendo hacia un mercado real, y los $130M de ScaleOps son la señal más clara de que el capital institucional ya lo ve así. Al igual que Qodo con la verificación de código, ScaleOps está apostando a que la capa de gobernanza y optimización sobre la IA generativa es donde se crea el próximo valor diferenciado.


Fuentes

Leer más

Otras noticias