Rhoda AI levanta $450M para entrenar robots con video

Share

Rhoda AI salió del stealth con una apuesta que no suena pequeña: una Serie A de 450 millones de dólares para entrenar robots usando video a gran escala. No estamos hablando de un laboratorio mostrando una demo prolija, sino de una empresa que quiere resolver el problema más difícil de la robótica moderna: hacer que las máquinas funcionen bien cuando el mundo deja de comportarse como una maqueta.

La startup, basada en Palo Alto y liderada por Jagdeep Singh, dice que su sistema no depende sobre todo de teleoperación —es decir, de humanos guiando robots paso a paso con guantes, sensores o trayectorias grabadas— sino de preentrenamiento con cientos de millones de videos. La tesis es brutalmente simple: si internet ya tiene millones de ejemplos de manos, objetos, orientaciones, errores y correcciones, quizás ahí está la diversidad que a la robótica le falta para salir del laboratorio.

¿Qué está construyendo exactamente Rhoda AI?

Rhoda presentó una plataforma llamada FutureVision, descrita como una capa de inteligencia para robots. Según la compañía y los reportes posteriores, su arquitectura usa un enfoque de Direct Video Action: el sistema observa el entorno, predice estados futuros a partir de video y convierte esas predicciones en acciones. Ese ciclo se actualiza cada pocos cientos de milisegundos, lo que en teoría permite reaccionar a cambios reales en vez de repetir una secuencia fija.

Aprende IA con nosotros

Únete gratis a mi comunidad en Skool, donde compartimos noticias, tutoriales y recursos para seguir aprendiendo juntos.

👥 Únete gratis 🚀

Ese detalle importa más de lo que parece. Gran parte de la automatización industrial funciona bien cuando todo está ordenado, repetible y milimétrico. El problema empieza cuando cambian la posición de una pieza, la iluminación, la orientación de un objeto o el ritmo del flujo de trabajo. Ahí es donde muchas soluciones robóticas todavía se quiebran. Por eso en descubre.ai ya hemos seguido avances como Ai2 y su apuesta por llevar robots desde simulación al mundo real y también el auge de la IA física aplicada a fábricas.

La gran apuesta: menos demos perfectas, más generalización

La mayoría de startups de robótica promete “generalización”, pero pocas explican de dónde sale. Rhoda dice que la obtiene mezclando una base masiva de video público con cantidades menores de datos específicos del robot. La idea, citada tanto por Tech Funding News como por SiliconANGLE, es que un modelo expuesto a muchísimos ejemplos de movimiento y manipulación humana puede adaptarse mejor cuando algo cambia en producción.

Jagdeep Singh lo resumió con un punto concreto: un sistema entrenado solo con teleoperación puede fallar si cambia la orientación del teléfono, de la cámara o del objeto. Un modelo que ya vio miles de variaciones tendría más probabilidades de aguantar ese cambio. Ese argumento no prueba todavía que la solución esté resuelta, pero sí explica por qué los inversionistas están dispuestos a poner tanto dinero tan temprano.

Financiación gigante: Rhoda anunció una Serie A de 450 millones de dólares, con valoración reportada de 1.700 millones.
Backers pesados: entre los inversionistas aparecen Premji Invest, Khosla Ventures, Temasek, Mayfield, Capricorn Investment Group y John Doerr, según las coberturas revisadas.
Tesis de datos: usar cientos de millones de videos de internet para complementar la escasez de trayectorias robóticas reales.
Objetivo industrial: empezar en entornos de manufactura y, más adelante, licenciar el modelo o incluso construir hardware propio.

¿Por qué levantar tanto capital tan rápido?

Porque la robótica fundacional se está convirtiendo en la próxima guerra seria de la IA. Ya no basta con tener un LLM que redacta texto o un modelo que genera imágenes: ahora la obsesión del mercado es lograr que la inteligencia artificial actúe en el mundo físico. Y eso es bastante más caro. Hace falta computación, datos, pilotos industriales, integración con hardware y mucha paciencia para validar que algo sirve fuera de una demo.

En ese sentido, Rhoda entra en una ola más amplia. Hemos visto señales parecidas en el avance de la robótica industrial conectada a simulación y modelos de IA y en alianzas como Qualcomm + Neura Robotics, donde la tesis ya no es solo automatizar una tarea, sino crear una plataforma que pueda aprender y adaptarse.

La diferencia es que Rhoda está vendiendo una narrativa muy específica: si los modelos fundacionales del texto aprendieron del internet abierto, los robots también podrían hacerlo. Eso suena elegante, pero tiene una trampa. Ver no es lo mismo que tocar. Un video enseña contexto, secuencias y variación, pero no transmite directamente fuerza, fricción, peso o tolerancias mecánicas. El salto desde “entiendo lo que pasa” a “puedo ejecutarlo bien con un brazo robótico” sigue siendo el hueso duro.

Lo más interesante no es la ronda: es dónde dicen que ya funciona

Rhoda afirma haber probado su sistema en un entorno de manufactura de alto volumen y completar un flujo de procesamiento de componentes en menos de dos minutos por ciclo, sin intervención humana. Ese dato hay que leerlo con cuidado: muestra señal, no prueba definitiva. No tenemos todavía un benchmark independiente y público que permita comparar desempeño, tasa de error, costo por tarea o resiliencia frente a condiciones extremas.

Pero incluso con esa cautela, el anuncio sí marca algo importante: la conversación de robótica está dejando atrás la fascinación por el “robot que parece humano” para enfocarse en sistemas que generen retorno real en operaciones. En otras palabras, menos show de feria tecnológica y más obsesión por throughput, variabilidad, uptime y costo total de despliegue.

Por qué importa

Rhoda AI importa porque pone dinero grande sobre una hipótesis que muchos ven venir: la próxima frontera de la IA no es solo pensar o conversar, sino percibir y actuar. Si esa tesis funciona, la ventaja competitiva no estará solo en el hardware ni solo en el modelo, sino en la combinación entre datos del mundo físico, ciclos de aprendizaje y despliegue industrial.

También importa por otra razón: esta ronda muestra que el mercado ya está dispuesto a financiar la robótica como financió antes a los foundation models. El riesgo, claro, es que la narrativa vaya más rápido que la realidad. Ya hemos visto esa película en IA. Pero si Rhoda logra demostrar que los videos de internet realmente ayudan a generalizar tareas industriales con menos datos robóticos, no sería una mejora incremental. Sería un cambio de método.

La pregunta entonces no es si habrá robots más listos. Eso ya viene. La pregunta es quién va a encontrar la receta para que sean útiles en ambientes caóticos, variables y económicamente viables. Rhoda todavía no ganó esa carrera. Pero con 450 millones sobre la mesa, acaba de dejar claro que quiere correrla desde la primera fila.

Fuentes

Rodrigo Rojo http://descubre.ai

Tabla de contenidos [hide]

¿Qué está construyendo exactamente Rhoda AI?
La gran apuesta: menos demos perfectas, más generalización
¿Por qué levantar tanto capital tan rápido?
Lo más interesante no es la ronda: es dónde dicen que ya funciona
Por qué importa
Fuentes

Rhoda AI levanta $450M para entrenar robots con video

¿Qué está construyendo exactamente Rhoda AI?

La gran apuesta: menos demos perfectas, más generalización

¿Por qué levantar tanto capital tan rápido?

Lo más interesante no es la ronda: es dónde dicen que ya funciona

Por qué importa

Fuentes

Tabla de contenidos [hide]

Google lanza Veo 3.1 Lite: la industrialización del video generativo llega a la API de Gemini

MiniMax M2.7: el modelo open source que evoluciona su propio entorno de agentes

NVIDIA entrega a Kubernetes el control directo de las GPU para escalar la IA empresarial

Google despliega su inteligencia personal en Chrome y Search

Google blinda la cadena de suministro de IA con nuevas herramientas de seguridad open source

Otras noticias

Google lanza Veo 3.1 Lite: la industrialización del video generativo llega a la API de Gemini

MiniMax M2.7: el modelo open source que evoluciona su propio entorno de agentes

NVIDIA entrega a Kubernetes el control directo de las GPU para escalar la IA empresarial

Google despliega su inteligencia personal en Chrome y Search

Google lanza Veo 3.1 Lite: la industrialización del video generativo llega a la API de Gemini

MiniMax M2.7: el modelo open source que evoluciona su propio entorno de agentes

NVIDIA entrega a Kubernetes el control directo de las GPU para escalar la IA empresarial