Deccan AI levanta $25M: India como hub de entrenamiento de IA de élite

Share

Si los grandes modelos de IA son el producto final, el post-entrenamiento es la línea de ensamblado que pocos ven. Y esa línea, en gran medida, depende de equipos humanos altamente calificados que generan datos, evalúan respuestas y construyen entornos de aprendizaje por refuerzo. Deccan AI acaba de levantar 25 millones de dólares para demostrar que India puede hacer ese trabajo mejor que nadie — apostando a la calidad sobre la escala geográfica.

La ronda Serie A fue liderada por A91 Partners, con participación de Susquehanna International Group y Prosus Ventures. La startup, fundada en octubre de 2024 con sede en San Francisco y operaciones en Hyderabad, ya trabaja con clientes como Google DeepMind y Snowflake.

¿Qué hace exactamente una empresa de post-entrenamiento?

Los modelos de lenguaje se construyen en dos grandes etapas. El preentrenamiento —alimentar el modelo con cantidades masivas de texto— lo hacen los propios labs con hardware propio. Pero el post-entrenamiento es distinto: implica que humanos calificados generen ejemplos de código, evalúen razonamientos, construyan entornos de reinforcement learning y validen que el modelo se comporte bien en contextos del mundo real.

Aprende IA con nosotros

Únete gratis a mi comunidad en Skool, donde compartimos noticias, tutoriales y recursos para seguir aprendiendo juntos.

👥 Únete gratis 🚀

Eso incluye tareas como ayudar a un modelo a interactuar correctamente con APIs externas, mejorar sus capacidades de agente autónomo, o evaluar respuestas en dominios técnicos como geoespacial o diseño de semiconductores. Es trabajo que requiere gente que sabe de lo que habla.

Deccan ofrece eso a través de dos productos propios —Helix, su suite de evaluación, y una plataforma de automatización de operaciones— más servicios directos a labs. Tiene unos 125 empleados y una red de más de un millón de contribuidores, de los cuales entre 5.000 y 10.000 están activos en cualquier mes típico.

El movimiento estratégico: calidad concentrada vs. escala global

Sus competidores más directos —Scale AI (ahora parte de Meta), Surge AI, Turing y Mercor— operan en cientos de países. Deccan tomó el camino opuesto: concentrar la mayoría de sus contribuidores en India, con el argumento de que es más fácil mantener calidad cuando las operaciones están localizadas.

El fundador Rukesh Reddy lo dice sin rodeos: “Muchos competidores van a más de 100 países a buscar expertos. Si operas en un solo país, es mucho más fácil mantener calidad.”

Eso tiene sentido operativo. Gestionar la consistencia a través de muchos mercados, idiomas y contextos culturales es notoriamente difícil. India ofrece algo particular: una base masiva de ingenieros, PhDs y expertos técnicos que hablan inglés con fluidez y han desarrollado habilidades que son exactamente lo que el post-entrenamiento necesita. Alrededor del 10% del total de contribuidores de Deccan tiene posgrado o doctorado, porcentaje que sube entre los más activos según las necesidades del proyecto.

Por qué el post-entrenamiento se volvió tan importante (y tan difícil)

A medida que los modelos mejoran, el estándar de lo que se considera “buen comportamiento” también sube. Reddy lo resume así: la tolerancia a errores en el post-entrenamiento “está cerca de cero” porque cualquier falla impacta directamente el modelo en producción.

Eso contrasta con etapas anteriores del pipeline, donde los errores se promedian en cantidades masivas de datos. El post-entrenamiento es quirúrgico: necesitas que alguien que entienda de verdad el dominio —medicina, derecho, código, finanzas— genere el ejemplo correcto, evalúe la respuesta correcta, y lo haga rápido. Los labs a veces piden grandes volúmenes de datos de alta calidad en días, no semanas.

Y el mercado sigue creciendo. Los modelos ya no son solo de texto: Deccan está expandiendo su trabajo hacia “world models” que entienden entornos físicos, incluyendo robótica y visión computacional. Eso abre un nuevo frente de demanda que requiere contribuidores con conocimiento técnico aún más especializado.

El fenómeno no es nuevo. Ya en artículos anteriores aquí hemos rastreado cómo profesionales de cuello blanco —abogados, científicos, periodistas— se han convertido en la fuerza laboral que entrena a los modelos que amenazan sus propias carreras. Deccan formaliza y escala esa dinámica con foco en el mercado indio.

India en la cadena de valor global de la IA

El posicionamiento de Deccan revela algo sobre el lugar que ocupa India en el ecosistema actual de IA. No como desarrollador de modelos frontier —eso sigue concentrado en un puñado de empresas estadounidenses y algunas chinas— sino como proveedor de talento y datos de entrenamiento.

Es un rol real y relevante, pero también tiene sus limitaciones. El 80% de los ingresos de Deccan provienen de sus cinco clientes principales, reflejo de la alta concentración del mercado frontier. Quien pierda un contrato con Google DeepMind o Anthropic siente el golpe inmediatamente.

Eso también plantea una pregunta estructural: ¿hasta qué punto puede India escalar dentro de esta cadena antes de que los labs automaticen más del post-entrenamiento con los propios modelos? Ya existen experimentos en esa dirección. Deccan, como sus competidores, apuesta a que la complejidad creciente de los modelos seguirá requiriendo inteligencia humana especializada por un buen tiempo más.

Los números por ahora dan la razón: la startup creció 10x el año pasado y está en un run rate de ingresos de doble dígito en millones, sin haber divulgado cifras exactas.

Por qué importa

Deccan AI no es una historia sobre Silicon Valley encontrando mano de obra barata. Es sobre algo más interesante: cómo se está organizando globalmente el trabajo de construir IA. Los labs más importantes del mundo ya no pueden hacer todo internamente — el post-entrenamiento de calidad requiere escala, especialización y velocidad que es difícil mantener solo con empleados propios.

Lo que hace Deccan —concentrar en India en vez de distribuir en 100 países— es una apuesta diferenciadora. Si funciona, podría establecer un modelo para cómo se estructuran los proveedores de datos en la próxima fase de la carrera de IA: no como plataformas de crowdsourcing global, sino como operaciones de alta precisión en mercados con densidad de talento técnico.

El post-entrenamiento no suele salir en los titulares. Pero es ahí donde se define si un modelo que suena impresionante en un demo realmente funciona cuando lo usan personas reales para cosas reales. Eso vale 25 millones de dólares, y probablemente vale mucho más.

Fuentes

Rodrigo Rojo http://descubre.ai

Tabla de contenidos [hide]

¿Qué hace exactamente una empresa de post-entrenamiento?
El movimiento estratégico: calidad concentrada vs. escala global
Por qué el post-entrenamiento se volvió tan importante (y tan difícil)
India en la cadena de valor global de la IA
Por qué importa
Fuentes

Deccan AI levanta $25M: India como hub de entrenamiento de IA de élite

¿Qué hace exactamente una empresa de post-entrenamiento?

El movimiento estratégico: calidad concentrada vs. escala global

Por qué el post-entrenamiento se volvió tan importante (y tan difícil)

India en la cadena de valor global de la IA

Por qué importa

Fuentes

Tabla de contenidos [hide]

Google lanza Veo 3.1 Lite: la industrialización del video generativo llega a la API de Gemini

MiniMax M2.7: el modelo open source que evoluciona su propio entorno de agentes

NVIDIA entrega a Kubernetes el control directo de las GPU para escalar la IA empresarial

Google despliega su inteligencia personal en Chrome y Search

Google blinda la cadena de suministro de IA con nuevas herramientas de seguridad open source

Otras noticias

Google lanza Veo 3.1 Lite: la industrialización del video generativo llega a la API de Gemini

MiniMax M2.7: el modelo open source que evoluciona su propio entorno de agentes

NVIDIA entrega a Kubernetes el control directo de las GPU para escalar la IA empresarial

Google despliega su inteligencia personal en Chrome y Search

Google lanza Veo 3.1 Lite: la industrialización del video generativo llega a la API de Gemini

MiniMax M2.7: el modelo open source que evoluciona su propio entorno de agentes

NVIDIA entrega a Kubernetes el control directo de las GPU para escalar la IA empresarial