Los chips bloqueados crearon el rival más difícil: tokens chinos 50x más baratos

Share

EE.UU. bloqueó los chips de IA más avanzados de NVIDIA para que China no pudiera alcanzar a OpenAI y Google. El resultado, dos años después, es el opuesto al esperado: China fabrica tokens de IA más baratos que nadie en el mundo, y los desarrolladores globales los están usando masivamente. En la plataforma OpenRouter, los modelos chinos superaron a los estadounidenses en volumen de uso durante dos meses consecutivos. La razón es simple: MiniMax M2.5 cuesta 0,25 dólares por millón de tokens de entrada. Claude Opus 4.6 cuesta 5 dólares. Veinte veces más caro.

¿Qué es el “token export” y por qué importa ahora?

Cuando usamos energía medimos kilovatios. Cuando usamos IA medimos tokens. Y ahí es donde China está ganando con lo que el analista de HelloChinaTech llama “token export”: sus modelos de IA se pueden consumir desde cualquier parte del mundo sin aranceles, sin restricciones de exportación, y a precios que hacen que las alternativas americanas parezcan de lujo.

Los aranceles y controles de exportación de chips que Washington implementó entre 2023 y 2025 estaban diseñados para frenar el desarrollo de IA en China. Lo que no anticiparon es que la restricción de hardware obligó a las empresas chinas a optimizar sus modelos al extremo. DeepSeek demostró el año pasado que con Mixture of Experts (MoE) y entrenamiento eficiente se pueden conseguir resultados comparables a modelos mucho más costosos. El resultado: China ahora tiene modelos competentes que corren barato porque fueron diseñados para hacerlo, no porque sacrifiquen calidad.

IA para el Resto de Nosotros

La nueva versión de mi curso estrella para aprender a usar la IA de forma práctica, simple y útil en tu día a día. Comienza el 24 de marzo.

→ Inscríbete hoy 🚀

Las cifras que maneja Xataka son reveladoras: modelos como Step 3.5 Flash cuestan 0,10 dólares por millón de tokens —50 veces menos que Claude Opus 4.6— y MiniMax M2.5 o DeepSeek V3.2 superaron en uso a Gemini 3 Flash Preview y los modelos de Anthropic en OpenRouter durante los últimos dos meses.

¿Por qué los tokens chinos son tan baratos?

Hay tres factores que se combinan:

  • Energía industrial más barata: Los costos eléctricos industriales en China son aproximadamente un 40% inferiores a los de EE.UU.
  • Arquitecturas eficientes por necesidad: Sin acceso a los chips Hopper de NVIDIA, los equipos chinos perfeccionaron técnicas como MoE, donde el modelo solo activa los “expertos” necesarios para cada consulta.
  • Los tokens no pagan aranceles: Un móvil o un chip cruzando la frontera sí tributa. Una respuesta de IA viajando por internet, no.

¿Qué cambia esto para quien construye con IA?

La irrupción del “token export” chino es especialmente relevante ahora que los agentes de IA —sistemas que completan tareas de múltiples pasos— están demostrando su utilidad real. Un agente puede consumir miles de tokens por tarea. Si esos tokens cuestan 50 veces menos con un modelo chino que con uno americano, y el resultado es suficientemente bueno para la tarea, la elección económica es obvia.

Hay esfuerzos de EE.UU. para controlar el ecosistema IA más allá de los chips, pero los tokens son mucho más difíciles de regular que el hardware físico. Además, parte del auge de los modelos chinos se debe a que plataformas como Anthropic o Google restringen el uso de sus planes de suscripción para agentes de IA, lo que empuja a los usuarios hacia alternativas sin esas restricciones.

También es relevante el contexto de la aceleración de hardware. La competencia por los modelos baratos no viene solo de China: Google y otros también lanzan modelos de inferencia de bajo costo. Pero China ya lleva ventaja en precio.

Los límites reales del token export chino

La narrativa del triunfo chino tiene matices importantes. La soberanía de datos es una línea roja real: ninguna empresa regulada en Europa, ningún gobierno, y pocas empresas en sectores sensibles van a enviar datos a servidores en China. La latencia también es un problema físico: la distancia hace que las respuestas lleguen más lentas, lo que importa en aplicaciones interactivas.

Queda por ver si Washington acaba aplicando medidas para restringir el acceso a modelos chinos desde EE.UU., como ya hay voces que proponen. Pero incluso si eso ocurriera, el resto del mundo —América Latina, Europa, Asia del Sur— no tiene por qué seguir esa restricción.

Por qué importa

La ironía es casi perfecta: el control de exportación de chips que debía proteger la ventaja tecnológica americana puede haber contribuido a crear el competidor más difícil de combatir. No un rival con mejor hardware, sino uno con modelos más baratos, optimizados a la fuerza por la escasez, y distribuibles de forma prácticamente irrestricta a través de internet. La carrera de IA siempre pareció una carrera de potencia computacional. Ahora también es una guerra de precios.


Fuentes

Leer más

Otras noticias