Modelos

MiniMax M2.7: el modelo open source que evoluciona su propio entorno de agentes

MiniMax ha lanzado M2.7, un modelo de lenguaje de código abierto diseñado específicamente para agentes. Superando benchmarks críticos como SWE-Pro y Terminal Bench 2, el modelo introduce un enfoque de 'autoevolución' para optimizar su propio flujo de trabajo.

Modelos

Gemini 3.1 Flash Live: Google optimiza la latencia para una interacción de voz natural

Google lanza Gemini 3.1 Flash Live para habilitar asistentes de voz con respuesta instantánea y mayor confiabilidad en flujos de audio continuos.

Modelos

Gemini 3.1 Flash Live: Google acelera la latencia para la interacción de voz natural

Google despliega Gemini 3.1 Flash Live, una versión optimizada para respuestas de audio instantáneas, marcando un paso decisivo hacia agentes de voz verdaderamente fluidos.

Modelos

NVIDIA optimiza Gemma 4 para hardware local: el camino hacia agentes sin latencia

NVIDIA ha anunciado optimizaciones críticas para la familia de modelos Gemma 4 de Google, permitiendo una ejecución local eficiente que reduce la dependencia de la nube para tareas de agentes autónomos.

Modelos

Veo 3.1 Lite: Google DeepMind prioriza el costo y la latencia en la generación de video profesional

Google DeepMind ha lanzado Veo 3.1 Lite, una versión optimizada de su modelo de generación de video diseñada para reducir barreras de entrada mediante menores costos y latencia, disponible ya a través de la API de Gemini.

Modelos

Gemini 3.1 Flash-Lite: Google DeepMind optimiza la latencia para una inferencia a escala

Google DeepMind presenta Gemini 3.1 Flash-Lite, su modelo más rápido y eficiente hasta la fecha, diseñado para aplicaciones de alta demanda donde la latencia y el costo por token son críticos.

Modelos

Arcee AI apuesta la mitad de su capital en un modelo de razonamiento abierto para agentes

Arcee AI ha destinado aproximadamente la mitad de su capital de riesgo para entrenar Trinity-Large-Thinking, un modelo de razonamiento abierto diseñado para competir con Claude Opus en tareas de automatización avanzada.

Modelos

De la auto-mejora al entrenamiento distribuido: por qué la visión computacional sigue siendo el jefe final

Mientras los LLM comienzan a entrenar a otros modelos, cerrando un ciclo de auto-mejora técnica, la visión computacional se mantiene como un reto más complejo que el texto generativo debido a la naturaleza continua y multidimensional de los datos visuales.

Modelos

Nano Banana 2: Google DeepMind acelera la generación de imágenes profesional con un enfoque en eficiencia operativa

Google DeepMind lanza Nano Banana 2, un modelo de generación de imágenes que prioriza la velocidad 'Flash' sin sacrificar capacidades de grado profesional o consistencia en los sujetos.

MiniMax M2.7: el modelo open source que evoluciona su propio entorno de agentes

Gemini 3.1 Flash Live: Google optimiza la latencia para una interacción de voz natural

Gemini 3.1 Flash Live: Google acelera la latencia para la interacción de voz natural

NVIDIA optimiza Gemma 4 para hardware local: el camino hacia agentes sin latencia

Veo 3.1 Lite: Google DeepMind prioriza el costo y la latencia en la generación de video profesional

Gemini 3.1 Flash-Lite: Google DeepMind optimiza la latencia para una inferencia a escala

Arcee AI apuesta la mitad de su capital en un modelo de razonamiento abierto para agentes

De la auto-mejora al entrenamiento distribuido: por qué la visión computacional sigue siendo el jefe final

Nano Banana 2: Google DeepMind acelera la generación de imágenes profesional con un enfoque en eficiencia operativa

Google lanza Veo 3.1 Lite: la industrialización del video generativo llega a la API de Gemini

MiniMax M2.7: el modelo open source que evoluciona su propio entorno de agentes

NVIDIA entrega a Kubernetes el control directo de las GPU para escalar la IA empresarial