Modelos
MiniMax M2.7: el modelo open source que evoluciona su propio entorno de agentes
MiniMax ha lanzado M2.7, un modelo de lenguaje de código abierto diseñado específicamente para agentes. Superando benchmarks críticos como SWE-Pro y Terminal Bench 2, el modelo introduce un enfoque de 'autoevolución' para optimizar su propio flujo de trabajo.
Modelos
Gemini 3.1 Flash Live: Google optimiza la latencia para una interacción de voz natural
Google lanza Gemini 3.1 Flash Live para habilitar asistentes de voz con respuesta instantánea y mayor confiabilidad en flujos de audio continuos.
Modelos
Gemini 3.1 Flash Live: Google acelera la latencia para la interacción de voz natural
Google despliega Gemini 3.1 Flash Live, una versión optimizada para respuestas de audio instantáneas, marcando un paso decisivo hacia agentes de voz verdaderamente fluidos.
Modelos
NVIDIA optimiza Gemma 4 para hardware local: el camino hacia agentes sin latencia
NVIDIA ha anunciado optimizaciones críticas para la familia de modelos Gemma 4 de Google, permitiendo una ejecución local eficiente que reduce la dependencia de la nube para tareas de agentes autónomos.
Modelos
Veo 3.1 Lite: Google DeepMind prioriza el costo y la latencia en la generación de video profesional
Google DeepMind ha lanzado Veo 3.1 Lite, una versión optimizada de su modelo de generación de video diseñada para reducir barreras de entrada mediante menores costos y latencia, disponible ya a través de la API de Gemini.
Modelos
Gemini 3.1 Flash-Lite: Google DeepMind optimiza la latencia para una inferencia a escala
Google DeepMind presenta Gemini 3.1 Flash-Lite, su modelo más rápido y eficiente hasta la fecha, diseñado para aplicaciones de alta demanda donde la latencia y el costo por token son críticos.
Modelos
Arcee AI apuesta la mitad de su capital en un modelo de razonamiento abierto para agentes
Arcee AI ha destinado aproximadamente la mitad de su capital de riesgo para entrenar Trinity-Large-Thinking, un modelo de razonamiento abierto diseñado para competir con Claude Opus en tareas de automatización avanzada.
Modelos
De la auto-mejora al entrenamiento distribuido: por qué la visión computacional sigue siendo el jefe final
Mientras los LLM comienzan a entrenar a otros modelos, cerrando un ciclo de auto-mejora técnica, la visión computacional se mantiene como un reto más complejo que el texto generativo debido a la naturaleza continua y multidimensional de los datos visuales.
Modelos
Nano Banana 2: Google DeepMind acelera la generación de imágenes profesional con un enfoque en eficiencia operativa
Google DeepMind lanza Nano Banana 2, un modelo de generación de imágenes que prioriza la velocidad 'Flash' sin sacrificar capacidades de grado profesional o consistencia en los sujetos.
