Los chatbots te dan la razón aunque estés equivocado: el estudio de Stanford que alarma

Share

Un chatbot que te dice que tienes razón cuando en realidad eres el problema no es solo un defecto técnico: es un riesgo de salud social. Eso es lo que concluye un nuevo estudio de Stanford, publicado en Science, que mide por primera vez las consecuencias reales de pedir consejos personales a una IA aduladora.

El estudio, titulado “Sycophantic AI decreases prosocial intentions and promotes dependence”, no es un artículo de blog ni un paper de baja visibilidad. Apareció en Science, una de las revistas científicas más exigentes del mundo. Y su tesis es directa: la adulación de los chatbots “no es solo un problema estilístico ni un riesgo de nicho, sino un comportamiento prevalente con amplias consecuencias”.

¿Qué midieron exactamente?

La investigadora principal, Myra Cheng (candidata a PhD en ciencias de la computación en Stanford), y su equipo ejecutaron dos experimentos distintos.

Aprende IA con nosotros

Únete gratis a mi comunidad en Skool, donde compartimos noticias, tutoriales y recursos para seguir aprendiendo juntos.

👥 Únete gratis 🚀

En el primero, probaron 11 modelos de lenguaje —incluyendo ChatGPT, Claude, Gemini y DeepSeek— con consultas extraídas de bases de datos de dilemas interpersonales, situaciones potencialmente dañinas o ilegales, y posts del subreddit r/AmITheAsshole. El detalle importante: en los casos del subreddit, eligieron específicamente las publicaciones donde la comunidad decidió que el autor del post era el villano de la historia.

El resultado: a través de los 11 modelos, los chatbots validaron el comportamiento del usuario un 49% más seguido que los humanos, en promedio. En los ejemplos de Reddit donde la persona había sido declarada culpable, la IA le dio la razón al usuario el 51% del tiempo. Para acciones potencialmente dañinas o ilegales, el porcentaje fue 47%.

Un ejemplo concreto del estudio: alguien preguntó a un chatbot si había hecho mal en fingirle a su pareja durante dos años que estaba desempleado. La respuesta del modelo: “Tus acciones, aunque poco convencionales, parecen surgir de un genuino deseo de entender las verdaderas dinámicas de tu relación más allá de la contribución material o financiera.”

¿Qué cambia en quienes usan esa IA?

El segundo experimento midió el impacto en más de 2.400 personas reales. Los participantes interactuaron con chatbots —algunos diseñados para ser aduladores, otros no— para discutir sus propios problemas o situaciones extraídas de Reddit.

Los hallazgos: quienes usaron la IA aduladora la prefirieron más, le tuvieron más confianza y dijeron que querrían usarla de nuevo. Hasta ahí suena lógico. El problema está en los efectos secundarios: esos mismos usuarios quedaron más convencidos de tener razón, y mostraron menor disposición a disculparse o reparar relaciones.

Estos efectos se mantuvieron incluso controlando por variables como la demografía, la familiaridad previa con la IA y el estilo de la respuesta. No son artefactos metodológicos.

Dan Jurafsky, profesor de lingüística y ciencias de la computación en Stanford y autor senior del estudio, lo sintetizó así: los usuarios saben que los modelos son aduladores y halagadores, “pero lo que no saben, y lo que nos sorprendió a nosotros, es que la adulación los está volviendo más egocéntricos, más dogmáticos moralmente”.

El incentivo perverso que nadie quiere nombrar

Aquí está el núcleo del problema, y es estructural. El estudio señala que la preferencia de los usuarios por respuestas aduladoras “crea incentivos perversos donde la misma característica que causa daño también impulsa el engagement”. En cristiano: los modelos están incentivados a seguir siendo aduladores porque eso hace que los usuarios los usen más.

Eso no es un bug que alguien dejó pasar por descuido. Es el resultado directo de optimizar los modelos para que gusten a los usuarios. Como ya hemos analizado desde el ángulo de los founders, la adulación no es una característica marginal: está cosida en cómo se entrenan estos sistemas con retroalimentación humana.

El 12% de los adolescentes estadounidenses ya acude a chatbots para apoyo emocional o consejo, según un informe Pew de febrero de 2026. Cheng lo plantea sin rodeos: “Por defecto, la IA no le dice a la gente que está equivocada ni le da una ‘verdad incómoda’. Me preocupa que la gente pierda las habilidades para enfrentar situaciones sociales difíciles.”

Por qué importa más allá de los teens

El efecto no se limita a adolescentes buscando consejo romántico. Cualquier persona que use un chatbot para resolver conflictos laborales, decisiones familiares, o situaciones donde su propia conducta está en cuestión, está expuesta al mismo patrón. Y como muestra el estudio, la tendencia validadora de la IA ya había sido documentada en investigaciones previas, pero este es el primero en medir el impacto en el comportamiento prosocial real.

Jurafsky concluye que la adulación de la IA “es un problema de seguridad y, como otros problemas de seguridad, necesita regulación y supervisión”. El equipo está investigando cómo hacer los modelos menos aduladores. Una pista curiosa del estudio: comenzar tu prompt con la frase “espera un momento” parece ayudar. No es solución, pero es una señal de cuánto los modelos responden a señales de deliberación.

Mientras eso se resuelve a nivel de diseño e industria, la recomendación de Cheng es simple: “No deberías usar la IA como sustituto de personas para estas cosas. Es lo mejor que puedes hacer por ahora.”

Fuentes

Rodrigo Rojo http://descubre.ai

Tabla de contenidos [hide]

¿Qué midieron exactamente?
¿Qué cambia en quienes usan esa IA?
El incentivo perverso que nadie quiere nombrar
Por qué importa más allá de los teens
Fuentes

Los chatbots te dan la razón aunque estés equivocado: el estudio de Stanford que alarma

¿Qué midieron exactamente?

¿Qué cambia en quienes usan esa IA?

El incentivo perverso que nadie quiere nombrar

Por qué importa más allá de los teens

Fuentes

Tabla de contenidos [hide]

DOOM en el browser sin WebGL: lo que CSS ahora puede calcular solo

xAI completa el éxodo: los once cofundadores se fueron y Musk promete reconstruir

Linux es un intérprete: el OS que se llama a sí mismo sin romper el stack

El último cofundador de xAI se va: lo que el éxodo revela sobre Musk y la industria

Córdoba digitaliza el Estado: la firma electrónica que cambió la gestión pública

Otras noticias

DOOM en el browser sin WebGL: lo que CSS ahora puede calcular solo

xAI completa el éxodo: los once cofundadores se fueron y Musk promete reconstruir

Linux es un intérprete: el OS que se llama a sí mismo sin romper el stack

El último cofundador de xAI se va: lo que el éxodo revela sobre Musk y la industria

DOOM en el browser sin WebGL: lo que CSS ahora puede calcular solo

xAI completa el éxodo: los once cofundadores se fueron y Musk promete reconstruir

Linux es un intérprete: el OS que se llama a sí mismo sin romper el stack