¿Por qué tu celular escucha cuando dices “Ok Google”? La ingeniería detrás del hotword

Share

Mencionas algo en una conversación casual y al rato ves un anuncio relacionado en Instagram. La paranoia inmediata: “el celular me está escuchando”. Es un pensamiento tan común que se ha convertido en cultura popular. Pero la realidad técnica de cómo funciona “Ok Google” —y su equivalente en otros asistentes de voz— es más fascinante y, al mismo tiempo, menos conspirativa de lo que la mayoría imagina.

Tu teléfono sí escucha. Pero lo hace de una forma muy específica, con hardware dedicado que consume una fracción mínima de energía, y el proceso tiene muy poco que ver con grabar conversaciones para enviarlas a un servidor de Google.

¿Qué pasa técnicamente cuando dices “Ok Google”?

La clave está en un componente de hardware que la mayoría no conoce: el DSP (Procesador de Señal Digital). Los teléfonos modernos incluyen un DSP dedicado exclusivamente al procesamiento de audio de bajo consumo. Este chip tiene una sola tarea: buscar un patrón de ondas sonoras que coincida con la firma acústica de “Ok Google” o “Hey Google”.

El proceso completo funciona así:

  • Escucha pasiva por DSP: el micrófono captura audio en un bucle constante de pocos segundos que se sobrescribe continuamente. El DSP analiza ese audio en busca del patrón de activación. Nada de esto se guarda ni se envía a internet.
  • Análisis espectrográfico local: cuando detectas un sonido, el DSP no “entiende” las palabras —hace análisis de formas de onda. Si la coincidencia con el modelo matemático preentrenado supera un umbral de confianza (típicamente alrededor del 95%), el chip despierta al procesador principal.
  • Activación del motor de IA: una vez despierto, el procesador principal encripta el fragmento de audio y lo envía a los servidores de Google para procesar el comando complejo —”¿qué tiempo hará mañana?”— porque esa tarea requiere potencia de cálculo que el pequeño DSP no tiene.

Lo importante: el DSP consume una cantidad ínfima de energía precisamente porque es especializado y minimalista. Si el procesador principal procesara audio de forma continua, la batería del teléfono no duraría un día.

¿Por qué aparecen anuncios de lo que hablé?

Aquí está el fenómeno que genera la mayor parte de la paranoia, y la explicación real es menos dramática que la conspiración:

Segmentación por coincidencia de ubicación: si estuviste con una persona que buscó “zapatillas de running” en Google y vuestras ubicaciones GPS coincidieron durante dos horas, los algoritmos pueden asumir intereses compartidos y mostrarte anuncios relacionados. No te escucharon: te triangularon.

Sesgo de confirmación: ignoramos las miles de veces que hablamos de algo y no aparece un anuncio. Recordamos vívidamente la única vez que sí ocurre. El cerebro construye el patrón que confirma la sospecha.

Volumen de datos conductuales: Google tiene historial de búsqueda, actividad en Maps, YouTube, Gmail y decenas de otras señales. Con esa cantidad de datos, predecir intereses con alta precisión no requiere escuchar conversaciones.

Las falsas activaciones y cuándo sí graba algo

Existe un caso legítimo donde sí puedes ser grabado sin quererlo: las falsas activaciones. El DSP tiene un umbral de confianza, pero no es perfecto. Frases que suenan parecido a “Ok Google” pueden activar el asistente involuntariamente. Cuando eso ocurre, el fragmento de audio posterior sí se envía a los servidores de Google.

Google reconoce que guarda esas grabaciones y ofrece herramientas para revisarlas y eliminarlas desde myaccount.google.com/data-and-privacy. Si revisas esa sección, probablemente encuentres algunas. Son las falsas activaciones, no espionaje sistemático.

Cómo desactivar el hotword completamente

Si prefieres que el DSP no esté activo, el proceso en Android en 2026 es directo:

  • Ir a Ajustes → Google → Servicios de la cuenta → Buscador, Asistente y Voice
  • Desactivar “Hey Google”

Al hacerlo, el sistema corta el flujo de energía al búfer del DSP. El micrófono no procesa activaciones por voz hasta que abras el asistente manualmente. Es la opción más limpia si la privacidad es prioridad.

El contexto más amplio: on-device AI y privacidad

La tendencia en 2026 va en la dirección opuesta a la conspiración: la industria está moviendo más procesamiento de IA directamente al dispositivo, no hacia la nube. El MacBook Air M5, por ejemplo, fue diseñado específicamente para correr modelos de IA local sin enviar datos a servidores externos. Y proyectos como el agente con memoria persistente basado en SQLite local muestran que el futuro de los asistentes IA es más privado, no menos.

El “Ok Google” de 2026 es técnicamente más privado que el de 2020, porque los modelos de detección de hotword son ahora más precisos localmente y generan menos falsas activaciones. El progreso en on-device AI beneficia directamente la privacidad del usuario.

Por qué importa

Entender cómo funciona la tecnología que usas a diario no es trivial. La narrativa del “celular espía” alimenta paranoia sin fundamento técnico y, al mismo tiempo, distrae de los problemas de privacidad reales —como la cantidad de datos conductuales que Google sí recopila de forma legítima y consentida. Conocer la diferencia te hace un usuario más informado y te ayuda a tomar decisiones de privacidad basadas en hechos, no en miedos.

Si te preocupa la privacidad de verdad, el lugar donde enfocar la atención no es el DSP de tu teléfono: es la cantidad de servicios de Google que usas activamente y qué datos acumulan con tu uso habitual.


Fuentes

Leer más

Otras noticias