Wayfair ya no está probando la IA como demo de feria. La está usando en producción para corregir datos de producto, enrutar tickets de proveedores y acelerar decisiones en una operación que mueve unos 30 millones de artículos. En números concretos: la compañía dice haber corregido 2,5 millones de tags de producto y automatizado 41.000 tickets al mes con sistemas construidos sobre OpenAI.
Eso importa porque el comercio online vive o muere en detalles aburridos pero decisivos: que un sofá aparezca cuando buscas “verde oliva”, que una silla no tenga atributos mal etiquetados y que un proveedor no pase días atrapado en un ticket mal derivado. Si la IA logra mejorar justo esas capas invisibles, no estamos hablando de humo. Estamos hablando de margen, conversión y menos fricción operativa.
¿Qué problema estaba resolviendo Wayfair?
Wayfair opera con una escala que castiga cualquier error de catálogo. Según OpenAI y otras piezas corporativas de la empresa, su red trabaja con más de 20.000 proveedores y una base de entre 30 y 40 millones de productos, dependiendo de la fuente y el momento de medición. En ese contexto, una etiqueta incompleta o incorrecta no es una anécdota: afecta búsqueda, recomendaciones, SEO, anuncios de shopping y, al final, ventas.
Antes, gran parte de esas mejoras dependían de reportes manuales de proveedores o clientes. Wayfair había probado modelos hechos a medida para tags específicos, pero el propio equipo reconoce que esa estrategia no escalaba cuando el universo de atributos llegaba a decenas de miles. Carolyn Phillips, científica de machine learning de la empresa, lo resumió con brutal honestidad en la publicación de OpenAI: el cuello de botella no era solo el modelo, sino el tiempo humano necesario para definir qué significaba realmente cada tag.
Esa lógica conecta con otra señal que ya vimos en descubre.ai cuando hablamos de cómo Burger King está usando IA en retail: el valor no aparece cuando la IA “conversa bonito”, sino cuando reduce tareas repetitivas en operaciones donde cada segundo y cada error cuestan plata.
Así funciona el sistema de catálogo con OpenAI
La arquitectura que describe Wayfair no se basa en crear un modelo distinto para cada atributo. En vez de eso, construyó una capa más reutilizable: un “definition agent” que toma definiciones internas y externas para entender el contexto de cada etiqueta, y luego usa esa información junto con datos del producto para clasificar atributos a escala.
La empresa asegura que hoy está expandiendo cobertura de nuevos atributos a una velocidad 70 veces mayor que hace un año. Además, ya corrió el sistema en más de un millón de productos y publicó la primera tanda suficiente como para medir impacto real. En sus pruebas A/B, Wayfair reporta aumentos significativos en impresiones, clics y posicionamiento de página cuando la calidad del atributo mejora.
- 2,5 millones de tags corregidos: sobre más de un millón de productos visibles y de alta compra, según la publicación oficial de OpenAI.
- Expansión 70x más rápida: la compañía dice que ahora puede llevar el sistema a nuevos atributos mucho más rápido que hace un año.
- Validación humana: no entrega el control total al modelo; usa auditorías físicas, validación con proveedores y umbrales de riesgo antes de sobrescribir datos.
Ese último punto es clave. Wayfair no está vendiendo la fantasía de “dejamos que la IA reescriba todo y cruzamos los dedos”. Está construyendo confianza por capas: si la confianza del dato es alta, automatiza; si el riesgo es alto, pide confirmación. Es un enfoque bastante más serio que el de muchas empresas que aún siguen atrapadas entre el piloto eterno y la automatización irresponsable.
Wilma y el otro frente: soporte a proveedores
La otra parte interesante del caso no está en el catálogo, sino en soporte. Wayfair bautizó como Wilma a un producto interno que suma funciones agentic para leer tickets, inferir intención, completar contexto y derivar cada caso al equipo correcto. Según la empresa, esta capa pasó de prototipo a producción en alrededor de un mes porque ya operaba sobre sistemas integrados con las APIs de OpenAI.
El problema aquí era clásico: miles de tickets, cientos de tipos de incidencias y demasiada complejidad para que una sola persona dominara todos los escenarios. Wilma intenta absorber justo esa complejidad inicial. No resuelve mágicamente todo, pero sí elimina la peor parte: la clasificación manual, lenta y propensa a errores.
Wayfair dice que hoy tiene una docena de flujos agentic en producción para equipos específicos. En algunos casos el sistema actúa como copiloto, proponiendo pasos siguientes o borradores de respuesta. En otros, la empresa mide algo que llama “alignment rate”, es decir, cuántas veces la recomendación de la IA coincide con la decisión final del agente humano. Cuando ese alineamiento supera un umbral, el flujo puede pasar de asistido a semiautónomo.
- 41.000 tickets mensuales automatizados: triage, copilotos y flujos semiautónomos ya están quitando trabajo manual en varios equipos.
- Hasta 70% de automatización: en algunos workflows internos, según la cifra publicada por OpenAI.
- Menos reaperturas y más satisfacción: Wayfair atribuye a esa mejor clasificación inicial una reducción en tiempos de resolución y tickets reabiertos.
¿Por qué este caso vale más que un anuncio bonito?
Porque mezcla tres cosas que rara vez aparecen juntas en una historia corporativa de IA: escala real, métricas concretas y disciplina operativa. Además, no es un proyecto aislado. Wayfair ya venía invirtiendo en visión computacional, tagging y descubrimiento de producto. De hecho, casos previos publicados por Snorkel muestran que la empresa había conseguido una mejora de 7 puntos en clickthrough y un win rate cercano al 99% en ciertas tareas de clasificación visual con pipelines de datos más sofisticados.
La CTO Fiona Tan ya venía explicando desde 2025 que Wayfair quería llevar la IA también hacia descubrimiento e inspiración de compra. Lo de OpenAI no aparece de la nada: es una capa nueva sobre una estrategia más amplia de transformación del comercio electrónico.
Y ojo con el detalle de adopción interna: Wayfair también desplegó más de 1.200 licencias de ChatGPT Enterprise entre unos 12.000 empleados. Eso sugiere que no están viendo la IA solo como una herramienta puntual, sino como infraestructura de trabajo.
Por qué importa
La lectura fácil sería decir “otro retailer usando IA”. La lectura correcta es más interesante: Wayfair muestra cómo se ve una adopción madura cuando la IA deja de ser una feature de marketing y se convierte en sistema operativo de procesos internos. No reemplaza criterio humano, pero sí comprime trabajo manual en dos zonas donde el e-commerce sangra eficiencia: datos de catálogo y soporte operacional.
También deja una lección para el resto del mercado. La ventaja no está solo en tener acceso a buenos modelos, sino en saber dónde meterlos, qué métricas mirar y cuándo frenar la automatización para no romper confianza. Si esta lógica se vuelve estándar, vamos a ver menos “copilotos” vendiendo promesas abstractas y más empresas midiendo impacto real sobre búsqueda, conversión, resolución y calidad de dato.

