El 15 de marzo de 2016, un sistema de IA jugó la movida 37 en el segundo partido contra Lee Sedol, el campeón mundial de Go. Los comentaristas en vivo pensaron que era un error. Era 200 millones de espectadores mirando algo que no habían visto nunca: una máquina haciendo algo creativamente imposible. Diez años después, DeepMind publica hoy su retrospectiva y el mensaje de Demis Hassabis es claro: AlphaGo no fue solo un logro en Go — fue el momento que definió la era moderna de la IA.
¿Qué fue AlphaGo y por qué el Go importaba tanto?
El ajedrez fue resuelto computacionalmente en 1997 cuando Deep Blue de IBM venció a Kasparov. El Go era considerado el siguiente reto imposible — y se esperaba que tardara décadas más. El tablero de 19×19 tiene 10170 posiciones posibles, más que el número de átomos en el universo observable. La fuerza bruta estaba fuera de la cuestión.
AlphaGo combinó tres elementos que todavía son la columna vertebral de los sistemas de IA más avanzados de hoy:
- Redes neuronales profundas para evaluar posiciones del tablero
- Búsqueda Monte Carlo para explorar movidas posibles de manera eficiente
- Aprendizaje por refuerzo para mejorar jugando millones de partidas contra sí mismo
El sistema primero aprendió de juegos humanos y luego superó a sus propios maestros jugando contra sí mismo. Este ciclo —observar, imitar, superar— es el mismo que hoy aplican los modelos de lenguaje, los sistemas de robotics y los agentes autónomos.
La Movida 37: creatividad artificial
En el segundo partido contra Lee Sedol, en el movimiento 37, AlphaGo colocó una piedra donde ningún jugador humano habría pensado colocarla. El comentarista Fan Hui dijo en vivo: “Es un error… pero espera…” Cien movimientos después, esa piedra estaba en posición perfecta para ganar la partida.
Lee Sedol se tomó quince minutos para procesar lo que acababa de ver. Los expertos estimaron después que la probabilidad de que un jugador humano hubiera hecho esa movida era de 1 en 10.000. No era azar. Era AlphaGo encontrando un patrón que ningún humano había considerado en miles de años de historia del juego.
Este momento es lo que Hassabis llama hoy “la chispa creativa” — la demostración de que la IA no solo replica lo que los humanos hacen bien, sino que puede encontrar estrategias enteramente nuevas.
De AlphaGo a AlphaFold: ciencia real, no juegos
Después de AlphaGo, DeepMind construyó AlphaGo Zero — la misma arquitectura, pero sin aprender de juegos humanos, solo de reglas. En tres días ya era mejor que cualquier versión de AlphaGo. En 40 días era el mejor jugador de Go de la historia.
Luego llegó AlphaFold: la misma metodología aplicada al plegamiento de proteínas — el problema más importante de la biología molecular desde hace 50 años. En 2022 publicó las estructuras de prácticamente todas las proteínas conocidas. Los científicos habían tardado décadas en resolver una a una. AlphaFold las resolvió todas de golpe. Ganó el Nobel de Química en 2024.
El hilo conductor es directo: las técnicas desarrolladas para ganar en Go —redes neuronales que evalúan estados complejos, aprendizaje por refuerzo, búsqueda eficiente en espacios enormes— son las mismas que ahora resuelven problemas de medicina, física, materiales y energía.
El impacto en los propios jugadores de Go
Una consecuencia inesperada: AlphaGo cambió cómo los humanos juegan Go. La Korea Baduk Association está negociando con DeepMind para organizar un partido conmemorativo del 10º aniversario entre el actual campeón y una nueva versión de AlphaGo. Los jugadores profesionales estudian las partidas de AlphaGo como si fueran partidos históricos, aprendiendo movidas que ningún maestro humano había considerado.
El MIT Technology Review documenta cómo el juego de Go cambió radicalmente: los jugadores de élite adoptaron aperturas que AlphaGo “inventó” y que antes habrían sido consideradas imprudentes. La IA no compitió con el Go humano — lo transformó.
Por qué importa hoy
Demis Hassabis escribió hoy: “Diez años después, este hito sigue informando nuestro trabajo construyendo sistemas en el camino hacia la AGI. Creemos que la AGI será la tecnología más profunda jamás inventada.”
AlphaGo fue la prueba de que el aprendizaje profundo por refuerzo podía resolver problemas considerados computacionalmente intratables. Esa demostración abrió el camino a una década de inversión masiva en IA — los $1.000M de Yann LeCun, los datacenter de Stargate, los modelos de razonamiento de OpenAI. Todo parte del mismo impulso que un sistema de Go demostró ser posible en 2016.
Y la Movida 37 sigue siendo la imagen más perfecta de lo que la IA puede hacer cuando no está limitada por lo que los humanos ya hicieron: encontrar el camino que nadie sabía que existía.

