Cuando el CEO de Conntour dice que puede buscar en cámaras de seguridad como si fueran Google, no está exagerando. Le puedes preguntar al sistema: “¿Alguien en zapatillas pasó una bolsa en el lobby entre las 14:00 y las 16:00?”, y en segundos obtienes el clip. Esto no existía hace dos años. Ahora levantó $7 millones de General Catalyst y Y Combinator, y tiene como cliente a la Oficina Central de Narcóticos de Singapur.
Pero la historia de Conntour no es solo la de una startup que recaudó dinero rápido —la ronda cerró en 72 horas, con 90 reuniones en ocho días—. Es la historia de lo que le pasa a una industria cuando los modelos de lenguaje visual finalmente maduran lo suficiente para hacer que millones de horas de grabación dejen de ser un problema de almacenamiento y se conviertan en inteligencia consultable.
¿Qué cambió exactamente?
Los sistemas de videovigilancia tradicionales funcionan con parámetros fijos: detecta movimiento en esta zona, alerta si cruza esa línea, busca caras en esa base de datos. Útil, pero rígido. Si lo que ocurrió no coincide exactamente con una regla que alguien predefinió, no lo encontrarás.
Aprende IA con nosotros
Únete gratis a mi comunidad en Skool, donde compartimos noticias, tutoriales y recursos para seguir aprendiendo juntos.
👥 Únete gratis 🚀Conntour rompe ese esquema usando modelos de lenguaje visual (VLMs) combinados con lógica propia para procesar consultas en lenguaje natural. El usuario no necesita saber qué cámara, qué hora exacta, ni qué regla configurar. Solo describe lo que busca, y el sistema escanea en tiempo real o en grabaciones históricas.
El desafío técnico que Matan Goldner, CEO de la startup, describe como “la contradicción central de su industria” es resolver dos fuerzas opuestas simultáneamente: la flexibilidad total de un LLM y la eficiencia necesaria para monitorear miles de cámaras en paralelo. Según la compañía, su arquitectura puede procesar hasta 50 feeds de cámara con una sola GPU de consumo como la RTX 4090, lo que hace la propuesta económicamente viable incluso para instalaciones medianas.
El mercado que se mueve: privacidad vs. inteligencia
El timing no es inocente. La ronda de Conntour llega en medio de una controversia activa sobre el uso de cámaras con IA. Flock Safety, que instaló una red nacional de reconocimiento de placas, fue usada por ICE para rastrear personas. Ring, de Amazon, enfrentó críticas por construir una red de vigilancia vecinal con IA que permite a las fuerzas de orden solicitar grabaciones de particulares. El escándalo es real.
Goldner argumenta que eso es precisamente lo que los diferencia: seleccionan a sus clientes activamente. Gobiernos y corporaciones con casos de uso claros, ninguna empresa cuyo modelo de negocio sea monetizar vigilancia masiva. Es fácil ser escéptico ante este tipo de declaraciones en el mundo startup, pero hay un dato que le da credibilidad: el hecho de tener clientes gubernamentales grandes ya en producción les permite permitirse el lujo de rechazar a otros. No es principio filosófico solo; es ventaja de negocios.
Este dilema no es menor. El mismo modelo que ayuda a encontrar a un sospechoso en grabaciones de un banco puede ayudar a rastrear a un activista en una ciudad. La diferencia no está en la tecnología; está en quién consulta qué.
Por qué importa más allá de Conntour
Conntour no es el único jugador en este espacio. Augur, la startup londinense respaldada por Plural, también convierte cámaras existentes en inteligencia de seguridad en tiempo real, con un enfoque diferente. Y la categoría más amplia de IA aplicada a infraestructura urbana sigue creciendo: desde semáforos inteligentes con IA como NoTraffic hasta sensores industriales con capacidad predictiva.
Lo que hace diferente a Conntour es que resuelve un problema de interfaz, no de infraestructura. Las cámaras ya están instaladas. El video ya se graba. Lo que falta —lo que siempre faltó— es una capa de consulta que haga usable ese archivo visual sin requerir un analista humano por cada evento.
El modelo de confianza que propone Goldner —con un score de confianza explícito por cada resultado, vinculado a la calidad del feed— es una señal de madurez técnica. En un campo donde los falsos positivos pueden destruir reputaciones y los falsos negativos pueden costar vidas, esa honestidad sobre los límites del sistema vale tanto como la funcionalidad misma.
El verdadero desafío de Conntour no será técnico. Será demostrar que un sistema capaz de encontrar “cualquier cosa en cualquier grabación” puede implementarse en el mundo real con la misma selectividad con que lo presentan en entrevistas. El mercado de la videovigilancia con IA ya tiene viento en popa. La pregunta es quién decide qué preguntas están permitidas hacer.

