Lanza Milestone Complemento de IA Generativa
Aditamento para XProtect, diseñado para optimizar la revisión y respuesta a contenido de video.
Por REVISTA MÁS SEGURIDAD
Resúmenes contextuales de marcadores
Desarrollado con IA ética y datos del mundo real
Esta nueva solución se basa en el modelo de lenguaje y visión Hafnia (VLM), desarrollado por Milestone, el cual ha sido entrenado con 75 000 horas de video real, obtenido de forma ética ya sea en Europa o en Estados Unidos. La preparación de estos datos fue realizada utilizando NVIDIA Cosmos Curator y la solución puede ejecutarse tanto en infraestructura en la nube como en centros de datos regionales que utilizan tecnología NVIDIA. Utiliza las prestaciones del modelo de lenguaje y visión NVIDIA Cosmos Reason, lo que la convierte en una de las plataformas de inteligencia artificial para video más avanzadas y alineadas con las regulaciones de la industria.
Thomas Jensen, CEO de Milestone Systems, afirmó: “Con este nuevo complemento para XProtect, estamos permitiendo que la inteligencia de video avanzada sea accesible para ciudades, organizaciones y operadores de todo el mundo que gestionan sistemas de tránsito, ayudándolos a alcanzar nuevos niveles de eficiencia, seguridad y capacidad de análisis. Los usuarios de XProtect tendrán acceso a funciones de inteligencia artificial generativa de vanguardia, mientras que nuestros socios podrán generar valor agregado a partir de estas nuevas prestaciones que ahora están integradas en XProtect. Este es, sin duda, un paso decisivo en nuestra misión de transformar la manera en que el mundo gestiona y aprende de los datos de video, de forma responsable y a gran escala”.
Ciudades como Génova (Italia) y Dubuque (Iowa, Estados Unidos), que ya utilizan XProtect, han expresado su entusiasmo por probar estas nuevas funcionalidades, posicionándose a la vanguardia en la adopción de soluciones avanzadas de inteligencia artificial de video para mejorar la gestión del tráfico vehicular.
Impulso a la innovación del ecosistema mediante VLM como servicio
El lanzamiento del nuevo complemento es solo el comienzo. Milestone también está lanzando su modelo de VLM como servicio a través de API, que permite a desarrolladores, integradores de sistemas y socios tecnológicos crear sus propias soluciones de inteligencia artificial generativa, sin importar la plataforma de gestión de video (VMS) que utilicen. En el marco de este anuncio, Milestone, en colaboración con Vadio, realizará demostraciones en vivo del nuevo complemento para XProtect durante el Smart City Expo World Congress, que se llevará a cabo del 4 al 6 de noviembre en Barcelona, España. Las presentaciones incluirán una nueva herramienta para la evaluación comparativa de modelos de IA y un sistema de resumen de incidentes en tiempo real.
El ritmo no baja: la innovación continúa con el Milestone Developer Summit
Milestone continuará con su apuesta por la innovación en el Developer Summit, que se celebrará en Copenhague los días 10 y 11 de noviembre, donde se presentarán las funcionalidades de Hafnia y se anunciarán los ganadores del Hafnia Hackathon.
Por REVISTA MÁS SEGURIDAD
Andrea Guidugli / Opinión
La Spezia, Italia. -Una conversación, una voz, una vibración mínima: todo basta. La vigilancia moderna ya no necesita micrófonos, solo rastros.
De las salas seguras a los teléfonos de operativos, de los láseres que leen ventanas a los algoritmos que reconocen una voz entre millones: un viaje por la vigilancia que no se declara, la que no deja huellas físicas, pero sí digitales. Un territorio donde México tampoco es ajeno.
La voz que te delata
Durante años pensé que la seguridad era cuestión de prudencia. Una tarjeta SIM extranjera, un teléfono comprado en un aeropuerto remoto, una llamada hecha desde un pasillo de hotel en un país donde nadie conocía mi nombre. Creía — como tantos — que cambiar de tarjeta equivalía a cambiar de identidad. Era ingenuidad. Elegante, pero ingenua. Aquel día, en un despacho sin ventanas de una empresa del grupo — un lugar donde los técnicos de ciberseguridad hablaban en voz baja incluso estando solos — un colega se echó a reír al escuchar mis “métodos”.
Si alguien te está vigilando, no necesitan tu número. Necesitan tu voz. Una vez que la tienen, te siguen donde vayas. Cambies la SIM, el teléfono o el continente.
Me quedé callado. Él agregó, casi divertido:
El error clásico del aficionado es creer que la vigilancia depende del dispositivo. En realidad, depende de ti.
Aquella frase me acompañó durante años y hoy, cuando miro el ecosistema de vigilancia mundial, me doy cuenta de que tenía demasiada razón.
No vivimos en la era de la ciberseguridad. Vivimos en la era de la ciber-percepción: donde las máquinas ya no buscan lo que haces, sino lo que eres.
Y ahí empieza esta historia.
La vigilancia que ya no necesita micrófonos: anatomía de un mundo silencioso
La vigilancia moderna ha cambiado de piel. No se basa en cables escondidos, grabadoras incrustadas en muebles o micrófonos diminutos. Eso es arqueología operativa. Hoy la vigilancia es óptica, vibratoria, algorítmica y, sobre todo, es pasiva.
No emite señales. No interfiere. No deja huellas. Solo observa.
1. Visual Intelligence (VISINT): cuando la luz escucha
El MIT lo demostró en 2014: una bolsa de patatas filmada a miles de fotogramas por segundo podía revelar conversaciones enteras. Pero ese experimento — The Visual Microphone — fue solo el prólogo. Desde entonces, varias unidades de inteligencia lo han llevado más lejos:
NSA, Tailored Access Operations (TAO): integración de VISINT con SIGINT Unidad 8200 israelí: fusión de análisis temporal de video con captación de micro vibraciones
GCHQ británica: análisis de ventanas a 200 metros con láseres de bajo retorno
Sedena y Marina mexicana (información pública): uso de sensores ópticos en vigilancia urbana de alto riesgo
Nada de esto es secreto; solo se comunica poco. Esta nueva generación de herramientas no escucha sonidos: escucha movimientos. Una cortina. Una botella de agua. Una lámpara. Una chapa metálica. Una ventana. Todo vibra cuando hablas y todo lo que vibra puede ser traducido.
2. El método Lamphone: la bombilla que delata secretos
Universidad Ben-Gurión, Israel, 2020. Demostración pública: captaron una conversación entera observando únicamente la luz de una bombilla. ¿Por qué funciona? Porque el filamento o el LED vibra y la luz vibrada contiene sonido codificado. Ese estudio está hoy en bases de datos policiales y militares internacionales. No porque sea exótico. Sino porque es operativo.
3. LDV (Laser Doppler Vibrometry): lo que revela un cristal
La técnica favorita de varias agencias: leer ventanas, detectar patrones de voz, captar discusiones de salas “seguras” que no lo son tanto. Un láser que apunta al cristal refleja micro oscilaciones que, reconstruidas, devuelven la voz. Ya no necesitas plantar un micrófono. Solo necesitas mirar el reflejo de un vidrio.
De la física a la doctrina: cómo operan los Estados
Los países que trabajan con vigilancia pasiva no improvisan. Tienen doctrinas, manuales internos, reglas de despliegue, cadenas de autorización. Aquí menciono las partes públicas, accesibles mediante fuentes abiertas:
1. Estados Unidos – Doctrine for Technical Surveillance Countermeasures (TSCM)
Manual desclasificado parcialmente, protocolo para detectar: vibraciones sospechosas, interferencias ópticas, emisiones secundarias, manipulación de ventanas, presencia de VISINT remota. Cada año se entrenan unidades específicas del FBI y del servicio diplomático.
2. Israel – SIGINT Fusion Doctrine
La Unidad 8200 integra: vibración, imagen, acústica residual, análisis de tráfico digital No buscan pruebas directas. Buscan correlaciones y esas correlaciones valen más que una grabación clásica.
3. Francia – DGSI/DGSE
Usan VISINT en: negociaciones de rehenes, seguimiento antiterrorista, operaciones contra crimen organizado de origen saheliano. Francia fue de las primeras en integrar VISINT en operaciones urbanas en Marsella y Lyon.
4. México – Sedena, Marina, CN5I
México no se queda atrás. En 2022 y 2023, varios documentos públicos mencionan uso de sensores ópticos de largo alcance, estaciones móviles de vigilancia vibratoria, integración con plataformas de reconocimiento urbano. México tiene una ventaja: su “experiencia de frontera” con Estados Unidos ha permitido cooperación técnica constante.
El error humano: somos rastros antes que personas
Aquí entra mi anécdota personal, que ahora adquiere un peso distinto. Aquello que me dijo mi colega “necesitan tu voz, no tu teléfono” es una doctrina real. Se llama: Speaker Identity Tracking (S.I.T.).
No importa qué número uses. Da igual en qué país estés. Si una agencia tiene tu firma vocal, puede detectarte cuando: llamas por VoIP, envías un mensaje de voz, hablas cerca de un dispositivo conectado, apareces en el audio de un video, incluso cuando hablas dentro de un automóvil moderno
La voz es más fuerte que tu pasaporte y más traidora que tu SIM.
Los casos reales que nunca se cuentan
Aquí es donde la historia deja de ser técnica y se vuelve humana. La vigilancia pasiva es tan poderosa como discreta. Sus éxitos no suelen aparecer en comunicados oficiales, y cuando lo hacen, se atribuyen a “trabajo de inteligencia”, una expresión que sirve para ocultar tecnologías que no conviene mencionar. Aquí van versiones ampliadas, basadas en información pública, documentos judiciales y reconstrucciones de fuentes abiertas, que permiten entrever cómo estas técnicas operan realmente.
Continuará en la próxima edición
Comunicaciones PoC para Eventos Deportivos: Gran Fondo El Origen 2025










