Lanza Milestone Complemento de IA Generativa

Aditamento para XProtect, diseñado para optimizar la revisión y respuesta a contenido de video.

Por REVISTA MÁS SEGURIDAD

La empresa global en tecnología de video basada en datos, Milestone Systems, anunció el próximo lanzamiento de un complemento de analítica de video con Inteligencia Artificial generativa para su software de gestión de video XProtect®, desarrollado en colaboración con NVIDIA. Diseñada para ayudar a los operadores a contextualizar las alarmas y permitirles concentrarse en lo realmente importante, esta nueva herramienta automatiza la revisión de video, filtra las falsas alarmas y, según los resultados preliminares, podría reducir hasta en un 30 % la fatiga operativa causada por exceso de alertas.

Una versión beta de este complemento se presentará por primera vez durante el Smart City Expo World Congress en Barcelona, del 4 al 6 de noviembre. La versión general estará disponible para finales de este año.

Procesar y comprender más video en menor tiempo

Los sistemas de video actuales registran enormes volúmenes de datos, sin embargo, la revisión de ese material sigue siendo un proceso lento y, en gran medida, manual. El nuevo complemento para XProtect, resuelve este problema utilizando inteligencia artificial generativa para resumir, contextualizar y validar automáticamente el contenido de video en tiempo real, ayudando a los equipos a responder con mayor rapidez ante incidentes, gestionar el material de video con mayor eficiencia y disminuir de manera efectiva la fatiga de los operadores causada por el exceso de alarmas.

Principales prestaciones del complemento

Informes automatizados de incidentes. Los clips de video seleccionados se convierten instantáneamente en resúmenes de incidentes y reportes estructurados, lo que ayuda a los operadores a reducir el tiempo que dedican a la documentación manual. Validación de eventos. El complemento puede configurarse para analizar eventos de movimiento y validar alarmas, reduciendo la ocurrencia de falsos positivos (alarmas que no corresponden a situaciones reales) y mejorando la gestión de alertas. Esta función está completamente integrada con el motor de reglas de XProtect.

Resúmenes contextuales de marcadores

Los segmentos de video que han sido marcados (bookmarks) se resumen automáticamente mediante salidas en lenguaje natural, lo que permite hacer una evaluación rápida del contenido sin necesidad de revisar cada clip manualmente.

El complemento se integra directamente con el motor de reglas de XProtect y puede desplegarse tanto en instalaciones locales como en la nube, brindando a las organizaciones flexibilidad para cumplir con los requerimientos normativos y de implementación.

Desarrollado con IA ética y datos del mundo real

Esta nueva solución se basa en el modelo de lenguaje y visión Hafnia (VLM), desarrollado por Milestone, el cual ha sido entrenado con 75 000 horas de video real, obtenido de forma ética ya sea en Europa o en Estados Unidos. La preparación de estos datos fue realizada utilizando NVIDIA Cosmos Curator y la solución puede ejecutarse tanto en infraestructura en la nube como en centros de datos regionales que utilizan tecnología NVIDIA. Utiliza las prestaciones del modelo de lenguaje y visión NVIDIA Cosmos Reason, lo que la convierte en una de las plataformas de inteligencia artificial para video más avanzadas y alineadas con las regulaciones de la industria.

Thomas Jensen, CEO de Milestone Systems, afirmó: “Con este nuevo complemento para XProtect, estamos permitiendo que la inteligencia de video avanzada sea accesible para ciudades, organizaciones y operadores de todo el mundo que gestionan sistemas de tránsito, ayudándolos a alcanzar nuevos niveles de eficiencia, seguridad y capacidad de análisis. Los usuarios de XProtect tendrán acceso a funciones de inteligencia artificial generativa de vanguardia, mientras que nuestros socios podrán generar valor agregado a partir de estas nuevas prestaciones que ahora están integradas en XProtect. Este es, sin duda, un paso decisivo en nuestra misión de transformar la manera en que el mundo gestiona y aprende de los datos de video, de forma responsable y a gran escala”.

Ciudades como Génova (Italia) y Dubuque (Iowa, Estados Unidos), que ya utilizan XProtect, han expresado su entusiasmo por probar estas nuevas funcionalidades, posicionándose a la vanguardia en la adopción de soluciones avanzadas de inteligencia artificial de video para mejorar la gestión del tráfico vehicular.

Impulso a la innovación del ecosistema mediante VLM como servicio

El lanzamiento del nuevo complemento es solo el comienzo. Milestone también está lanzando su modelo de VLM como servicio a través de API, que permite a desarrolladores, integradores de sistemas y socios tecnológicos crear sus propias soluciones de inteligencia artificial generativa, sin importar la plataforma de gestión de video (VMS) que utilicen. En el marco de este anuncio, Milestone, en colaboración con Vadio, realizará demostraciones en vivo del nuevo complemento para XProtect durante el Smart City Expo World Congress, que se llevará a cabo del 4 al 6 de noviembre en Barcelona, España. Las presentaciones incluirán una nueva herramienta para la evaluación comparativa de modelos de IA y un sistema de resumen de incidentes en tiempo real.

El ritmo no baja: la innovación continúa con el Milestone Developer Summit

Milestone continuará con su apuesta por la innovación en el Developer Summit, que se celebrará en Copenhague los días 10 y 11 de noviembre, donde se presentarán las funcionalidades de Hafnia y se anunciarán los ganadores del Hafnia Hackathon.

Lo que no ves también te vigila: Anatomía Secreta de la nueva Vigilancia Silenciosa (Primera Parte)

Por REVISTA MÁS SEGURIDAD

Andrea Guidugli / Opinión

          La Spezia, Italia. -Una conversación, una voz, una vibración mínima: todo basta. La vigilancia moderna ya no necesita micrófonos, solo rastros.

De las salas seguras a los teléfonos de operativos, de los láseres que leen ventanas a los algoritmos que reconocen una voz entre millones: un viaje por la vigilancia que no se declara, la que no deja huellas físicas, pero sí digitales. Un territorio donde México tampoco es ajeno.

La voz que te delata

Durante años pensé que la seguridad era cuestión de prudencia. Una tarjeta SIM extranjera, un teléfono comprado en un aeropuerto remoto, una llamada hecha desde un pasillo de hotel en un país donde nadie conocía mi nombre. Creía — como tantos — que cambiar de tarjeta equivalía a cambiar de identidad. Era ingenuidad. Elegante, pero ingenua. Aquel día, en un despacho sin ventanas de una empresa del grupo — un lugar donde los técnicos de ciberseguridad hablaban en voz baja incluso estando solos — un colega se echó a reír al escuchar mis “métodos”.

Si alguien te está vigilando, no necesitan tu número. Necesitan tu voz. Una vez que la tienen, te siguen donde vayas. Cambies la SIM, el teléfono o el continente.

Me quedé callado. Él agregó, casi divertido:

El error clásico del aficionado es creer que la vigilancia depende del dispositivo. En realidad, depende de ti.

Aquella frase me acompañó durante años y hoy, cuando miro el ecosistema de vigilancia mundial, me doy cuenta de que tenía demasiada razón.

No vivimos en la era de la ciberseguridad. Vivimos en la era de la ciber-percepción: donde las máquinas ya no buscan lo que haces, sino lo que eres.

Y ahí empieza esta historia.

La vigilancia que ya no necesita micrófonos: anatomía de un mundo silencioso

La vigilancia moderna ha cambiado de piel. No se basa en cables escondidos, grabadoras incrustadas en muebles o micrófonos diminutos. Eso es arqueología operativa. Hoy la vigilancia es óptica, vibratoria, algorítmica y, sobre todo, es pasiva.

No emite señales. No interfiere. No deja huellas. Solo observa.

1. Visual Intelligence (VISINT): cuando la luz escucha

El MIT lo demostró en 2014: una bolsa de patatas filmada a miles de fotogramas por segundo podía revelar conversaciones enteras. Pero ese experimento — The Visual Microphone — fue solo el prólogo. Desde entonces, varias unidades de inteligencia lo han llevado más lejos:

NSA, Tailored Access Operations (TAO): integración de VISINT con SIGINT Unidad 8200 israelí: fusión de análisis temporal de video con captación de micro vibraciones

GCHQ británica: análisis de ventanas a 200 metros con láseres de bajo retorno

Sedena y Marina mexicana (información pública): uso de sensores ópticos en vigilancia urbana de alto riesgo

Nada de esto es secreto; solo se comunica poco. Esta nueva generación de herramientas no escucha sonidos: escucha movimientos. Una cortina. Una botella de agua. Una lámpara. Una chapa metálica. Una ventana. Todo vibra cuando hablas y todo lo que vibra puede ser traducido.

2. El método Lamphone: la bombilla que delata secretos

Universidad Ben-Gurión, Israel, 2020. Demostración pública: captaron una conversación entera observando únicamente la luz de una bombilla. ¿Por qué funciona? Porque el filamento o el LED vibra y la luz vibrada contiene sonido codificado. Ese estudio está hoy en bases de datos policiales y militares internacionales. No porque sea exótico. Sino porque es operativo.

3. LDV (Laser Doppler Vibrometry): lo que revela un cristal

La técnica favorita de varias agencias: leer ventanas, detectar patrones de voz, captar discusiones de salas “seguras” que no lo son tanto. Un láser que apunta al cristal refleja micro oscilaciones que, reconstruidas, devuelven la voz. Ya no necesitas plantar un micrófono. Solo necesitas mirar el reflejo de un vidrio.

De la física a la doctrina: cómo operan los Estados

Los países que trabajan con vigilancia pasiva no improvisan. Tienen doctrinas, manuales internos, reglas de despliegue, cadenas de autorización. Aquí menciono las partes públicas, accesibles mediante fuentes abiertas:

1. Estados Unidos – Doctrine for Technical Surveillance Countermeasures (TSCM)

Manual desclasificado parcialmente, protocolo para detectar: vibraciones sospechosas, interferencias ópticas, emisiones secundarias, manipulación de ventanas, presencia de VISINT remota. Cada año se entrenan unidades específicas del FBI y del servicio diplomático.

2. Israel – SIGINT Fusion Doctrine

La Unidad 8200 integra: vibración, imagen, acústica residual, análisis de tráfico digital No buscan pruebas directas. Buscan correlaciones y esas correlaciones valen más que una grabación clásica.

3. Francia – DGSI/DGSE

Usan VISINT en: negociaciones de rehenes, seguimiento antiterrorista, operaciones contra crimen organizado de origen saheliano. Francia fue de las primeras en integrar VISINT en operaciones urbanas en Marsella y Lyon.

4. México – Sedena, Marina, CN5I

México no se queda atrás. En 2022 y 2023, varios documentos públicos mencionan uso de sensores ópticos de largo alcance, estaciones móviles de vigilancia vibratoria, integración con plataformas de reconocimiento urbano. México tiene una ventaja: su “experiencia de frontera” con Estados Unidos ha permitido cooperación técnica constante.

El error humano: somos rastros antes que personas

Aquí entra mi anécdota personal, que ahora adquiere un peso distinto. Aquello que me dijo mi colega “necesitan tu voz, no tu teléfono” es una doctrina real. Se llama: Speaker Identity Tracking (S.I.T.).

No importa qué número uses. Da igual en qué país estés. Si una agencia tiene tu firma vocal, puede detectarte cuando: llamas por VoIP, envías un mensaje de voz, hablas cerca de un dispositivo conectado, apareces en el audio de un video, incluso cuando hablas dentro de un automóvil moderno

La voz es más fuerte que tu pasaporte y más traidora que tu SIM.

Los casos reales que nunca se cuentan

Aquí es donde la historia deja de ser técnica y se vuelve humana. La vigilancia pasiva es tan poderosa como discreta. Sus éxitos no suelen aparecer en comunicados oficiales, y cuando lo hacen, se atribuyen a “trabajo de inteligencia”, una expresión que sirve para ocultar tecnologías que no conviene mencionar. Aquí van versiones ampliadas, basadas en información pública, documentos judiciales y reconstrucciones de fuentes abiertas, que permiten entrever cómo estas técnicas operan realmente.

Continuará en la próxima edición

Comunicaciones PoC para Eventos Deportivos: Gran Fondo El Origen 2025

Por HYTERA
          El pasado 16 de noviembre se llevó a cabo en Zipaquirá, Colombia. una nueva edición del Gran Fondo El Origen, uno de los eventos más importantes del ciclismo aficionado y profesional en el país.
Patrocinado por Egan Bernal, el único colombiano en ganar el Tour de Francia y una de las figuras más reconocidas en la historia del deporte, el evento reunió a participantes de todo el país en un recorrido de más de 140 kilómetros, diseñado para recrear las exigentes rutas de las grandes competencias mundiales.
La carrera, organizada por el equipo logístico de Cycla, contó con una robusta infraestructura para garantizar la seguridad y comodidad de los asistentes, incluyendo puntos de hidratación, asistencia mecánica, carros escoba y el cierre temporal de vías en Zipaquirá y corredores alternos de Cundinamarca. Gracias a estas medidas, más de 4000 ciclistas pudieron disfrutar del exigente trazado en óptimas condiciones. 
Comunicaciones de radios PoC, ideal para eventos de gran escala
En esta edición, Hytera, proveedor líder mundial en soluciones y tecnología de comunicaciones críticas, participó como marca aliada, aportando su tecnología PoC (Push-to-Talk over Cellular) al servicio de la organización. Más de 50 radios PNC360s, PNC380 y P50 fueron utilizados por el equipo logístico, facilitando comunicaciones estables, sin interrupciones y permitiendo coordinar cada detalle operativo durante la jornada.
Además, se contó con el respaldo de SEIT, partner autorizado de Hytera en Colombia, lo que permitió un acompañamiento constante de soporte técnico y comercial para Cycla durante todo el evento. El apoyo de SEIT fue crucial para garantizar que la infraestructura de comunicaciones funcionara perfectamente, ofreciendo soluciones rápidas y eficientes ante cualquier desafío técnico.
Coordinación constante que evita riesgos y optimiza recursos
Una vez más, quedó demostrada la importancia crítica de contar con sistemas de comunicación profesionales en eventos deportivos de gran escala como el Gran Fondo El Origen. En escenarios donde participan miles de ciclistas, cada segundo es determinante para la seguridad y la operación.
Por ello, las soluciones de comunicación avanzada no solo permiten mantener una coordinación permanente entre los equipos logísticos, de asistencia y de seguridad, sino que también garantizan una respuesta inmediata ante incidentes, desvíos en ruta, emergencias médicas o necesidades técnicas. La capacidad de transmitir información clara, estable y sin latencia se convierte en un factor decisivo para evitar riesgos, optimizar recursos y asegurar que la experiencia de los participantes sea fluida y segura de principio a fin.
Para Hytera, su participación en el Gran Fondo El Origen reafirma su compromiso con la seguridad, la conectividad y la eficiencia en la gestión de grandes eventos. La compañía destacó la importancia de contar con comunicación oportuna y confiable para garantizar que actividades de esta magnitud se desarrollen sin novedades y con la mejor experiencia para los participantes.