Milestone brengt Vision Language Model voor slimmere video-analyse

Milestone Systems heeft een nieuw Vision Language Model (VLM) uitgebracht, dat is gespecialiseerd in het begrijpen van verkeerssituaties. Het model, dat draait op NVIDIA Cosmos Reason, vormt de basis voor twee nieuwe oplossingen: Video Summarization voor het XProtect video management systeem en een Vision Language Model as a Service voor integraties door derden. Met deze introductie wil Milestone het groeiende probleem van video-overload en tijdrovende handmatige analyse aanpakken.
Videobewakingssystemen genereren dagelijks enorme hoeveelheden beeldmateriaal, terwijl het terugkijken en analyseren daarvan nog vaak handmatig gebeurt. Met de nieuwe Video Summarization-tool voor XProtect Smart Client kunnen operators automatisch tekstuele samenvattingen laten genereren van videobeelden. Door een korte videosectie te selecteren en een eenvoudige opdracht te geven, beschrijft het systeem binnen enkele seconden wat er in beeld gebeurt. Daarmee wordt het zoeken naar relevante incidenten eenvoudiger en sneller, zonder afhankelijk te zijn van tijdstempels of handmatige labels.
Minder onnodig alarm
Volgens Milestone kan deze vorm van automatische videosamenvatting de zogenoemde ‘false alarm fatigue’ bij operators met tot wel dertig procent verminderen. Door irrelevante bewegingen en ruis te filteren, verschuift de aandacht naar daadwerkelijke incidenten. De samenvattingen zijn doorzoekbaar binnen XProtect, kunnen worden opgeslagen als bladwijzers en sluiten aan op bestaande events en regels, zodat automatisch samenvattingen worden gegenereerd bij specifieke meldingen of alarmen. De plug-in is gratis te downloaden en snel te installeren, waarbij gebruikers alleen betalen op het moment dat zij het VLM daadwerkelijk gebruiken.
Integraties
Naast eindgebruikers richt Milestone zich met de introductie van VLM as a Service ook op ontwikkelaars, integrators en technologiepartners. Via een API krijgen zij toegang tot productieklare video-intelligentie die eenvoudig in bestaande toepassingen kan worden geïntegreerd. Daarmee hoeven organisaties geen eigen AI-modellen meer te bouwen, trainen of beheren. Volgens Milestone kan de ontwikkeling van geavanceerde video-analyses hierdoor tot zeventig keer sneller verlopen dan bij het zelf finetunen van vergelijkbare modellen.
Belangrijke stap
Andrew Burnett, waarnemend CTO van Milestone Systems, noemt de nieuwe oplossingen een belangrijke stap. “We pakken hiermee twee grote knelpunten aan: de overvloed aan videodata en het vele handmatige werk. Operators krijgen direct inzicht binnen XProtect en ontwikkelaars krijgen snelle toegang tot volwassen video-intelligentie, zonder zware infrastructuur of maatwerktrajecten.” Doordat het model specifiek is getraind op realistische verkeerssituaties en gebruikmaakt van verantwoord verkregen data, kunnen organisaties volgens hem vertrouwen op de uitkomsten en deze veilig inzetten binnen bestaande omgevingen.
Real-world videodata
De technologie achter de oplossingen is gebaseerd op Milestones Hafnia VLM, dat is getraind met 75.000 uur aan real-world videodata uit Europa en de Verenigde Staten. Bij de voorbereiding en training is gebruikgemaakt van NVIDIA Cosmos Curator en de inzet voldoet aan de eisen van de AVG en de Europese AI-wetgeving. De eerste klanten, waaronder de steden Genua en Dubuque, zetten de nieuwe mogelijkheden al in om verkeersmanagement en veiligheid verder te verbeteren.







































































































