摘要
本发明公开了一种基于语义增强与时空约束的多目标交互行为保留监控视频浓缩方法,属于视频浓缩技术领域,主要包含以下步骤:通过高斯混合模型MOG2,结合随机帧采样与中值融合策略获取视频背景;利用DeepSORT算法和基于CNN+GRU架构的深度学习模型,对视频执行多目标跟踪与行为识别,提取目标轨迹、空间位置、移动方向、移动速度及行为标签特征;依据时空特征与语义信息,判断目标间的交互行为,并将存在交互的目标划分为同一目标管组;综合碰撞约束与时域约束,通过贪心策略和空间哈希算法为目标管组分配新时间标签,同时借助时序损失函数优化时序逻辑;将管组与背景融合,生成浓缩视频。本发明的视频浓缩方法能够准确保留目标之间的交互行为。
技术关键词
监控视频浓缩方法
语义
视频背景图片
贪心策略
高斯混合模型
视频浓缩技术
深度学习模型
标签特征
轨迹特征
融合策略
网格
时序
哈希算法
损失函数优化
速度
视频帧
系统为您推荐了相关专利信息
大语言模型
问答场景
文本段落
问答方法
存储计算机程序
视觉特征
空间拓扑关系
多通道特征
语义
对象识别