摘要
本发明涉及计算机视觉领域,特别涉及一种基于语义嵌入学习的视频异常行为检测方法,方法包括采集各种包含异常行为的视频数据,并根据视频包含的异常行为,标注该视频对应的视频标签,然后将视频与视频标签划分为正负样本,之后将经过编码器编码后的视频向量和视频标签向量嵌入到同一个特征空间,通过对比损失函数拉近匹配的视频和视频标签之间的距离,拉远不匹配的视频和视频标签之间的距离。最后衡量视频和所有异常描述文本在特征空间中的余弦相似度,将相似度最高的异常文本作为最终检测结果。该方法解决了在真实的标注数据稀缺情况下的视频异常行为检测,提高了异常行为检测任务的泛化能力。
技术关键词
语义
文本编码器
特征提取模块
互联网视频平台
注意力
网络
图像编码器
标签
样本
数据
计算机视觉
度函数
表达式
序列
系统为您推荐了相关专利信息
垃圾分拣方法
坐标系
深度图像数据
机械臂基座
机器人底盘
缺陷检测方法
极值
消除背景干扰
线性拟合函数
滤波
交通标志检测方法
构建训练集
卡尔曼滤波
交通标志识别
运动轨迹预测