摘要
本发明提供一种基于多模态特征的视频内容分类与风险预警方法及系统,涉及视频处理技术领域,包括通过提取视频帧中的运动目标位置与速度数据,生成运动轨迹图和加速度数据,识别冲突行为片段并生成其时空坐标;进一步提取音频中的方位角与俯仰角数据构建声源空间分布图,提取目标音频片段并获得声源位置数据,同时对文本数据进行语义分析得到文本特征分数;结合冲突片段与音频片段的时空重合度,生成行为‑声源一致性分数,并与文本特征分数融合计算风险判定分数,最终实现视频分类及高风险事件的自动预警。
技术关键词
俯仰角数据
生成运动轨迹
视频内容分类
文本
加速度
风险预警方法
多模态特征
视频帧
传播延迟时间
坐标
空间权重矩阵
方位角
远程监控终端
语义
序列
音频解码器
系统为您推荐了相关专利信息
机器人控制方法
推力组件
机器人本体
坐标系
机器人自动控制技术
运动特征
计数器
初始误差
二次雷达
Singer模型