摘要
本发明公开了一种基于注意力的多模态井场视频安全分析方法,涉及智能视频监控分析领域,包括:获取待分析的井场作业视频对应的低级融合特征;获取低级融合特征对应的视频模态全局时空特征;获取单帧图像模态的像素级细粒度局部特征;将视频模态的全局时空特征和单帧图像模态的像素级细粒度局部特征输入多模态特征渐进融合模块,得到多模态融合特征;将多模态融合特征输入基于多模态特征的多任务解码器模块,得到井场作业视频的安全分析结果。本发明能够精准有效地实现井场视频的安全分析,提升了安全监控的准确性和实时性。
技术关键词
交叉注意力机制
多模态特征
井场作业
融合特征
时空注意力机制
视频
全局特征提取
分析方法
图像编码器
特征提取模块
关键帧图像提取
多任务
解码器
像素
表达式
系统为您推荐了相关专利信息
融合特征
检测计数方法
引入注意力机制
多尺度特征融合
多尺度特征提取
车辆轨迹预测方法
交通流
轨迹特征
车辆轨迹数据
融合特征
威胁检测方法
LSTM模型
动态融合方法
隐私保护方法
融合特征
物理
交叉注意力机制
深度卷积神经网络结构
数码
融合神经网络
海洋哺乳动物
分割检测方法
图像语义分割网络
信号
解码器架构