摘要
本发明提供基于改进特征融合机制的现场作业行为识别方法及装置,包括对目标作业行为采集包含预设动作特征的多个视频片段,对视频片段进行目标检测识别出人物及设备关键空间区域,截取包含人物及设备关键空间区域的第一特征图像集合成的第一特征图像集,对各个第一特征图像中不同层次的特征进行多层特征融合获取第二特征图像集合成第二特征图像集,将第二特征图像集前向传播与反向传播的加权平均值作为最终识别图像,直到输出所有视频片段分别对应的最终识别图像集合成图像识别集,建立深度学习模型对图像识别集进行训练对现场的目标作业行为进行现场作业行为识别。本发明能够实时现场作业自动化识别,防止误报和漏报,便于自动化管理和预警。
技术关键词
深度学习模型
识别方法
多层特征融合
动作特征
视频
注意力
机制
图像获取模块
网络
非暂态计算机可读存储介质
处理器
计算机程序产品
通道
识别装置
算法
存储器
电子设备
系统为您推荐了相关专利信息
分层
多头注意力机制
多任务深度学习模型
力学
蒙特卡洛
视觉特征提取
跨模态
文本特征向量
摘要
深度学习模型
语音识别方法
构建语音识别模型
语义特征
解码器
文本识别