摘要
本发明公开了一种基于视频分析的智慧充装流程作业监测方法,涉及充装流程作业监测领域。包括获取充装作业区域的多模态视频数据流;对各模态图像序列进行时间同步与空间配准处理,生成同步多模态图像帧组;基于卷积神经网络分别提取各模态图像帧的局部视觉特征,并通过特征金字塔结构获取多尺度视觉特征图;利用跨模态注意力机制对多模态特征图进行交互式融合,生成统一的融合视觉特征表示;将融合视觉特征输入至目标检测模块,识别作业区域内人员姿态、设备状态及操作动作;基于识别出的动作序列与设备状态信息构建作业流程状态转移图;根据预设的标准流程路径对当前作业流程状态进行匹配验证。
技术关键词
作业监测方法
视频分析
融合视觉特征
模态特征
局部视觉特征
特征金字塔网络
设备状态信息
充装作业
时间同步
多层卷积神经网络
图像
多模态
序列
通道注意力机制
广度优先搜索
语义特征
生成多尺度
系统为您推荐了相关专利信息
视频分析
终端设备
节点
设备状态信息
一卡通门禁系统
土壤墒情数据
云端服务器
分布算法
卷积特征提取
多模态特征融合
查询特征
重识别方法
多模态特征
ROI图像
文本特征向量
多模态特征
标签
多模态数据融合
情感交互方法
跨模态