摘要
本发明公开了一种基于深度学习的多视角动作识别方法及装置,该方法包括:获取包含人体的多视角图像,基于预训练的YOLOv5模型提取图像中的人体位置区域并进行预处理;构建多视角动作识别模型,所述多视角动作识别模型结构包括:多视角感知层、Backbone骨干网络层和输出层;使用经预处理后的数据对所述多视角动作识别模型进行训练;将所述预训练的YOLOv5模型和训练完成的多视角动作识别模型,进行部署;将待处理的图像作为输入,实现人体多视角动作识别。该方法能够有效地克服存在遮挡和视角变化对动作识别的影响,从而提高了动作识别的准确性和鲁棒性;可适用于各种复杂的场景。
技术关键词
动作识别模型
动作识别方法
多视角
图像
计算机程序指令
注意力
人体动作特征
通道
动作识别装置
空间特征信息
语义特征
通信接口
处理器
可读存储介质
模块
存储器
分支
网络结构
系统为您推荐了相关专利信息
温度采集器
密封圈
视觉检测单元
流量检测单元
图像识别算法
数据库生成方法
大语言模型
云端服务器
风格
文本编码器
历史数据特征
识别方法
云数据中心
特征提取器
实时数据
显示屏
监控视频流
故障检测模型
故障检测方法
校正