一种基于深度学习的多视角动作识别方法和装置

正文

推荐专利

申请号：CN202411078050

申请日期：2024-08-07

公开号：CN119131887A

公开日期：2024-12-13

类型：发明专利

摘要

本发明公开了一种基于深度学习的多视角动作识别方法及装置，该方法包括：获取包含人体的多视角图像，基于预训练的YOLOv5模型提取图像中的人体位置区域并进行预处理；构建多视角动作识别模型，所述多视角动作识别模型结构包括：多视角感知层、Backbone骨干网络层和输出层；使用经预处理后的数据对所述多视角动作识别模型进行训练；将所述预训练的YOLOv5模型和训练完成的多视角动作识别模型，进行部署；将待处理的图像作为输入，实现人体多视角动作识别。该方法能够有效地克服存在遮挡和视角变化对动作识别的影响，从而提高了动作识别的准确性和鲁棒性；可适用于各种复杂的场景。

技术关键词

动作识别模型动作识别方法多视角图像计算机程序指令注意力人体动作特征通道动作识别装置空间特征信息语义特征通信接口处理器可读存储介质模块存储器分支网络结构

系统为您推荐了相关专利信息

一种用于固液连铸复合炉加料的辅助装置

温度采集器密封圈视觉检测单元流量检测单元图像识别算法

一种根瘤尺寸的检测方法、系统、设备及介质

大豆尺寸像素标签模型训练模块

基于大语言模型的材质图像数据库生成方法及系统

数据库生成方法大语言模型云端服务器风格文本编码器

一种基于图像识别的餐品识别方法及系统

历史数据特征识别方法云数据中心特征提取器实时数据

显示屏故障检测方法、系统、装置和存储介质

显示屏监控视频流故障检测模型故障检测方法校正

一种基于深度学习的多视角动作识别方法和装置

站点导航

APP 下载