摘要
一种基于深度学习的网球动作识别方法和装置,其方法包括:通过声学事件检测定位网球击球时刻,提取一定数量的帧输入动作识别网络之中;使用卷积神经网络对待检测的网球技术动作视频序列中的每一帧进行空间特征提取,使用可变形卷积捕获与物体形变相关的特征,通过通道注意力对空间特征进行增强,聚焦关键特征,得到能够代表球员运动信息的特征向量;将每一帧的空间特征向量输入Transformer中以计算它们在时间上的关联,使用相对位置编码模拟不同帧动作之间的偏差程度,加强不同帧之间的关联性,最后使用多层感知机作为分类器进行技术动作分类。本发明通过声学事件检测以定位击球时刻,结合卷积神经网络以及Transformer分开处理空间信息以及时间信息,使用多层感知机作为分类器。通过这种方法,能够高效、快速的识别出网球运动员所使用的技术动作。
技术关键词
动作识别方法
多层感知机
卷积神经网络模块
卷积模块
网球技术
空间特征提取
变形卷积网络
分类器
动作识别装置
通道注意力机制
网络主体
编码
序列
处理器通信
指令
系统为您推荐了相关专利信息
手术机器人
触觉反馈系统
线圈模块
人体组织器官
非暂态计算机可读存储介质
手势识别方法
文本编码器
人体关键点
多模态手势
行人检测模型
无人机巡检
图片
样本
识别方法
卷积神经网络模块
查询执行计划
估计方法
注意力机制
节点特征
数据库查询优化技术
深度特征提取
特征提取能力
图像
网络结构
检测网络模型