摘要
一种面向人机交互的手部动作识别方法,首先充分挖掘视频帧序列的视觉特征,通过帧间运动注意力机制动态提取帧间的运动信息及帧的外观特征;接着利用帧内静态注意力和帧间动态注意力相结合的方式增强时序特征;最后使用CTC束搜索解码方法预测视频对应机器指令,将机器指令传送给机器人,机器人根据指令进行相关动作。本发明考虑了手部动作识别中帧间运动信息和帧的外观特征,充分利用手部动作视频的时序信息,提高了面向人机交互的手部动作识别的适用性和准确性。
技术关键词
搜索解码方法
手部动作识别方法
面向人机交互
机器人
完整运动轨迹
融合特征
指令
视觉特征
时序特征
注意力机制
视频帧特征
动态
邻域
坐标
序列
系统为您推荐了相关专利信息
转运机器人
三轴压力传感器
自动化装置
支撑底座
控制柜
清洁设备
散热风道
气流发生器
机械臂组件
移动平台
滚珠花键直线轴承
视觉定位系统
机器人视觉系统
真空发生器
转运装置控制系统
协方差矩阵估计
LSTM模型
融合定位方法
传感器融合
载体