摘要
本发明公开的一种手物交互的识别方法、系统和设备,涉及手物交互技术领域,通过构建手势描述数据集;所述手势描述数据集包括若干手势姿态的骨架描述文本;根据传统视觉语言模型,对手部骨架模态、视觉模态和语言模态进行融合,建立初始手物交互识别模型;采用所述手势描述数据集训练所述初始手物交互识别模型,得到手物交互识别模型;将待识别图像输入至所述手物交互识别模型中,得到所述待识别图像中的手物交互动作描述。采用本发明实施例,能够结合待识别图像中的骨架信息、语言和视觉信息,更好地理解手部细节,从而提高手物交互任务的性能。
技术关键词
骨架特征
手势
识别方法
文本
注意力机制
多层感知机
图像
注意力模型
视觉
交互动作
数据
子模块
前馈神经网络
模型训练模块
关节
交互技术
识别设备
识别系统
滑动窗口
系统为您推荐了相关专利信息
资源管理方法
接口
文本
排序融合算法
语音输入识别
水印嵌入方法
动态生成水印
生成随机数
大语言模型
分析模块
性能预测模型
管理方法
组装机器人
自然语言模型
轨迹
邮件内容生成方法
大语言模型
推理平台
格式化
内容生成系统