摘要
本发明公开了一种手势识别的方法和装置,涉及计算机视觉和人机交互技术领域。该方法的一具体实施方式包括:获取待识别手势的多模态视觉数据,并对多模态视觉数据进行特征提取得到视觉特征;基于提示词模板构建各个手势的提示词,并对各个手势的提示词进行特征提取得到文本特征;根据视觉特征和文本特征计算多模态视觉数据和各个手势的提示词的相似度,并根据相似度确定手势识别结果。该实施方式提高了手势识别的准确率、鲁棒性与可扩展性。
技术关键词
手势
深度图像数据
三维坐标信息
多模态
关节点
文本
手掌
视觉特征提取
训练语言模型
人机交互技术
模板
处理器
编码
特征提取模块
变换器
计算机程序产品
系统为您推荐了相关专利信息
智能识别方法
多模态数据融合
特征选择算法
基因测序数据
生物信息数据分析技术
多线激光雷达
惯性传感器
数据融合算法
视觉里程计
视觉同步定位
信息处理模型
音频单元
多模态信息
样本
语音输入信息