摘要
本发明公开了一种基于DCViT模型的手势识别方法和装置,其中方法包括:获取已知对应手势类型的手势图像数据集,对其中各手势图像进行预处理并按比例划分获得训练集;以Vision Transformer模型为基本架构建立DCViT模型;其中,在Vision Transformer模型的前端添加可变形卷积模块,用于对DCViT模型的输入图像进行特征提取,而后再将提取得到的特征图输入至Vision Transformer模型;使用训练集数据对所述DCViT模型进行训练,得到手势识别分类器;利用手势识别分类器对待识别的手势图像进行识别分类。本发明能够更准确、高效地对手势图像中的手势进行识别分类。
技术关键词
手势识别方法
编码器模块
卷积模块
可变形卷积层
分类器
训练集数据
图像
编码模块
手势识别装置
多头注意力机制
模型训练模块
分类准确率
像素
线性
网络
系统为您推荐了相关专利信息
安全性检测
智能网络
深度学习神经网络模型
支持向量机参数
SVM分类器
语音编码器
ODE求解器
策略
声学模型建模
生成语音
模型训练方法
情感分类器
声音克隆技术
生成训练图像
图像解码器
特征提取网络
局部特征提取
识别方法
分类器训练
样本