摘要
本申请涉及图像处理技术领域,具体而言,涉及一种基于哑语手势的车辆控制方法、产品、设备和存储介质。该方法包括获取用户的哑语手势视频流,并对所述哑语手势视频流进行手部识别与分割得到手部图像块序列;对所述手部图像块序列进行特征提取,得到视觉特征序列;对所述视觉特征序列进行手语识别,得到手语符号序列;将所述手语符号序列输入到大语言模型中,通过所述大语言模型对所述手语符号序列进行语义理解,并生成车辆控制指令。本申请可以准确识别哑语手势。
技术关键词
车辆控制方法
视觉特征
车辆控制指令
手势
序列
视频流
图像块
大语言模型
符号
手语特征
计算机程序产品
运动估计算法
语义特征
处理器
图像处理技术
系统为您推荐了相关专利信息
车削参数优化方法
TiAl合金
灰狼优化算法
灰狼算法
BP神经网络
文本检测方法
卷积模块
特征提取模型
多头注意力机制
压缩特征
稀疏深度图
车辆控制设备
神经网络模型
测距装置
坐标系
识别票据
多模态特征
文本
票据识别方法
视觉特征