摘要
本发明公开一种通过人类语音匹配数字人偶形像手部动作的方法和系统,包括步骤:S1,采集包含不同语音指令的语音数据以及相对应的数字人偶手部动作数据,进行配对标注处理;S2,对语音数据和手部动作数据进行特征提取,转换为特征向量;S3,将数据集划分为训练集、验证集和测试集进行模型训练得到语音‑动作匹配模型;S4,接收用户的语音输入,对输入的语音进行特征提取,使用训练好的语音‑动作匹配模型预测与该语音输入相匹配的手部动作,并将预测的手部动作应用于数字人偶形象,在数字人偶形像上实时展示预测的手部动作。本发明通过深度学习模型和多模态特征提取技术,实现了语音与手部动作的高精度匹配,显著提升了动作生成的流畅性和自然度。
技术关键词
人偶
语音特征提取
语音采集模块
模型训练模块
特征提取模块
人类
训练集
特征提取技术
高维特征向量
实时数据传输
特征提取方法
分布式架构
深度学习模型
音频
控制系统
信号
样本
系统为您推荐了相关专利信息
变压器绕组
定位故障
深度学习模型
电流采集模块
深度学习分析