一种通过人类语音匹配数字人偶形像手部动作的方法和系统

正文

推荐专利

申请号：CN202510403452

申请日期：2025-04-01

公开号：CN120544594A

公开日期：2025-08-26

类型：发明专利

摘要

本发明公开一种通过人类语音匹配数字人偶形像手部动作的方法和系统，包括步骤：S1，采集包含不同语音指令的语音数据以及相对应的数字人偶手部动作数据，进行配对标注处理；S2，对语音数据和手部动作数据进行特征提取，转换为特征向量；S3，将数据集划分为训练集、验证集和测试集进行模型训练得到语音‑动作匹配模型；S4，接收用户的语音输入，对输入的语音进行特征提取，使用训练好的语音‑动作匹配模型预测与该语音输入相匹配的手部动作，并将预测的手部动作应用于数字人偶形象，在数字人偶形像上实时展示预测的手部动作。本发明通过深度学习模型和多模态特征提取技术，实现了语音与手部动作的高精度匹配，显著提升了动作生成的流畅性和自然度。

技术关键词

人偶语音特征提取语音采集模块模型训练模块特征提取模块人类训练集特征提取技术高维特征向量实时数据传输特征提取方法分布式架构深度学习模型音频控制系统信号样本

系统为您推荐了相关专利信息

图像处理方法及装置

特征值图像处理模型子模块对象图像处理方法

一种基于教育平台大数据分析的个性化自适应学习系统

学习方法成绩节点平台系统集成模块

一种基于神经网络去噪的远同源蛋白质搜索方法、系统、终端及存储介质

搜索方法列表隐马尔可夫模型序列矩阵

一种恶意攻击流量的生成方法、装置及电子设备

数据交互关系网络防御系统实体生成方法参数

一种精准定位故障的供电远动检测系统

变压器绕组定位故障深度学习模型电流采集模块深度学习分析

一种通过人类语音匹配数字人偶形像手部动作的方法和系统

站点导航

APP 下载