一种3D数字人实时对话交互系统及方法

正文

推荐专利

一种3D数字人实时对话交互系统及方法

申请号：CN202411930319

申请日期：2024-12-26

公开号：CN119783689A

公开日期：2025-04-08

类型：发明专利

摘要

本发明公开了一种3D数字人实时对话交互系统及方法，通过获取用户输入的语音信号，将语音信号经过语音识别模型进行识别处理得到文本数据，输入到文本生成模型并输出语音文本数据，输入到语音合成模型并输出语音合成数据，将语音合成数据输入到3D表情生成模型并输出3D表情数据，根据语音信号和3D表情数据构建声音克隆模型并输出人声音频数据，对声音克隆模型进行微调并保存微调参数数据，使用户与数字人展开流畅、自然的对话，确保沟通的及时性和连贯性，极大地提升用户体验；通过接入知识库使数字人拥有海量的知识储备，为用户提供有价值的建议和指导，用户可个性化设置数字人的人物背景，增强了用户与数字人之间的情感连接。

技术关键词

对话交互系统语音识别模型文本生成模型语音特征信息情感分类模型个性化特征时序卷积神经网络识别算法对话交互方法核心算法信号数据存储向量空间模型语音识别单元参数

系统为您推荐了相关专利信息

一种页面操作方法及相关装置

文本生成模型页面操作方法意图识别模型点击工具多轮对话

语音处理方法、装置、计算机设备、可读存储介质和程序产品

语义理解模型情感类别情感分类模型语音识别模型文本

内容标签生成方法、装置、电子设备及存储介质

标签生成方法文本生成模型模态特征注意力标签文本

一种基于上下文适应器和偏置损失的语音识别方法及系统

语音识别模型多头注意力机制文本语音识别方法大规模语音数据

融入字符空间特征的缅甸语文本图像生成方法及装置

图像生成方法图像生成模型字符后处理模块文本图像识别

一种3D数字人实时对话交互系统及方法

站点导航

APP 下载