一种交互式多轮对话数字人建模系统和方法

正文

推荐专利

一种交互式多轮对话数字人建模系统和方法

申请号：CN202510364366

申请日期：2025-03-26

公开号：CN120279176A

公开日期：2025-07-08

类型：发明专利

摘要

本发明涉及一种交互式多轮对话数字人建模方法，包括：提取交互式多轮对话场景下的双人多模态特征，包括当前对话轮次下说话人的语音特征和表情特征，以及当前对话轮次下聆听者在上一对话轮次中的语音特征；基于时间维度对提取的所述双人多模态特征进行时序对齐和强化，得到联合特征序列；根据所述联合特征序列，基于融合注意力机制的编解码器，生成当前对话轮次下聆听者的语音文本以及相同步的表情参数；根据当前对话轮次下聆听者的表情参数，生成对应的3D面部动画帧序列。

技术关键词

多轮对话场景多模态特征语音特征融合注意力机制表情特征双人人脸三维建模方法人脸表情序列编解码器双向长短期记忆网络参数建模系统语音活动检测说话人身份音频编码器

系统为您推荐了相关专利信息

一种基于多源异构数据融合的心衰风险预测方法及系统

多源异构数据融合风险预测模型风险预测方法多维特征数据多模态特征

洗衣机的偏心检测方法、装置、电子设备及洗衣设备

偏心检测方法多模态特征融合特征一维卷积神经网络深度学习模型

基于多模态表征优化融合的网络交易假冒商品智能识别方法

智能识别方法文本编码器图像编码器分类识别模型多模态特征

基于多模态特征融合与贝叶斯优化的甲状腺癌病理图像分类方法及系统

病理图像分类方法甲状腺超声图像多模态特征融合局部二值模式特征甲状腺结节良恶性

灾害预警方法、装置及电子设备

拓扑特征多模态特征预警模型语义向量三元组损失函数

一种交互式多轮对话数字人建模系统和方法

站点导航

APP 下载