一种数字人实时交互系统及数字人实时交互方法

正文

推荐专利

申请号：CN202411546004

申请日期：2024-10-31

公开号：CN119440254A

公开日期：2025-02-14

类型：发明专利

摘要

本申请公开了一种数字人实时交互系统及方法。交互系统包括终端设备和云端服务器。终端设备接收用户输入的语音并传输至云端服务器。云端服务器包括视频采集与处理模块、智能问答与语音生成模块、音频处理模块和图像渲染模块。视频采集与处理模块采集指示数字人形象的对象的原始视频数据，并生成连续图像帧。智能问答与语音生成模块将该语音转换为文本；对文本进行语义分析，理解用户意图，并生成相应的回复文本；还将该回复文本转换为回复语音。音频处理模块对回复语音和连续图像帧进行处理，生成第一视频数据。图像渲染模块将第一视频数据与虚拟背景相融合，并对融合后的视频进行实时处理，以生成响应视频。终端设备输出该响应视频。

技术关键词

云端服务器语音文本终端设备交互系统视频输出模块渲染技术音频信号处理模块图像数据预训练模型对话状态追踪对象频谱特征意图视觉特征视频处理单元

系统为您推荐了相关专利信息

一种基于语音识别智能电子秤的数据处理系统

智能电子秤数据处理系统存储库信号预处理模块销量预测模型

问答方法、装置、设备和存储介质

文本实体关系抽取问答方法知识图谱构建语句

歌曲推荐模型训练方法、歌曲推荐方法及相关产品

音频特征三元组融合特征歌曲推荐方法样本

图像修复方法、装置、电子设备及计算机可读存储介质

语义特征文本融合特征交叉注意力机制图像修复方法

一种屏幕亮度调节方法

屏幕亮度调节方法脉冲宽度调制占空比亮度补偿模型环境光条件屏幕显示内容

一种数字人实时交互系统及数字人实时交互方法

站点导航

APP 下载