一种数字人实时交互系统及数字人实时交互方法

AITNT
正文
推荐专利
一种数字人实时交互系统及数字人实时交互方法
申请号:CN202411546004
申请日期:2024-10-31
公开号:CN119440254A
公开日期:2025-02-14
类型:发明专利
摘要
本申请公开了一种数字人实时交互系统及方法。交互系统包括终端设备和云端服务器。终端设备接收用户输入的语音并传输至云端服务器。云端服务器包括视频采集与处理模块、智能问答与语音生成模块、音频处理模块和图像渲染模块。视频采集与处理模块采集指示数字人形象的对象的原始视频数据,并生成连续图像帧。智能问答与语音生成模块将该语音转换为文本;对文本进行语义分析,理解用户意图,并生成相应的回复文本;还将该回复文本转换为回复语音。音频处理模块对回复语音和连续图像帧进行处理,生成第一视频数据。图像渲染模块将第一视频数据与虚拟背景相融合,并对融合后的视频进行实时处理,以生成响应视频。终端设备输出该响应视频。
技术关键词
云端服务器 语音 文本 终端设备 交互系统 视频输出模块 渲染技术 音频信号处理模块 图像 数据 预训练模型 对话状态追踪 对象 频谱特征 意图 视觉特征 视频处理单元
系统为您推荐了相关专利信息
1
一种基于语音识别智能电子秤的数据处理系统
智能电子秤 数据处理系统 存储库 信号预处理模块 销量预测模型
2
问答方法、装置、设备和存储介质
文本 实体关系抽取 问答方法 知识图谱构建 语句
3
歌曲推荐模型训练方法、歌曲推荐方法及相关产品
音频特征 三元组 融合特征 歌曲推荐方法 样本
4
图像修复方法、装置、电子设备及计算机可读存储介质
语义特征 文本 融合特征 交叉注意力机制 图像修复方法
5
一种屏幕亮度调节方法
屏幕亮度调节方法 脉冲宽度调制占空比 亮度补偿模型 环境光条件 屏幕显示内容
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号