多模态一体式的数字人生成方法、装置、设备及介质

正文

推荐专利

申请号：CN202410865012

申请日期：2024-06-28

公开号：CN118644594A

公开日期：2024-09-13

类型：发明专利

摘要

本发明提出一种多模态一体式的数字人生成方法、装置、设备及存储介质，应用于金融领域，该方法包括获取多个模态的数据源信息，提取所述多个模态的数据源信息的特征，生成语音特征信息、文本特征信息和视频图像特征信息；对所述语音特征信息、文本特征信息和视频图像特征信息进行信号重组，生成口型信息基本单元、面部信息基本单元和身体信息基本单元以及语音信息基本单元；对所述口型信息基本单元、所述面部信息基本单元、所述身体信息基本单元以及所述语音信息基本单元进行对齐，并生成核心数据；基于所述核心数据和预设的渲染需求生成多模态一体式的数字人。

技术关键词

视频图像特征语音特征信息生成方法情绪特征面部身体多模态生成语音数据文本核心人脸检测技术识别模块电子装置对齐模块电子设备处理器通信

系统为您推荐了相关专利信息

一种基于智能座舱的心理咨询服务方法、装置及车辆

多模态环境辅助心理咨询心理咨询服务装置车辆行驶数据智能座舱

测试功能库的生成方法、装置、设备及存储介质

格式模板拓扑图生成方法关键词测试管理技术

基于图像特征识别的自动化AI图像生成方法及系统

偏移特征图像特征识别语义图像生成方法编码器

一种地形处理方法、装置和电子设备

三维模型射线网格模型生成方法生成高度

一种基于风格转换的伪声呐水下坝体裂缝图像生成方法

图像生成网络图像生成方法风格补丁坝体

多模态一体式的数字人生成方法、装置、设备及介质

站点导航

APP 下载