摘要
本发明提出一种多模态一体式的数字人生成方法、装置、设备及存储介质,应用于金融领域,该方法包括获取多个模态的数据源信息,提取所述多个模态的数据源信息的特征,生成语音特征信息、文本特征信息和视频图像特征信息;对所述语音特征信息、文本特征信息和视频图像特征信息进行信号重组,生成口型信息基本单元、面部信息基本单元和身体信息基本单元以及语音信息基本单元;对所述口型信息基本单元、所述面部信息基本单元、所述身体信息基本单元以及所述语音信息基本单元进行对齐,并生成核心数据;基于所述核心数据和预设的渲染需求生成多模态一体式的数字人。
技术关键词
视频图像特征
语音特征信息
生成方法
情绪特征
面部
身体
多模态
生成语音
数据
文本
核心
人脸检测技术
识别模块
电子装置
对齐模块
电子设备
处理器通信
系统为您推荐了相关专利信息
多模态环境
辅助心理咨询
心理咨询服务装置
车辆行驶数据
智能座舱
偏移特征
图像特征识别
语义
图像生成方法
编码器