多模态一体式的数字人生成方法、装置、设备及介质

AITNT
正文
推荐专利
多模态一体式的数字人生成方法、装置、设备及介质
申请号:CN202410865012
申请日期:2024-06-28
公开号:CN118644594A
公开日期:2024-09-13
类型:发明专利
摘要
本发明提出一种多模态一体式的数字人生成方法、装置、设备及存储介质,应用于金融领域,该方法包括获取多个模态的数据源信息,提取所述多个模态的数据源信息的特征,生成语音特征信息、文本特征信息和视频图像特征信息;对所述语音特征信息、文本特征信息和视频图像特征信息进行信号重组,生成口型信息基本单元、面部信息基本单元和身体信息基本单元以及语音信息基本单元;对所述口型信息基本单元、所述面部信息基本单元、所述身体信息基本单元以及所述语音信息基本单元进行对齐,并生成核心数据;基于所述核心数据和预设的渲染需求生成多模态一体式的数字人。
技术关键词
视频图像特征 语音特征信息 生成方法 情绪特征 面部 身体 多模态 生成语音 数据 文本 核心 人脸检测技术 识别模块 电子装置 对齐模块 电子设备 处理器通信
系统为您推荐了相关专利信息
1
一种基于智能座舱的心理咨询服务方法、装置及车辆
多模态环境 辅助心理咨询 心理咨询服务装置 车辆行驶数据 智能座舱
2
测试功能库的生成方法、装置、设备及存储介质
格式模板 拓扑图 生成方法 关键词 测试管理技术
3
基于图像特征识别的自动化AI图像生成方法及系统
偏移特征 图像特征识别 语义 图像生成方法 编码器
4
一种地形处理方法、装置和电子设备
三维模型 射线 网格 模型生成方法 生成高度
5
一种基于风格转换的伪声呐水下坝体裂缝图像生成方法
图像生成网络 图像生成方法 风格 补丁 坝体
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号