一种多模态数字人生成方法和系统

正文

推荐专利

一种多模态数字人生成方法和系统

申请号：CN202411476903

申请日期：2024-10-22

公开号：CN119400152A

公开日期：2025-02-07

类型：发明专利

摘要

本发明公开了一种多模态数字人生成方法和系统，包括：图片生成数字人模块、视频生成数字人模块和视频翻译模块；涉及深度合成技术领域，解决了现有技术的数字人生成方式的扩展性和灵活性不高的技术问题；本发明通过对参考图像进行处理生成得到3D面部模型；基于脸部渲染器和外观编码器将运动系数和第一音频信号生成第一数字人；从原始视频中提取出指定时长的音频并标记为原始音频；将翻译文本转换为对应的目标音频，将目标音频与原始视频合成为翻译视频。本发明通过3DMM技术将参考图像生成得到3D面部模型，使得3D面部模型能够保持人物的身份特征并生成自然的动态表情，有利于提高生成的数字人与用户之间的互动体验。

技术关键词

关键点生成数字人生成系统面部多模态视频姿态先验图像文本编码器信号语音识别模型序列生成方法姿态特征对齐模块音频特征头部姿态信息

系统为您推荐了相关专利信息

一种课堂情绪识别方法、装置、介质和设备

情绪识别方法教学场景文本特征向量图像特征向量情绪识别技术

一种AI驱动的交互式数字人构建方法及系统

交互式数字生成对抗网络多模态数据库混合聚类算法多模态数据采集

基于智能声光电协同的焊接材料高温抗裂性能测试方法

光信号采集装置电信号检测装置焊接材料性能测试方法试件

企业政策定制化报告生成方法

报告生成方法表达式关键词变量逻辑

数据标注方法、自动驾驶模型的训练方法和相关设备

占用栅格数据标注方法传感器非易失性计算机可读存储介质遮挡关系

一种多模态数字人生成方法和系统

站点导航

APP 下载