一种基于多模态大模型的数字人视频生成方法

AITNT
正文
推荐专利
一种基于多模态大模型的数字人视频生成方法
申请号:CN202510546751
申请日期:2025-04-28
公开号:CN120472059A
公开日期:2025-08-12
类型:发明专利
摘要
本发明属于虚拟人物生成技术领域,具体涉及一种基于多模态大模型的数字人视频生成方法,所述视频生成方法包括以下步骤:步骤1.多模态数据体系构建;步骤2.多模态大模型训练与适配;步骤3.数字人三维模型构建;步骤4.语义解析与模态映射;步骤5.时序化动作与口型生成;步骤6.虚拟场景搭建与渲染;步骤7.音视频同步渲染与合成;步骤8.质量优化与缺陷修复;步骤9.用户交互与迭代优化。该发明通过技术创新与工程化落地,解决了数字人视频生成中的核心痛点,为虚拟主播、智能客服、企业培训等场景提供了高效、逼真、可定制的内容生产能力,推动AI数字人技术从实验走向大规模商业应用。
技术关键词
视频生成方法 多模态 虚拟场景搭建 语义 面部 音频 生成上下文感知 音视频 人脸模型 三维模型 动作捕捉数据 语音特征 参数 文本情感分析 光照鲁棒性 人体动力学 交叉注意力机制 视频流
系统为您推荐了相关专利信息
1
一种基于多模态特征融合的通用场景检索分析方法及系统
多模态特征融合 检索分析系统 检索分析方法 视频分析 视觉问答模型
2
一种基于自然语言描述的遥感图像检索方法、设备及介质
检索句子 遥感图像检索方法 图像检索模型 预训练语言模型 图像视觉特征向量
3
三维模型单体化和语义化分割方法、装置、设备和介质
分割方法 三维模型 图像 贴图 语义
4
一种基于人工智能的工业图像变化异常检测方法及系统
异常检测方法 二维快速傅里叶变换 重建误差 双线性插值 工业
5
一种用于人机交互体验感优化的智能反馈调控方法
人机交互体验 调控方法 信号 车辆行驶信息 脑电波信息
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号