基于大模型的数字人视频生成方法、装置、智能体、电子设备及存储介质

正文

推荐专利

申请号：CN202510536606

申请日期：2025-04-25

公开号：CN120302122A

公开日期：2025-07-11

类型：发明专利

摘要

本公开提供了基于大模型的数字人视频生成方法、装置、智能体、电子设备及存储介质，涉及人工智能技术领域，尤其涉及深度学习、大模型、计算机视觉等技术领域，可以应用于视频直播、广告制作、电商销售等场景。基于大模型的数字人视频生成方法包括：获取需求信息，需求信息包括用于描述指定的动作视频片段的动作描述信息，动作视频片段表征目标对象的指定动作；利用语言大模型处理需求信息，得到目标剧本，目标剧本包括与动作描述信息相匹配的目标口播片段文本；利用视觉大模型处理目标剧本和动作视频片段，得到用于显示目标对象在执行指定动作过程中，基于目标口播片段文本进行口播的目标视频。

技术关键词

过渡动作视频生成方法文本韵律特征语音动态对象属性信息指令视频生成装置视觉意图输入模块数据电子设备处理器音频人工智能技术计算机

系统为您推荐了相关专利信息

一种多模型跨维度的图像生成方法

图像生成方法生成高质量图像插件模型多模型风格

问答语料生成方法、装置及相关设备

问答语料生成方法文本大语言模型层级摘要

知识数据存储和管理方法、装置、设备及存储介质

生成知识文本 BERT模型管理系统管理方法

视频描述文本生成方法、装置、计算机设备和存储介质

特征提取模型文本生成方法融合特征神经网络模型视频

一种自媒体内容发布审核校验方法及系统

校验方法服务器内容识别引擎语义媒体

基于大模型的数字人视频生成方法、装置、智能体、电子设备及存储介质

站点导航

APP 下载