摘要
一种基于Agent协作的AIGC长视频稳定生成方法及系统,涉及计算机技术领域。包括如下步骤:获取用户输入的剧本文字内容;采用预置的prompt预训练“剧组工作人员”Agent;将用户输入的剧本文字内容转换成分镜脚本,提取对话;从用户输入的剧本提取角色和场景的描述;从角色和场景的描述转换成Stable Diffusion的标准prompt;生成角色和场景的设定图;根据角色描述从音色库中选择符合角色设定的音色;音色克隆预训练模型从音色和对话文字生成对话音频;根据对话音频和角色图生成对话的视频;根据分镜脚本和对话视频剪辑成片。比起现有方法极大地提升AIGC长视频生成的角色一致性和视频质量稳定性。
技术关键词
视频稳定
生成方法
生成视频片段
多视角
大语言模型
全景图
脚本
方位角
预训练模型
音频
图片
生成系统
提示技术
色彩校正
生成场景
拼接模块
镜头
系统为您推荐了相关专利信息
海报生成方法
生成结构化数据
训练样本数据
视觉特征提取
对象
网络模拟方法
动态拓扑结构
动态演化过程
核心
链接预测方法
图像生成方法
光束
高精度映射关系
学习方式优化
多层次特征