摘要
本公开提供了一种基于大模型的视频生成方法、装置、智能体、设备、介质、产品,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于数字人、基于人工智能的内容生成等场景。该基于大模型的视频生成方法包括:通过将参考内容与第一视频片段进行时序对齐,确定至少两个参考视频帧,其中,第一视频片段是根据参考内容从参考视频中提取的,参考内容指示了与参考视频中的目标对象相关的参考变化过程;将第一视频片段和第二视频片段进行拼接,得到目标视频,其中,第二视频片段是利用视频生成大模型处理参考内容和至少两个参考视频帧得到的,目标视频中目标对象的至少一个区域的变化过程与参考变化过程相匹配。
技术关键词
视频帧
视频生成方法
对象
文本
时序
视频生成装置
场景
输入模块
语义
人工智能技术
对齐模块
声纹特征
计算机程序产品
处理器
计算机视觉
关系
音频
指令
系统为您推荐了相关专利信息
大语言模型
工作流
json格式数据
生成结构化数据
文本
短期预测方法
分布式光伏
高斯核函数
功率
预测误差
网络安全风险
网络数据预测
卷积神经网络模型
网络流量数据
层次分析法