基于大模型的视频生成方法、装置、智能体、设备、介质、产品

正文

推荐专利

申请号：CN202511317862

申请日期：2025-09-15

公开号：CN121000950A

公开日期：2025-11-21

类型：发明专利

摘要

本公开提供了一种基于大模型的视频生成方法、装置、智能体、设备、介质、产品，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型等技术领域，可应用于数字人、基于人工智能的内容生成等场景。该基于大模型的视频生成方法包括：通过将参考内容与第一视频片段进行时序对齐，确定至少两个参考视频帧，其中，第一视频片段是根据参考内容从参考视频中提取的，参考内容指示了与参考视频中的目标对象相关的参考变化过程；将第一视频片段和第二视频片段进行拼接，得到目标视频，其中，第二视频片段是利用视频生成大模型处理参考内容和至少两个参考视频帧得到的，目标视频中目标对象的至少一个区域的变化过程与参考变化过程相匹配。

技术关键词

视频帧视频生成方法对象文本时序视频生成装置场景输入模块语义人工智能技术对齐模块声纹特征计算机程序产品处理器计算机视觉关系音频指令

系统为您推荐了相关专利信息

一种基于大语言模型的标准编审方法及系统

大语言模型工作流 json格式数据生成结构化数据文本

分布式接入电网的用户侧用电功率短期预测方法及系统

短期预测方法分布式光伏高斯核函数功率预测误差

一种基于细粒度适配器的视觉问答方法和系统

视觉问答方法矩阵图片适配器语义特征

一种基于人工智能与大数据的网络安全风险预测方法

网络安全风险网络数据预测卷积神经网络模型网络流量数据层次分析法

一种政务单向隔离的网络数据搜索方法及设备

网络数据搜索方法政务光闸集群专网

基于大模型的视频生成方法、装置、智能体、设备、介质、产品

站点导航

APP 下载