基于模块化网络的动态视角视频生成方法和装置

正文

推荐专利

申请号：CN202511118458

申请日期：2025-08-11

公开号：CN120916005A

公开日期：2025-11-07

类型：发明专利

摘要

本申请提供了一种基于模块化网络的动态视角视频生成方法和装置，涉及人工智能技术领域，旨在生成了与用户指令相匹配的多场景的动态视角长视频。所述方法包括：通过大语言模型将用户指令解析为多个场景，每个场景包括场景描述和场景转换指令，所述场景转换指令表征场景间的转换方式；根据所述场景转换指令选择模块化场景转换器，所述模块化场景转换器用于使生成的视频具有场景转换指令对应的转换方式；将控制图像和所述场景描述作为控制信息，通过基视频生成器和所述模块化场景转换器依次生成各个场景的视频，所述控制图像为上一场景的视频的最后一帧图像；将各个场景的视频进行拼接，得到与所述用户指令相匹配的多场景动态视角视频。

技术关键词

转换器噪声大语言模型注意力机制视频生成方法指令表征场景编码器视角图像动态视频生成装置样本人工智能技术生成场景解码器拼接模块网络

系统为您推荐了相关专利信息

基于大语言模型的云端智能主动防御方法

主动防御方法大语言模型策略云端任务分配执行

网络部署方法、装置、计算机可读存储介质和产品

网络部署方法施工现场数据通信信道通信网络施工设备

电能表数据系统的电力负荷预测方法及介质

电力负荷预测方法电能表粒子神经网络模型数据

一种睡眠呼吸暂停综合征自动检测装置

自动检测装置睡眠呼吸暂停检测信号特征提取特征提取模块信号采集模块

一种智能增高架

语音识别模块灯条控制主控电路模块 USB接口模块语音控制指令

基于模块化网络的动态视角视频生成方法和装置

站点导航

APP 下载