摘要
本申请涉及视频合成技术领域,提供一种基于多模态大模型的无人机视频合成方法。所述方法包括:通过无人机拍摄基础视频,接收用户视频喜好指令;解析指令,获取拍摄姿态参数、主体及关键帧,根据拍摄姿态参数和无人机实时姿态参数生成姿态调整方案,包含调整时间;提取基础视频中的关联主体视频,预测关键帧时间;若关键帧时间早于调整时间,优化方案,获得最优调整时间并调整姿态;否则按原方案调整并采集影像;通过多模态大模型生成合成内容,分析关键影像位置并合成,输出无人机视频合成结果,以解决无人机视频拍摄过程中难以根据用户个性化需求实时调整拍摄姿态,以及视频内容合成难以精准匹配用户期望的技术问题。
技术关键词
拍摄主体
关键帧
视频
样本
多模态
参数
指令解析器
影像
无人机姿态
位置识别器
基础
分析器
控制器
系统为您推荐了相关专利信息
数据分析方法
机器学习技术
孤立森林算法
生成对抗网络模型
实验室数据采集
预训练模型
电力设备
样本
油浸式电力变压器
动态更新方法
数据传输方法
拥塞控制算法
接收端
数据传输系统
状态机