一种基于多模态大模型的无人机视频合成方法

正文

推荐专利

申请号：CN202510275079

申请日期：2025-03-10

公开号：CN119893287A

公开日期：2025-04-25

类型：发明专利

摘要

本申请涉及视频合成技术领域，提供一种基于多模态大模型的无人机视频合成方法。所述方法包括：通过无人机拍摄基础视频，接收用户视频喜好指令；解析指令，获取拍摄姿态参数、主体及关键帧，根据拍摄姿态参数和无人机实时姿态参数生成姿态调整方案，包含调整时间；提取基础视频中的关联主体视频，预测关键帧时间；若关键帧时间早于调整时间，优化方案，获得最优调整时间并调整姿态；否则按原方案调整并采集影像；通过多模态大模型生成合成内容，分析关键影像位置并合成，输出无人机视频合成结果，以解决无人机视频拍摄过程中难以根据用户个性化需求实时调整拍摄姿态，以及视频内容合成难以精准匹配用户期望的技术问题。

技术关键词

拍摄主体关键帧视频样本多模态参数指令解析器影像无人机姿态位置识别器基础分析器控制器

系统为您推荐了相关专利信息

一种基于机器学习技术的实验室数据分析方法及系统

数据分析方法机器学习技术孤立森林算法生成对抗网络模型实验室数据采集

电力设备多物理场孪生模型的动态更新方法、装置、设备、存储介质和程序产品

预训练模型电力设备样本油浸式电力变压器动态更新方法

一种文本流实体同义词实时挖掘方法及装置

同义词挖掘方法文本 sigmoid函数样本

一种数据传输方法及用于无人矿卡远程接管的数据传输系统

数据传输方法拥塞控制算法接收端数据传输系统状态机

一种基于大模型的智能问答方法及系统

意图类别关键词智能问答方法语义对象

一种基于多模态大模型的无人机视频合成方法

站点导航

APP 下载