一种基于多模态大模型的无人机视频合成方法

AITNT
正文
推荐专利
一种基于多模态大模型的无人机视频合成方法
申请号:CN202510275079
申请日期:2025-03-10
公开号:CN119893287A
公开日期:2025-04-25
类型:发明专利
摘要
本申请涉及视频合成技术领域,提供一种基于多模态大模型的无人机视频合成方法。所述方法包括:通过无人机拍摄基础视频,接收用户视频喜好指令;解析指令,获取拍摄姿态参数、主体及关键帧,根据拍摄姿态参数和无人机实时姿态参数生成姿态调整方案,包含调整时间;提取基础视频中的关联主体视频,预测关键帧时间;若关键帧时间早于调整时间,优化方案,获得最优调整时间并调整姿态;否则按原方案调整并采集影像;通过多模态大模型生成合成内容,分析关键影像位置并合成,输出无人机视频合成结果,以解决无人机视频拍摄过程中难以根据用户个性化需求实时调整拍摄姿态,以及视频内容合成难以精准匹配用户期望的技术问题。
技术关键词
拍摄主体 关键帧 视频 样本 多模态 参数 指令解析器 影像 无人机姿态 位置识别器 基础 分析器 控制器
系统为您推荐了相关专利信息
1
一种基于机器学习技术的实验室数据分析方法及系统
数据分析方法 机器学习技术 孤立森林算法 生成对抗网络模型 实验室数据采集
2
电力设备多物理场孪生模型的动态更新方法、装置、设备、存储介质和程序产品
预训练模型 电力设备 样本 油浸式电力变压器 动态更新方法
3
一种文本流实体同义词实时挖掘方法及装置
同义词 挖掘方法 文本 sigmoid函数 样本
4
一种数据传输方法及用于无人矿卡远程接管的数据传输系统
数据传输方法 拥塞控制算法 接收端 数据传输系统 状态机
5
一种基于大模型的智能问答方法及系统
意图类别 关键词 智能问答方法 语义 对象
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号