摘要
本发明涉及图像识别技术领域,具体为一种跨场景迁移学习的无人机多模态视觉识别方法,包括:实时同步采集环境参数信息和多模态图像数据,并利用场景预测模型预测当前飞行区域的场景类别;通过计算场景类别与预设源域数据集中源域子集的匹配度,选择匹配度最高的源域子集;将目标域样本划分为多个子域,得到目标子域数据;提取多模态图像数据中各图像的单模态特征,并基于各图像的质量评估结果和场景类别动态切换融合策略进行融合,生成第一融合特征;采用滑动窗口机制对第一融合特征进行累积,并根据前一时刻的历史特征状态进行修正,得到第二融合特征;利用分阶段迁移学习训练完成后的视觉识别模型对当前目标域的第二融合特征进行视觉识别。
技术关键词
视觉识别方法
场景类别
多模态图像数据
融合特征
模态特征
无人机
融合策略
采集环境参数
可见光图像
滑动窗口机制
环境参数信息
多源信息融合
识别头
图像特征提取
特征提取网络
场景分类
系统为您推荐了相关专利信息
动态物体识别
静态特征
建模方法
运动特征
光流估计算法
云平台系统
中心服务器
细胞分类方法
造血系统疾病
样本