摘要
一种面向无人机平台的轻量级场景图生成方法,通过设计基于Transformer编码器‑解码器架构的轻量化模型,直接从图像中解码可能存在谓词关系的主语‑宾语对。采用集成学习技术,从原始训练集中重新采样生成多个子训练集,训练多个谓词关系分类器并集成构建出一个鲁棒性更强的谓词关系分类器。将获得的多组主谓宾三元组整合生成场景图。本发明针对无人机平台的场景图生成需求解决了资源受限环境下的实时高效场景理解问题,生成的场景图语义丰富、结构清晰,显著增强了无人机在复杂动态环境中的智能感知和决策能力,具有较高的实用价值和推广前景。
技术关键词
关系分类器
面向无人机
集成学习技术
注意力
三元组
生成场景
生成方法
预测类别
解码器架构
匈牙利算法
资源受限环境
编码器
训练集
标签
前馈神经网络
无人机平台
图片
系统为您推荐了相关专利信息
图像分割模型
层级
分割方法
多层次特征融合
融合特征
捕捉物体图像
计算机视觉技术
曲面重建算法
全卷积网络
多尺度注意力机制
报警检测方法
状态空间模型
连续小波变换
表达式
时域特征
多分辨率遥感影像
地表覆盖分类
上采样
视觉特征
金字塔池化模块