摘要
本申请公开了一种面向复杂场景信息先验的遥感图像自然语言描述生成方法,属于图像处理与分析领域。本申请所提方法包括:构建中文和英文联合的数据集;构建视觉的全局特征和局部特征;构建信息先验特征;对全局特征和局部特征的强化处理;进行多特征交叉融合;对交叉融合后的特征执行自然语言描述生成。本申请通过上述技术方案,提高了对涉及大量复杂场景的遥感图像描述的准确性。
技术关键词
编码特征
视觉
注意力
融合特征
文本
生成方法
生成遥感图像
自然语言模型
矩阵
通道
网络结构
全局平均池化
关系
场景类别
数据
像素
系统为您推荐了相关专利信息
图像特征向量
文本特征向量
辅助盲人
智能眼镜
训练特征提取模型
智能控制方法
像素点
卷积神经网络模型
视觉传感器
图像处理算法
智能感知方法
影像
模拟井下工况
特征提取网络
煤矿智能化开采技术
视频
视觉
生成方法
TextRank算法
标签文本
掩码矩阵
预训练语言模型
表达式
上下文特征
语义