一种面向复杂场景信息先验的遥感图像自然语言描述生成方法

AITNT
正文
推荐专利
一种面向复杂场景信息先验的遥感图像自然语言描述生成方法
申请号:CN202411963075
申请日期:2024-12-30
公开号:CN120014288B
公开日期:2025-12-05
类型:发明专利
摘要
本申请公开了一种面向复杂场景信息先验的遥感图像自然语言描述生成方法,属于图像处理与分析领域。本申请所提方法包括:构建中文和英文联合的数据集;构建视觉的全局特征和局部特征;构建信息先验特征;对全局特征和局部特征的强化处理;进行多特征交叉融合;对交叉融合后的特征执行自然语言描述生成。本申请通过上述技术方案,提高了对涉及大量复杂场景的遥感图像描述的准确性。
技术关键词
编码特征 视觉 注意力 融合特征 文本 生成方法 生成遥感图像 自然语言模型 矩阵 通道 网络结构 全局平均池化 关系 场景类别 数据 像素
系统为您推荐了相关专利信息
1
一种利用智能眼镜语音辅助盲人日常生活的方法
图像特征向量 文本特征向量 辅助盲人 智能眼镜 训练特征提取模型
2
一种磁钢粘贴智能控制方法
智能控制方法 像素点 卷积神经网络模型 视觉传感器 图像处理算法
3
一种基于煤矸运移态势热敏影像智能感知方法和系统
智能感知方法 影像 模拟井下工况 特征提取网络 煤矿智能化开采技术
4
大语言模型引导伪标签增强的半监督视频描述生成方法
视频 视觉 生成方法 TextRank算法 标签文本
5
基于上下文相似性计算的无参考问题质量评估方法及系统
掩码矩阵 预训练语言模型 表达式 上下文特征 语义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号