一种基于图像-文本融合的遥感图像目标识别数据集规范化构建方法

正文

推荐专利

申请号：CN202510213332

申请日期：2025-02-26

公开号：CN120047775A

公开日期：2025-05-27

类型：发明专利

摘要

本发明提供了一种基于图像‑文本融合的遥感图像目标识别数据集规范化构建方法，该方法包括：通过开源工具获取并调整遥感影像，对目标物体进行语义标签和分割点标注，分析归纳目标的通用与特定特征，转换分割点标注为二值化掩码图像与目标检测矩形框，结合大语言模型生成多样化的语言描述，并将生成的语言描述与遥感影像、掩码图像及目标检测矩形框进行对应存储和分类管理。该数据集将遥感影像(图像)和目标描述(文本)结合，提供了一套多模态图像‑文本遥感数据集“数据采集—数据分析—数据规范化标注—数据分类管理”的完整流程。该发明填补了国内外在基于视觉和语言融合的遥感图像目标识别数据集方面的空白，推动了遥感图像智能分析在多个领域的应用。

技术关键词

大语言模型语义标签文本谷歌地球标注软件遥感图像智能高分辨率遥感影像应用程序编程接口数据存储结构生成二值化开源工具通用特征标识管理物体分割算法

系统为您推荐了相关专利信息

一种投标文件的质量评估方法、装置、设备及存储介质

大语言模型目录容器页面索引指标

一种基于双大模型的网民观点分析方法

文本问答对数据观点分析方法样本

一种多维度评估歌唱水平的方法及系统

后验概率分布音频情绪识别模型序列数据

基于大模型的数据处理方法、装置、电子设备

指令数据处理方法大语言模型模型训练技术电子设备

一种针对医疗多模态大模型的视觉语言特征精细对齐方法

多模态对齐方法文本图文视觉特征

一种基于图像-文本融合的遥感图像目标识别数据集规范化构建方法

站点导航

APP 下载