摘要
本发明提供了一种基于图像‑文本融合的遥感图像目标识别数据集规范化构建方法,该方法包括:通过开源工具获取并调整遥感影像,对目标物体进行语义标签和分割点标注,分析归纳目标的通用与特定特征,转换分割点标注为二值化掩码图像与目标检测矩形框,结合大语言模型生成多样化的语言描述,并将生成的语言描述与遥感影像、掩码图像及目标检测矩形框进行对应存储和分类管理。该数据集将遥感影像(图像)和目标描述(文本)结合,提供了一套多模态图像‑文本遥感数据集“数据采集—数据分析—数据规范化标注—数据分类管理”的完整流程。该发明填补了国内外在基于视觉和语言融合的遥感图像目标识别数据集方面的空白,推动了遥感图像智能分析在多个领域的应用。
技术关键词
大语言模型
语义标签
文本
谷歌地球
标注软件
遥感图像智能
高分辨率遥感影像
应用程序编程接口
数据存储结构
生成二值化
开源工具
通用特征
标识管理
物体
分割算法
系统为您推荐了相关专利信息
指令
数据处理方法
大语言模型
模型训练技术
电子设备