一种基于图像-文本融合的遥感图像目标识别数据集规范化构建方法

AITNT
正文
推荐专利
一种基于图像-文本融合的遥感图像目标识别数据集规范化构建方法
申请号:CN202510213332
申请日期:2025-02-26
公开号:CN120047775A
公开日期:2025-05-27
类型:发明专利
摘要
本发明提供了一种基于图像‑文本融合的遥感图像目标识别数据集规范化构建方法,该方法包括:通过开源工具获取并调整遥感影像,对目标物体进行语义标签和分割点标注,分析归纳目标的通用与特定特征,转换分割点标注为二值化掩码图像与目标检测矩形框,结合大语言模型生成多样化的语言描述,并将生成的语言描述与遥感影像、掩码图像及目标检测矩形框进行对应存储和分类管理。该数据集将遥感影像(图像)和目标描述(文本)结合,提供了一套多模态图像‑文本遥感数据集“数据采集—数据分析—数据规范化标注—数据分类管理”的完整流程。该发明填补了国内外在基于视觉和语言融合的遥感图像目标识别数据集方面的空白,推动了遥感图像智能分析在多个领域的应用。
技术关键词
大语言模型 语义标签 文本 谷歌地球 标注软件 遥感图像智能 高分辨率遥感影像 应用程序编程接口 数据存储结构 生成二值化 开源工具 通用特征 标识管理 物体 分割算法
系统为您推荐了相关专利信息
1
一种投标文件的质量评估方法、装置、设备及存储介质
大语言模型 目录 容器 页面索引 指标
2
一种基于双大模型的网民观点分析方法
文本 问答对数据 观点 分析方法 样本
3
一种多维度评估歌唱水平的方法及系统
后验概率分布 音频 情绪识别模型 序列 数据
4
基于大模型的数据处理方法、装置、电子设备
指令 数据处理方法 大语言模型 模型训练技术 电子设备
5
一种针对医疗多模态大模型的视觉语言特征精细对齐方法
多模态 对齐方法 文本 图文 视觉特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号