摘要
本发明公开了一种遥感影像在视觉语言模型中的KNN检索方法,包括五个步骤:S1数据预处理:将视觉语言测试数据集中的遥感影像数据集进行base64处理,文本数据集进行jsonl处理,处理后上传至数据库;S2影像文本序列化:对预处理后的数据集进行序列化以方便训练时随机读取;S3CLIP模型训练:将数据序列化后的数据送入视觉语言模型进行训练,得出训练模型;S4图文特征提取:将测试数据通过训练模型进行特征提取;S5KNN检索评估:将特征提取出来的文件进行KNN检索评估。本发明可以通过视觉语言测试数据集对KNN检索进行训练,并进行检索评估,以帮助快速、准确地从海量数据中检索出相关的或相似的内容。
技术关键词
检索方法
Sigmoid函数
视觉
注意力机制
监督学习方法
遥感影像数据
前馈神经网络
图文
文本
图像
切块
输出特征
编码
文件夹
索引
参数
内存
变量
系统为您推荐了相关专利信息
信号重建方法
时序
学习机
编码器
非暂态计算机可读存储介质
视频对象分割方法
运动感知模块
语义
动态融合机制
视觉特征
风险预测模型
风险预测方法
样本
训练预测模型
群体智能优化方法
虫害识别方法
图像生成模型
样本
生成数据集
真实图像数据