一种文本到图像的检索模型训练方法及检索方法

正文

推荐专利

申请号：CN202510965706

申请日期：2025-07-14

公开号：CN120929707A

公开日期：2025-11-11

类型：发明专利

摘要

本发明涉及文本图像处理技术领域，尤其涉及一种文本到图像的检索模型训练方法及检索方法，该方法包括：获取N个文本‑图像的样本对；对样本对进行特征提取处理，得到样本对的精炼局部特征和全局特征；基于样本对的精炼局部特征和全局特征，对N个样本对进行分类处理，得到不同样本集和样本的预测标签，并从N个样本对中得到困难负样本和困难正样本。在预热训练阶段，通过总双向KL散度损失函数，对所有样本的预测标签进行损失处理。接着，在常规训练阶段，通过总损失函数，困难正样本和困难负样本，得到文本到图像的检索模型。该方法能高效区分出含有噪声的图像和真实的困难图像，提高文本到图像的检索模型的鲁棒性、准确度和精度。

技术关键词

噪声样本模型训练方法标签文本图像处理技术检索方法序列矩阵模糊C均值聚类令牌阶段文本编码器图像编码器度量鲁棒性注意力

系统为您推荐了相关专利信息

一种基于依存句法的工程知识类型匹配方法、设备、存储介质及产品

依存句法 CRF模型实体 Softmax函数 XML解析器

一种利用微流控技术的干细胞提取方法

干细胞提取方法流控技术细胞提取技术捕获结构微流控芯片系统

一种自迭代的膜电极组件缺陷检测方法、装置和设备

电极组件训练样本集缺陷检测方法图像卷积模块

一种有源配电网趋势断面自动生成方法及装置

电网仿真系统有源配电网场景光伏逆变器无功调节能力

基于多模态特征融合的遥感图像分类系统及方法

多模态特征融合遥感图像分类方法斯皮尔曼等级相关系数特征工程特征提取单元

一种文本到图像的检索模型训练方法及检索方法

站点导航

APP 下载