摘要
本发明涉及文本图像处理技术领域,尤其涉及一种文本到图像的检索模型训练方法及检索方法,该方法包括:获取N个文本‑图像的样本对;对样本对进行特征提取处理,得到样本对的精炼局部特征和全局特征;基于样本对的精炼局部特征和全局特征,对N个样本对进行分类处理,得到不同样本集和样本的预测标签,并从N个样本对中得到困难负样本和困难正样本。在预热训练阶段,通过总双向KL散度损失函数,对所有样本的预测标签进行损失处理。接着,在常规训练阶段,通过总损失函数,困难正样本和困难负样本,得到文本到图像的检索模型。该方法能高效区分出含有噪声的图像和真实的困难图像,提高文本到图像的检索模型的鲁棒性、准确度和精度。
技术关键词
噪声样本
模型训练方法
标签
文本图像处理技术
检索方法
序列
矩阵
模糊C均值聚类
令牌
阶段
文本编码器
图像编码器
度量
鲁棒性
注意力
系统为您推荐了相关专利信息
依存句法
CRF模型
实体
Softmax函数
XML解析器
干细胞提取方法
流控技术
细胞提取技术
捕获结构
微流控芯片系统
电极组件
训练样本集
缺陷检测方法
图像
卷积模块
电网仿真系统
有源配电网
场景
光伏逆变器
无功调节能力
多模态特征融合
遥感图像分类方法
斯皮尔曼等级相关系数
特征工程
特征提取单元