一种基于置信度校正与一致性学习的噪声跨模态检索方法

正文

推荐专利

申请号：CN202510496560

申请日期：2025-04-21

公开号：CN120407711A

公开日期：2025-08-01

类型：发明专利

摘要

本发明公开了一种基于置信度校正与一致性学习的噪声跨模态检索方法，属于多媒体检索的跨模态检索技术领域。首先在预热阶段预热模型和模型，利用损失优化初始匹配关系。在正式训练阶段，采用协同教学范式训练双模型，通过双组分高斯混合模型对正样本对损失分布建模，根据阈值将其划分为干净子集、不确定子集和噪声子集。针对不同子集设计不同置信度校正策略，进一步结合预训练视觉模型提取的图像单模态特征、预训练语言模型提取的文本单模态特征计算跨模态相似度，对负样本对进行判别。最终联合正样本对损失和负样本对损失，形成噪声鲁棒性增强的跨模态对齐框架。本发明有效提升噪声场景下的检索准确性，在多媒体检索领域具有实用价值。

技术关键词

模态特征样本跨模态检索方法预训练语言模型损失函数优化文本编码器图像编码器噪声图像超参数图像匹配校正高斯混合模型定义概率密度函数

系统为您推荐了相关专利信息

基于UKF和特征融合模型的气象干旱时空预测系统及方法

时空预测方法融合时空特征时间递归神经网络气象边界特征

基于目标散射特性的雷达图像船舶目标识别方法及系统

分类网络散射点识别方法热力图图像

一种自动驾驶系统的功耗控制方法、装置、设备及存储介质

场景特征车辆自动驾驶系统功耗控制方法传感器

一种融合多模态特征向量的车辆跨镜头ReID匹配方法及系统

底层视觉特征多模态镜头车辆行驶路径语义特征

脐带结扎时刻确定方法、装置、设备及存储介质

时间预测模型血流机器学习分类算法频域特征时域特征提取

一种基于置信度校正与一致性学习的噪声跨模态检索方法

站点导航

APP 下载