基于聚类原型指导的聚合邻域嵌入图像文本匹配方法

正文

推荐专利

申请号：CN202411066203

申请日期：2024-08-05

公开号：CN119091170A

公开日期：2024-12-06

类型：发明专利

摘要

本发明公开了一种基于聚类原型指导的聚合邻域嵌入图像文本匹配方法，涉及计算机视觉与自然语言处理技术领域，本发明提出了全粒度原型指导邻域嵌入框架。该框架通过聚类原型动量对比学习动态地学习统一表征空间，缓解软正样本问题；引入全局与局部特征联合提取和自适应聚合网络，提升全局信息理解能力；构建模态内和模态间关联度矩阵，深入挖掘样本实例的邻域关系；并采用动量对比学习技术，扩充负样本容量，提高特征判别能力。实验结果表明，FPNE在Flickr30K和MS‑COCO数据集上的表现优于现有最先进方法，显著提升了图文匹配的精度和效率，展现出较强的鲁棒性和广泛适用性。

技术关键词

文本匹配方法原型邻域语义聚类样本跨模态图像嵌入矩阵存储库视觉视角文本编码器注意力词特征节点特征网络

系统为您推荐了相关专利信息

一种动态场景下基于点线融合的视觉SLAM方法及系统

视觉SLAM方法动态场景关键帧静态特征图像

基于传感器融合的金属目标检测算法

传感器融合深度学习分类深度图技术占据栅格地图相机标定参数

一种基于改进YOLOv5s架构的烟支外观缺陷检测方法及系统

外观缺陷检测方法烟支外观缺陷烟支注意力机制图像

一种PPT的生成与更新系统及方法

图表资产数据获取模块搭建模块 Web技术

一种可解释极化深度学习网络的海水浮筏养殖信息提取方法

信息提取方法浮筏养殖深度学习网络解码器线性变换矩阵

基于聚类原型指导的聚合邻域嵌入图像文本匹配方法

站点导航

APP 下载