一种基于模型复用的图文检索图网络方法

正文

推荐专利

一种基于模型复用的图文检索图网络方法

申请号：CN202510520030

申请日期：2025-04-24

公开号：CN120336569A

公开日期：2025-07-18

类型：发明专利

摘要

本发明公开一种基于模型复用的图文检索图网络方法，首先根据用户需求从互联网公开数据源构建多领域图像‑文本对数据集，利用预训练模型进行多级数据清洗确保数据质量，其次复用大规模预训练的多模态模型作为特征提取器，高效获取图像文本对的深度语义表征，显著降低了模型训练成本。然后设计异构拓扑结构，其中图像文本节点分别形成同质子图，跨模态边通过可学习的注意力权重动态生成。最后，利用构建图像文本语义关系图，并通过图采样与聚合完成对检索目标的上下文信息补充，进而生成检索特征，完成多模态组合的检索任务。本方法通过复用预训练模型特征使得过程更加高效，大幅提升了模型收敛速度。

技术关键词

图像特征提取模型文本预训练模型图文分块特征图像语义关系跨模态网络图像块注意力机制节点多模态多通道特征计算机设备数据采集系统可读存储介质

系统为您推荐了相关专利信息

词云图的生成方法、词云图的生成设备以及可读存储介质

大语言模型文本段落生成方法生成程序字符识别算法

智能化客户生命周期管理AiCRM方法及系统

客户情感特征生命周期管理层级标签

基于证据驱动视觉语言模型的医学图像分割方法及系统

观点视觉医学图像分割方法跨模态信息编码

计及碳排放的新能源现货交易价格优化实验验证方法

碳交易市场数据分析模型时间序列特征策略数据库交易平台

一种钢瓶检验方法、装置及介质

钢印文本检测模型文本识别模型轮廓区域轮廓信息

一种基于模型复用的图文检索图网络方法

站点导航

APP 下载