基于渐进式语义聚合和结构化认知增强的图文匹配方法

正文

推荐专利

申请号：CN202411445892

申请日期：2024-10-16

公开号：CN119397048A

公开日期：2025-02-07

类型：发明专利

摘要

本发明公开了基于渐进式语义聚合和结构化认知增强的图文匹配方法，涉及图文匹配技术领域，包括以下步骤：S1、多模态特征提取；S2、引入层次化自增强语义感知池化机制；S3、引入结构化知识辅助学习模块；S4、引入跨模态语义对齐机制；S5、引入多尺度语义关联矩阵；本发明中，通过多层次的语义增强和细粒度级别的自适应特征聚合，强化了显著词域，实现局部与全局表示之间的一致性统一；从图像标题语料库中提取实体之间的结构化语义，挖掘长、短句中的高阶关系，并利用这些先验知识扩展文本全局嵌入中缺失的概念；引入跨模态关系交互机制，增强语义嵌入，促进更加一致的语义理解；引入多尺度语义关联矩阵，生成更为全面和精确的相似性测量矩阵。

技术关键词

图文匹配方法语义文本三元组跨模态图文匹配技术多尺度权重分配机制词特征关系抽取模型交叉注意力机制视觉 BERT模型前馈神经网络异步方法排序损失多模态交互机制多层感知机

系统为您推荐了相关专利信息

用于从三维点云生成图形表示的设备和方法

机器学习系统图像传感器数据二维图像传感器节点场景

一种基于大模型的档案智能开放审核方法及系统

云数据中心审核平台审核方法文本识别模型可视化模组

一种基于视觉前缀的生成式多模态信息抽取方法

视觉特征多模态信息注意力机制文本编码器深度学习模型

图像数据增广方法、装置、设备、介质和程序产品

编码特征图像数据增广方法校正特征解码网络

一种基于大模型的空管设备辅助排故方法及终端

运维知识库辅助排故方法模型生成设备文本终端

基于渐进式语义聚合和结构化认知增强的图文匹配方法

站点导航

APP 下载