基于渐进式语义聚合和结构化认知增强的图文匹配方法

AITNT
正文
推荐专利
基于渐进式语义聚合和结构化认知增强的图文匹配方法
申请号:CN202411445892
申请日期:2024-10-16
公开号:CN119397048A
公开日期:2025-02-07
类型:发明专利
摘要
本发明公开了基于渐进式语义聚合和结构化认知增强的图文匹配方法,涉及图文匹配技术领域,包括以下步骤:S1、多模态特征提取;S2、引入层次化自增强语义感知池化机制;S3、引入结构化知识辅助学习模块;S4、引入跨模态语义对齐机制;S5、引入多尺度语义关联矩阵;本发明中,通过多层次的语义增强和细粒度级别的自适应特征聚合,强化了显著词域,实现局部与全局表示之间的一致性统一;从图像标题语料库中提取实体之间的结构化语义,挖掘长、短句中的高阶关系,并利用这些先验知识扩展文本全局嵌入中缺失的概念;引入跨模态关系交互机制,增强语义嵌入,促进更加一致的语义理解;引入多尺度语义关联矩阵,生成更为全面和精确的相似性测量矩阵。
技术关键词
图文匹配方法 语义 文本 三元组 跨模态 图文匹配技术 多尺度 权重分配机制 词特征 关系抽取模型 交叉注意力机制 视觉 BERT模型 前馈神经网络 异步方法 排序损失 多模态 交互机制 多层感知机
系统为您推荐了相关专利信息
1
用于从三维点云生成图形表示的设备和方法
机器学习系统 图像传感器数据 二维图像传感器 节点 场景
2
一种基于大模型的档案智能开放审核方法及系统
云数据中心 审核平台 审核方法 文本识别模型 可视化模组
3
一种基于视觉前缀的生成式多模态信息抽取方法
视觉特征 多模态信息 注意力机制 文本编码器 深度学习模型
4
图像数据增广方法、装置、设备、介质和程序产品
编码特征 图像 数据增广方法 校正特征 解码网络
5
一种基于大模型的空管设备辅助排故方法及终端
运维知识库 辅助排故方法 模型生成设备 文本 终端
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号