摘要
本发明公开了基于渐进式语义聚合和结构化认知增强的图文匹配方法,涉及图文匹配技术领域,包括以下步骤:S1、多模态特征提取;S2、引入层次化自增强语义感知池化机制;S3、引入结构化知识辅助学习模块;S4、引入跨模态语义对齐机制;S5、引入多尺度语义关联矩阵;本发明中,通过多层次的语义增强和细粒度级别的自适应特征聚合,强化了显著词域,实现局部与全局表示之间的一致性统一;从图像标题语料库中提取实体之间的结构化语义,挖掘长、短句中的高阶关系,并利用这些先验知识扩展文本全局嵌入中缺失的概念;引入跨模态关系交互机制,增强语义嵌入,促进更加一致的语义理解;引入多尺度语义关联矩阵,生成更为全面和精确的相似性测量矩阵。
技术关键词
图文匹配方法
语义
文本
三元组
跨模态
图文匹配技术
多尺度
权重分配机制
词特征
关系抽取模型
交叉注意力机制
视觉
BERT模型
前馈神经网络
异步方法
排序损失
多模态
交互机制
多层感知机
系统为您推荐了相关专利信息
机器学习系统
图像传感器数据
二维图像传感器
节点
场景
云数据中心
审核平台
审核方法
文本识别模型
可视化模组
视觉特征
多模态信息
注意力机制
文本编码器
深度学习模型
运维知识库
辅助排故方法
模型生成设备
文本
终端