基于跨模态对齐与融合的多模态实体和关系抽取方法及系统

正文

推荐专利

申请号：CN202510210311

申请日期：2025-02-25

公开号：CN120146051B

公开日期：2025-09-02

类型：发明专利

摘要

本发明公开了基于跨模态对齐与融合的多模态实体和关系抽取方法及系统，包括：对输入文本和图像进行处理和编码，获得多种图像和文本特征；以图像的语义表示为锚点，分别对细粒度和粗粒度的文本特征与像素级图像表示进行特征对齐，将图像和文本特征映射到同一语义空间；通过文本引导动态门控聚合、视觉前缀跨模态融合、跨模态图文匹配，进行多粒度特征融合，增加特征互补性的同时建模文本中名词短语与图像对象的关联，获得多粒度的多模态特征表示；通过实体引导注意力门控融合多粒度的多模态特征，聚集文本实体相关的视觉信息，获得最终的多模态融合表示；根据多模态融合表示，分别进行多模态命名实体识别和多模态关系抽取的任务预测。

技术关键词

语义命名实体识别跨模态视觉特征动态门控图像编码器图像像素多粒度特征多模态特征关系抽取方法标签编码器文本编码器注意力

系统为您推荐了相关专利信息

基于安全生产数据的智能文本报告自动生成方法及系统

报告自动生成方法多源异构数据文本大语言模型模板

一种音频修复方法、系统、介质和设备

音频修复方法语义向量文本编码器令牌多模态

一种基于大模型的水文分析服务链自动生成方法及系统

地理信息处理服务水文地理信息数据服务自动生成方法服务注册中心

一种融合迁移学习与领域自适应的跨语言文本理解方法

迁移学习模型文本理解词嵌入模型编码器非线性

一种用于语音识别的人机交互方法及系统

人机交互方法字词语谱图计算机程序指令序列

基于跨模态对齐与融合的多模态实体和关系抽取方法及系统

站点导航

APP 下载