摘要
本发明公开了一种面向多图像场景的多模态命名实体识别方法及系统,其中方法包括:S1.对输入的文本序列及关联的若干图像进行对象检测,获得每张图像中的候选对象集合;S2.提取文本序列的文本特征,并提取各候选对象的对象特征;S3.基于对象特征的相似度进行相关性聚类,从聚类结果中筛选与命名实体相关的跨图像一致性对象;S4.将文本特征与一致性对象特征输入动态融合网络,通过跨模态注意力机制动态调整模态权重,生成多模态融合表示;S5.对多模态融合表示解码获得命名实体识别结果。本发明解决了传统方法在多图像场景中存在的噪声干扰和模态权重静态分配问题。
技术关键词
命名实体识别方法
命名实体识别系统
图像
文本
注意力机制
多模态
对象检测
跨模态
场景
置信度阈值
聚类
动态
序列
条件随机场
识别模块
网络
系统为您推荐了相关专利信息
中文文本分类
智能问答系统
语音识别模型
深度卷积神经网络
深度学习模型
审核规则
审核模型
合规性
台账信息
OCR识别技术
多模态数据采集
改进型卷积神经网络
预警系统
注意力机制
数据处理模块
模板
线性变换矩阵
模块
无监督聚类
图像处理技术