摘要
本发明公开了基于类型引导交互的多模态命名实体识别方法和系统、电子设备及计算机可读存储介质,属于多模态命名实体识别技术领域。解决了现有技术中传统的多模态命名实体识别方法因模型难以捕获模态间语义的对应关系导致的识别结果不准确的问题;本发明通过图文对层级提取模块和实体类别提取模块,提取特征;通过类别引导的注意力模块,生成实体类别引导的文本和视觉表示以及增强的实体类别表示;通过基于注意力机制的跨模态层级交互模块,生成对实体类别敏感性强的多模态表示;通过带有类型引导单模态辅助任务的联合学习模块,生成图像文本对的预测序列。本发明有效提升了对图像和文本的识别精度,可以应用于识别和提取命名实体。
技术关键词
命名实体识别方法
层级
代表
命名实体识别系统
跨模态
矩阵
多模态
模块
模态特征
融合视觉
图像
多头注意力机制
文本编码器
命名实体识别技术
系统为您推荐了相关专利信息
数据迁移方法
Louvain算法
数据去重技术
聚类算法
初始聚类中心
图像处理方法
图像处理模型
内窥镜
图像处理设备
关键点
遥感图像识别方法
阶段
样本
深度学习模型
分辨率
配电网通信方法
面向电动汽车
服务器
终端设备
负荷预测模型
代码注释生成方法
序列
位置编码信息
抽象语法树
多视角