摘要
本发明提供基于多模态融合和深度学习的命名实体识别系统及方法,涉及自然语言处理、金融命名实体识别技术领域。该系统包括:用于通过对获取的原始金融文本数据进行数据清洗和分段来生成文本段落并构建金融语料库的命名实体语料库构建模块、用于分别对金融语料库中各文本段落进行多模态特征提取的多模态特征提取模块、用于将多模态特征进行融合的多模态特征融合模块、用于对多模态融合特征进行编码的特征编码模块以及用于对各文本段落的多模态融合特征序列进行实体序列标注的实体序列标注模块,最终生成各文本段落的实体序列。本发明通过融合字符、音标及字形多模态特征能够有效提升对金融文本进行命名实体识别的准确性和精确度。
技术关键词
文本段落
命名实体识别方法
特征提取网络
金融
融合特征
命名实体识别系统
注意力
字符
融合局部特征
解码器
序列
条件随机场
特征提取模块
双向长短期记忆
多模态特征融合
系统为您推荐了相关专利信息
金字塔池化模块
注意力
特征提取模块
分支
识别方法
图像抠图方法
视频帧
融合特征
语义特征
离散余弦变换
多模态特征
分布式协同控制
数据特征提取
电力系统运行状态
策略
芯片缺陷检测方法
空间结构特征
动态门控
蒙特卡洛
图像
电调天线结构
缺陷自动检测方法
端点
生成三维模型
传感器组