摘要
本发明公开了一种基于多标记语义融合的中文命名实体识别方法,属于命名实体识别技术领域,包括S1、输入文本;S2、通过实体边界检测模块将文本向量化,并预测出候选实体边界字;S3、实体编码模块使用候选实体边界字构造候选实体集,同时引入边界线索标记[B]和[E],以及掩码标记[MASK],生成与候选实体集对应的候选实体标记集,将标记集与候选实体边界字拼接在文本序列句尾;S4、实体分类模块预测由实体编码模块产生的候选实体表示,获得最终预测结果;本发明提供的一种基于多标记语义融合的中文命名实体识别方法,在不破坏原始文本语义逻辑的前提下,能够显著增强模型感知实体边界和捕获实体边界语义信息的能力。
技术关键词
标记
预训练语言模型
多层感知机
文本
编码模块
序列
跨度
命名实体识别技术
线索
元素
语义特征
矩阵
标签
变量
逻辑
系统为您推荐了相关专利信息
项目管理方法
多模态
项目管理工具
多头注意力机制
非结构化文本
CRF模型
条件随机场
联合损失函数
文本
命名实体识别系统
电路设计优化
布线规则
关系抽取模型
双向长短期记忆网络
文本