摘要
本发明涉及一种基于语域迁移与模型融合的命名实体识别系统,本系统的训练流程由源域与目标域组成,源域中包含对多组语料的训练,并将参数传递至目标域,目标域接受来自源域的参数传递并输出文本的对应标签;本系统包含三大模块,分别是Albert预训练模块,T_NER编码器以及CRF解码器模块;系统输入文本序列,输出对应标签序列;在源域训练阶段,模型经过CRF解码后,计算损失函数并调整模型参数,而后将模型参数继续应用于源域中下一领域的训练中;在目标域预测阶段,模型经过CRF解码后直接返回对应标签;解决了现有的命名实体识别系统面对跨语域注数据稀缺导致实际应用性能下降的问题,实现跨语域的命名实体识别,对知识图谱构建任务提供的原始数据支撑。
技术关键词
命名实体识别系统
文本
标签
编码器
解码器
参数
模块
知识图谱构建
序列特征
阶段
线性
对象
数学
字符
逻辑
数据