摘要
本发明涉及自然语言处理技术领域,提供了一种基于大模型的掩码增强命名实体识别方法,该方法包括:采集待识别文本数据;预处理得到输入序列,输入训练好的识别模型得到识别结果;识别模型训练过程包括:基于设定掩码策略对训练输入序列进行掩码处理得到掩码输入序列,送入BERT模型得到实体、掩码上下文表示特征;执行命名实体识别任务和预测掩码任务且共享参数,得到实体预测值和掩码预测值;基于实体上下文表示特征和实体预测值计算第一损失函数,基于掩码预测值计算第二损失函数;更新模型参数;评估模型性能,重复训练直至性能达到设定要求。本发明能够充分理解语义,泛化能力较强,语境依赖性捕捉能力较强,误识别和漏识别情况较少。
技术关键词
命名实体识别方法
掩码策略
条件随机场模型
BERT模型
序列
掩码矩阵
训练文本数据
标签
识别模型训练
更新模型参数
维特比算法
自然语言
周期
语义
因子
系统为您推荐了相关专利信息
预测分析方法
贝叶斯神经网络
城市路网结构
核密度估计方法
门控循环单元
强化特征
记忆单元
时间序列特征
调控方法
红外温度传感器
车辆状态信息
汽车控制方法
时延
线性二次型调节器
解码器结构
代谢网络模型
识别疾病
标志物
样本
机器学习算法
网络安全风险
网络数据预测
卷积神经网络模型
网络流量数据
层次分析法