一种基于大模型的掩码增强命名实体识别方法

正文

推荐专利

申请号：CN202411377901

申请日期：2024-09-30

公开号：CN118940763A

公开日期：2024-11-12

类型：发明专利

摘要

本发明涉及自然语言处理技术领域，提供了一种基于大模型的掩码增强命名实体识别方法，该方法包括：采集待识别文本数据；预处理得到输入序列，输入训练好的识别模型得到识别结果；识别模型训练过程包括：基于设定掩码策略对训练输入序列进行掩码处理得到掩码输入序列，送入BERT模型得到实体、掩码上下文表示特征；执行命名实体识别任务和预测掩码任务且共享参数，得到实体预测值和掩码预测值；基于实体上下文表示特征和实体预测值计算第一损失函数，基于掩码预测值计算第二损失函数；更新模型参数；评估模型性能，重复训练直至性能达到设定要求。本发明能够充分理解语义，泛化能力较强，语境依赖性捕捉能力较强，误识别和漏识别情况较少。

技术关键词

命名实体识别方法掩码策略条件随机场模型 BERT模型序列掩码矩阵训练文本数据标签识别模型训练更新模型参数维特比算法自然语言周期语义因子

系统为您推荐了相关专利信息

基于深度学习显著性检验的城市传染病预测分析方法

预测分析方法贝叶斯神经网络城市路网结构核密度估计方法门控循环单元

一种基于LSTM的洗烟消热装置温度监测与调控方法

强化特征记忆单元时间序列特征调控方法红外温度传感器

一种考虑车云通信时延的云控自动驾驶汽车控制方法

车辆状态信息汽车控制方法时延线性二次型调节器解码器结构

一种基于宿主-菌群共代谢模型识别疾病微生物-代谢物组合标志物的方法

代谢网络模型识别疾病标志物样本机器学习算法

一种基于人工智能与大数据的网络安全风险预测方法

网络安全风险网络数据预测卷积神经网络模型网络流量数据层次分析法

一种基于大模型的掩码增强命名实体识别方法

站点导航

APP 下载