摘要
本发明公开了一种命名实体识别大模型训练方法及命名实体识别方法,所述命名实体识别模型包括依次信号连接的BERT层、Encoder层、MLP层和CRF层,该训练方法包括以下步骤:获取训练集,所述训练集包括原文本且与所述原文本语义相等但句式不同的相似文本,所述原文本和所述相似文本均为单句;将所述原文本和相似文本依次输入BERT层、Encoder层生成所述原文本和所述相似文本中每个基本单元的token向量并对所述token向量按照基本单元中的实体类型进行分组并拉近每组内的所有token向量、拉远组与组之间的token向量;将所述原文本对应的token向量输入MLP层和CRF层进行模型参数调整。该方法减小噪声的引入,实体表示无偏移,增强模型对实体类型的识别能力、鲁棒性和泛化能力。
技术关键词
命名实体识别方法
命名实体识别模型
文本
模型训练方法
训练集
大语言模型
语义
鲁棒性
参数
信号
噪声
系统为您推荐了相关专利信息
大语言模型
识别人脸图像
人脸活体检测方法
视觉特征
多模态
动态知识图谱
多源异构数据
混合神经网络模型
生成测试用例
校验方法