摘要
本发明公开了一种结合大模型单类别标注的NER模型训练方法,属于命名实体识别技术领域,在为如中医药、生物医疗、网络安全等的某些特定领域训练命名实体识别模型时,由于人工标注样本较少而导致训练得到的模型效果不佳;本发明可利用大模型单类别自动标注的结果提升该种情况下训练得到的命名实体识别模型的效果;大模型单类别自动标注结果可能有实体重叠现象,传统的模型构建和训练方法无法应对,因此本发明通过针对地设计模型结构和训练方法,使该种标注结果可以被充分利用。本发明通过大模型自动标注增大了可利用的训练数据量,且通过单类别预测的方式提高了自动标注质量,最终可以提升训练得到的命名实体识别模型的效果。
技术关键词
模型训练方法
命名实体识别模型
标签
命名实体识别技术
大语言模型
编码向量
文本
样本
序列
训练数据量
中医药
重叠现象
矩阵
参数
列表
生物
基础
系统为您推荐了相关专利信息
联合分析方法
文本特征向量
主题特征
LDA模型
融合特征
分类方法
激光雷达图像
局部特征提取
多源特征融合
多层特征融合
编排方法
界面
标签文本
数据采集终端
Attention机制