一种结合大模型单类别标注的NER模型训练方法

正文

推荐专利

申请号：CN202411838546

申请日期：2024-12-13

公开号：CN119761513A

公开日期：2025-04-04

类型：发明专利

摘要

本发明公开了一种结合大模型单类别标注的NER模型训练方法，属于命名实体识别技术领域，在为如中医药、生物医疗、网络安全等的某些特定领域训练命名实体识别模型时，由于人工标注样本较少而导致训练得到的模型效果不佳；本发明可利用大模型单类别自动标注的结果提升该种情况下训练得到的命名实体识别模型的效果；大模型单类别自动标注结果可能有实体重叠现象，传统的模型构建和训练方法无法应对，因此本发明通过针对地设计模型结构和训练方法，使该种标注结果可以被充分利用。本发明通过大模型自动标注增大了可利用的训练数据量，且通过单类别预测的方式提高了自动标注质量，最终可以提升训练得到的命名实体识别模型的效果。

技术关键词

模型训练方法命名实体识别模型标签命名实体识别技术大语言模型编码向量文本样本序列训练数据量中医药重叠现象矩阵参数列表生物基础

系统为您推荐了相关专利信息

一种排水管网破损点的检测方法及装置

指纹荧光水质图谱排水管

一种主题与情感倾向性联合分析方法

联合分析方法文本特征向量主题特征 LDA模型融合特征

一种基于分组特征聚合的可追溯联邦增量学习方法

增量学习方法端节点服务器标签蒸馏

一种基于半监督CNN-Transformer混合模型的多源地物分类方法

分类方法激光雷达图像局部特征提取多源特征融合多层特征融合

一种智能数据感知流程的可视化编排方法

编排方法界面标签文本数据采集终端 Attention机制

一种结合大模型单类别标注的NER模型训练方法

站点导航

APP 下载