一种结合大模型单类别标注的NER模型训练方法

AITNT
正文
推荐专利
一种结合大模型单类别标注的NER模型训练方法
申请号:CN202411838546
申请日期:2024-12-13
公开号:CN119761513A
公开日期:2025-04-04
类型:发明专利
摘要
本发明公开了一种结合大模型单类别标注的NER模型训练方法,属于命名实体识别技术领域,在为如中医药、生物医疗、网络安全等的某些特定领域训练命名实体识别模型时,由于人工标注样本较少而导致训练得到的模型效果不佳;本发明可利用大模型单类别自动标注的结果提升该种情况下训练得到的命名实体识别模型的效果;大模型单类别自动标注结果可能有实体重叠现象,传统的模型构建和训练方法无法应对,因此本发明通过针对地设计模型结构和训练方法,使该种标注结果可以被充分利用。本发明通过大模型自动标注增大了可利用的训练数据量,且通过单类别预测的方式提高了自动标注质量,最终可以提升训练得到的命名实体识别模型的效果。
技术关键词
模型训练方法 命名实体识别模型 标签 命名实体识别技术 大语言模型 编码向量 文本 样本 序列 训练数据量 中医药 重叠现象 矩阵 参数 列表 生物 基础
系统为您推荐了相关专利信息
1
一种排水管网破损点的检测方法及装置
指纹 荧光 水质 图谱 排水管
2
一种主题与情感倾向性联合分析方法
联合分析方法 文本特征向量 主题特征 LDA模型 融合特征
3
一种基于分组特征聚合的可追溯联邦增量学习方法
增量学习方法 端节点 服务器 标签 蒸馏
4
一种基于半监督CNN-Transformer混合模型的多源地物分类方法
分类方法 激光雷达图像 局部特征提取 多源特征融合 多层特征融合
5
一种智能数据感知流程的可视化编排方法
编排方法 界面 标签文本 数据采集终端 Attention机制
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号