摘要
本发明提供了一种基于政务行业大模型的命名实体识别方法及相关设备,该方法包括:在初始数据集中筛选目标政务领域的各个政务文本;对各个政务文本进行数据预处理;基于训练任务和经过预处理的政务文本,构建样本数据集;基于样本数据集对每个初始模型进行训练,得到各个候选模型;对每个候选模型进行性能评估,得到每个候选模型的性能评估结果;根据性能评估结果,选择性能最优的候选模型作为政务行业大模型;应用政务行业大模型对待识别的政务文本进行命名实体识别。应用本发明的方法,可通过基于目标政务领域的样本数据构建的模型进行命名实体识别,模型基于其学习能力亦可在未掌握的数据上完成命名实体识别,可提高命名实体识别的准确性。
技术关键词
政务
命名实体识别方法
数据
关键词
文本分类模型
多头注意力机制
样本
命名实体识别装置
多任务联合训练
标注规则
分词
指令
层级
算法
存储器
电子设备
网络