摘要
本申请涉及一种地名识别方法、装置、设备、存储介质和程序产品,涉及自然语言处理技术领域。采用本方法能够缓解过拟合和知识遗忘的问题。该方法包括:对获取的初始训练数据进行格式转换,得到由待提取文本和提取后地名组成的当前训练数据;查询提取后地名对应的多个同义词,基于多个同义词,对当前训练数据进行数据增强,得到目标训练数据集;根据多个同义词、负面例子和分类损失,构造辅助分类任务;基于目标训练数据集和辅助分类任务,对初始模型进行训练,直至初始模型的模型参数与目标参数相同,得到初步训练模型;获取模型微调损失,根据模型微调损失,对初步训练模型进行调整,得到预训练模型;预训练模型用于地名识别。
技术关键词
同义词
预训练模型
地名识别方法
数据
适配器
矩阵
文本
参数
计算机设备
模型训练模块
可读存储介质
格式
标签
计算机程序产品
处理器
自然语言
语义
存储器
系统为您推荐了相关专利信息
政务数据处理
语义关联度
人机交互界面
资源库
生成式对抗网络技术
汽车防盗方法
深度学习模型
图像
防盗模块
生成媒体信息
保温板生产线
故障诊断方法
故障诊断推理
图谱
知识本体