地名识别方法、装置、计算机设备、可读存储介质和程序产品

正文

推荐专利

申请号：CN202411704707

申请日期：2024-11-26

公开号：CN119578424B

公开日期：2025-11-04

类型：发明专利

摘要

本申请涉及一种地名识别方法、装置、设备、存储介质和程序产品，涉及自然语言处理技术领域。采用本方法能够缓解过拟合和知识遗忘的问题。该方法包括：对获取的初始训练数据进行格式转换，得到由待提取文本和提取后地名组成的当前训练数据；查询提取后地名对应的多个同义词，基于多个同义词，对当前训练数据进行数据增强，得到目标训练数据集；根据多个同义词、负面例子和分类损失，构造辅助分类任务；基于目标训练数据集和辅助分类任务，对初始模型进行训练，直至初始模型的模型参数与目标参数相同，得到初步训练模型；获取模型微调损失，根据模型微调损失，对初步训练模型进行调整，得到预训练模型；预训练模型用于地名识别。

技术关键词

同义词预训练模型地名识别方法数据适配器矩阵文本参数计算机设备模型训练模块可读存储介质格式标签计算机程序产品处理器自然语言语义存储器

系统为您推荐了相关专利信息

一种基于大模型的政务数据处理方法、装置、设备及存储介质

政务数据处理语义关联度人机交互界面资源库生成式对抗网络技术

一种基于汽车监控图像识别的汽车防盗方法及系统

汽车防盗方法深度学习模型图像防盗模块生成媒体信息

一种用于模型训练与应用的车路云协同系统

车载单元路侧单元标识下载数据训练参数集

一种基于知识图谱的保温板生产线故障诊断方法

保温板生产线故障诊断方法故障诊断推理图谱知识本体

数据去噪方法、装置、电子设备及存储介质

数据去噪方法样本大语言模型基准标签聚类

地名识别方法、装置、计算机设备、可读存储介质和程序产品

站点导航

APP 下载