一种命名实体识别大模型训练方法及命名实体识别方法

正文

推荐专利

申请号：CN202510592461

申请日期：2025-05-08

公开号：CN120524988A

公开日期：2025-08-22

类型：发明专利

摘要

本发明公开了一种命名实体识别大模型训练方法及命名实体识别方法，所述命名实体识别模型包括依次信号连接的BERT层、Encoder层、MLP层和CRF层，该训练方法包括以下步骤：获取训练集，所述训练集包括原文本且与所述原文本语义相等但句式不同的相似文本，所述原文本和所述相似文本均为单句；将所述原文本和相似文本依次输入BERT层、Encoder层生成所述原文本和所述相似文本中每个基本单元的token向量并对所述token向量按照基本单元中的实体类型进行分组并拉近每组内的所有token向量、拉远组与组之间的token向量；将所述原文本对应的token向量输入MLP层和CRF层进行模型参数调整。该方法减小噪声的引入，实体表示无偏移，增强模型对实体类型的识别能力、鲁棒性和泛化能力。

技术关键词

命名实体识别方法命名实体识别模型文本模型训练方法训练集大语言模型语义鲁棒性参数信号噪声

系统为您推荐了相关专利信息

一种大模型长文本处理能力评测方法，电子设备、存储介质

能力评测方法答案文本可读存储介质电子设备

基于多模态大语言模型的人脸活体检测方法、装置、设备及存储介质

大语言模型识别人脸图像人脸活体检测方法视觉特征多模态

基于多模态大语言模型的工地安监智能体系统

智能体系统大语言模型安监工地视觉特征编码

一种音乐自适应调节方法及设备

音乐智能眼镜视觉特征信息列表生理特征参数

一种基于人工智能的标准数字化建模与校验方法及其系统

动态知识图谱多源异构数据混合神经网络模型生成测试用例校验方法

一种命名实体识别大模型训练方法及命名实体识别方法

站点导航

APP 下载