一种基于预训练模型的中文命名实体识别方法

正文

推荐专利

申请号：CN202411729802

申请日期：2024-11-28

公开号：CN119721037A

公开日期：2025-03-28

类型：发明专利

摘要

本发明公开一种基于预训练模型的中文命名实体识别方法，用于知识图谱半自动化构建任务。该方法基于预训练模型BERT，先对输入文本字符token构建Trie结构得到[字符‑词语]对序列，将标注好的训练集输入BERT进行编码；在BERT内部Transformer层引入Lexicon Adapter结构，融合候选词汇向量与BERT内部隐藏状态；将融合后的文本特征输入eLSTM网络挖掘上下文关系，再将其输入CRF层实现实体标签输出。本发明通过改进字词信息特征融合计算方法，采用交互注意力捕获更多非线性信息，引入eLSTM网络捕获上下文特征，能够有效提升命名实体识别模型的性能。

技术关键词

预训练模型字符词语交互注意力 Viterbi算法上下文特征序列命名实体识别模型融合计算方法中文命名实体字词文本词典语义特征标签深度神经网络输入中文训练集

系统为您推荐了相关专利信息

基于风控场景的多分叉决策树切分方法及系统

变量场景决策树模型数据获取模块序列

基于问答系统的回答方法以及系统

问答系统摘要回答系统文本答案

一种基于大语言模型的全流程智能软件检测方法及系统

大语言模型软件检测方法软件检测系统扫描工具节点

医学知识图谱构建方法、装置、设备和存储介质

医学知识图谱实体对齐方法实体识别模型融合知识图谱计算机执行指令

基于机器视觉的自动化产品质量检测方法及装置

图像处理计算机产品质量检测方法产品质量检测装置图片字符

一种基于预训练模型的中文命名实体识别方法

站点导航

APP 下载