融合显性特征和隐性特征的古文命名实体识别模型

正文

推荐专利

申请号：CN202510520558

申请日期：2025-04-16

公开号：CN121009893A

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了一种融合显性特征与隐性特征的古文命名实体识别模型，属于自然语言处理领域。方法包括：首先采用预训练GuwenBERT模型结合多头自注意力机制提取文本显性语义特征；其次通过旋转位置编码捕捉汉字相对位置，结合词性标注和部首解析模块分别获取语法特征与字形语义来构建隐性特征层；继而设计多头交叉注意力机制，引入可学习动态权重实现自适应特征融合，使显性特征与位置/词性/部首三类隐性特征进行交互；最终通过条件随机场进行全局标签解码。该模型创新性地整合了古文特有的语法规则和汉字形义特征，实验表明其F1值显著优于基线模型，适用于古籍数字化、历史文献分析等领域，为数字人文研究提供了有效的技术支撑。

技术关键词

隐性特征前馈神经网络 Word2Vec模型语义向量交叉注意力机制命名实体识别模型特征提取模块语义特征命名实体识别方法词语文本编码模块生成汉字序列条件随机场词性信息语法特征标签

系统为您推荐了相关专利信息

一种基于混合检索与轻量级重排序的智能医学问答系统及方法

医学知识图谱医学问答方法语义向量文本医学影像病灶

基于模型的人工智能实时新闻推荐系统

新闻推荐系统协同过滤算法关键词结构化数据格式模型训练模块

一种基于多星组网的空间非合作目标协同感知方法及系统

航天器融合图像信息多头注意力机制协同感知方法分布式信息

一种基于语义通信的车载边缘计算任务卸载方法

路边单元卸载方法通信带宽时延拍卖算法

话术分类模型的优化方法、装置、计算机设备及存储介质

文本样本基准计算机设备前馈神经网络

融合显性特征和隐性特征的古文命名实体识别模型

站点导航

APP 下载