一种融合汉字特征和词对关系的命名实体识别方法

正文

推荐专利

申请号：CN202410878469

申请日期：2024-07-02

公开号：CN118734853A

公开日期：2024-10-01

类型：发明专利

摘要

本发明涉及汉字文本识别领域，且公开了一种融合汉字特征和词对关系的命名实体识别方法，包括字符嵌入与原始BERT保持一致，不进行任何修改；将每个汉字进行24*24的图形向量化，然后将其拼接后再拉平，送入一个字形融合层得到字形嵌入向量；对于拼音嵌入，使用开源的PyPinyin包将输入的字符序列转换为相应的拼音序列，每个字符的拼音序列由罗马字符和四个声调组成；将字符嵌入、字形嵌入和拼音嵌入拼接在一起，送入一个融合层；将融合嵌入与位置嵌入和片段嵌入相加，形成BERT模型的输入，本发明具备弥补了汉字特征信息的缺失问题，还增强了模型处理嵌套和不连续实体的能力的优点。

技术关键词

命名实体识别方法汉字特征卷积模块 BERT模型拼音关系字符命名实体识别系统字形特征网格嵌套序列解码 LSTM模型编码多层感知机文本识别语义

系统为您推荐了相关专利信息

一种基于改进YOLOv8的货车地板破损检测方法

破损检测方法货车地板输出特征特征提取模块注意力机制

一种基于知识图谱的银行关联交易识别和监管的方法及系统

Siamese网络实体标识符规范化方法知识图谱构建融合算法

一种基于跨模态和深度修补的点云补全方法及相关设备

卷积模块多层特征融合输入端残差归一化补全方法

命名实体识别方法和命名实体识别模型构建方法

命名实体识别模型语义命名实体识别方法识别命名实体编码特征

一种铁路应急辅助决策方法及系统

事理图谱 BERT模型铁路语义角色标注辅助决策方法

一种融合汉字特征和词对关系的命名实体识别方法

站点导航

APP 下载