摘要
本发明公开了一种基于通道注意力和字符特征的文本命名实体提取方法。包括获取待识别的输入文本;构建命名实体识别模型,包括:BERT模型用于获取具有上下文信息的特征、语法结构和语义表示;CharCNN模块用于提取BERT模型输出结果中的字符级特征;DSENet模块用于增强BERT模型输出结果中的实体内容和实体位置特征表达;多层双向长短时记忆网络用于捕捉以上模块的输出进行特征融合后的融合结果中的长距离依赖关系;条件随机场用于对输出序列进行实体标注;将待识别的输入文本输入命名实体识别模型中,获得命名实体。本发明方案提升了实体识别的效果,在非结构化文本NER任务中具有较高的准确率和召回率。
技术关键词
命名实体提取方法
命名实体识别模型
BERT模型
字符
条件随机场
文本
注意力
语法结构
模块
通道
校准特征
序列
语义
网络
分段
标签
编码器
关系
线性
系统为您推荐了相关专利信息
生成智能
模块
大语言模型
语义关联网络
综合语义
文字提取方法
文本检测模型
文本识别
字符
检测头
大语言模型
光学字符识别
文档识别方法
位置指示信息
键值