摘要
本发明提供一种基于双层CRF的实体识别系统,包括:单一标签输出模块,用于将当前文本数据输入包括双层CRF的NER模型,通过Bert、BiLSTM依次进行向量化和时序特征提取后,经过第一层CRF输所有单一标签及其每个位置的概率分布;复合标签输出模块,用于将所有单一标签每个位置的概率分布输入第二层CRF,根据在第二层CRF中标签转移概率矩阵确定的复合规则,将符合复合规则的单一标签组合为复合标签,输出不符合复合规则的单一标签和复合标签;实体识别模块,用于根据不符合复合规则的单一标签得到当前文本数据中的单一实体,根据复合标签得到当前文本数据中的复合实体。本发明通过双层CRF架构实现了分层解码机制,使得复合实体的识别准确性得到提高。
技术关键词
实体识别系统
复合标签
转移概率矩阵
文本
地理实体
数据
双层标签
序列
输出模块
实体识别方法
字符
维特比算法
识别模块
时序
层级
单层
解码机制
关系
系统为您推荐了相关专利信息
语音转写方法
视频通讯
隶属度函数
生成文字
双向长短期记忆网络
大语言模型
文本生成方法
表达式
文本生成系统
生成提示词
语义特征
视觉感知特征
全景图
采样模块
局部视觉特征