摘要
公开了一种电力标准命名实体识别方法,方法中,对电力标准文本进行预处理操作获得输入文本;建立电力术语词典,并对词典进行词向量转化;基于BERT预训练模型将输入文本中的每个字转化为字级词嵌入向量;利用电力术语词典对输入文本进行分词操作,得到的词级词嵌入向量与字级词嵌入向量进行拼接得到输入向量;将输入向量通过BiLSTM网络进行上下文信息的学习,预测出每一个字属于不同标签的概率;利用CRF的转移矩阵规范标签之间的规则与相关性,输出该句的最佳输出序列作为预测结果。
技术关键词
命名实体识别方法
文本
词典
序列标注方法
标签
词嵌入向量
术语
代表
数据
划分方法
分词
电力设备
训练集
字词
矩阵
词语
网络
系统为您推荐了相关专利信息
双向神经网络
注意力
文本
矩阵
实体关系抽取方法
智能识别方法
局部空间特征
时序特征
依赖特征
双向长短期记忆网络
多模态数据融合
多通道
智能故障诊断方法
深层特征提取
智能故障诊断装置
电子墨水屏标签
电源开关控制电路
主控板
图像显示方法
NFC技术