摘要
本发明提供了一种基于深度学习技术的电力信息报文自动提取方法,涉及自然语言处理领域,为了解决电力系统中大量非结构化故障文本数据计算成本高,通用性和准确性低的技术问题,提供如下方案:S1、输入电力故障文本;S2、对所述电力故障文本进行预处理,得到离散形式的基本单元;S3、基于文本分类模块,对所述基本单元进行文本分类,输出分类结果;S4、基于命名实体识别模块,对所述基本单元进行命名实体识别,输出实体识别结果;本发明在电力信息报文自动提取领域具有良好的应用前景。
技术关键词
深度学习技术
BERT模型
命名实体识别
LSTM模型
文本
报文
CRF模型
模块
自然语言
电力系统
注意力
编码器
网络
核心
序列
数据
系统为您推荐了相关专利信息
预训练语言模型
指令优化
问答语料
答案
数据格式
监测方法
信用评分模型
非结构化文本
分布式文件系统架构
私有云
自然语言
更新方法
应用程序编程接口
超文本传输协议
语音
并行生成方法
文本
融合上下文信息
序列生成方法
终端设备