摘要
本发明公开了一种电网作业违章代码自动识别方法及系统,涉及作业违章行为识别技术领域,包括:收集并预处理电网作业数据,剔除无关内容;接着,利用YEDDA标注工具对预处理后的文本数据进行BIO实体标注,并将标注数据输入BERT‑BiLSTM‑CRF中文NER模型进行训练,以获得模型权重。随后,基于训练好的NER模型权重对部分违章描述文本进行实体识别,提取关键词并构建关键词典。利用BOW模型生成违章代码的经典向量,并根据历史数据计算各违章代码的先验概率。对于新的违章描述,依据经典向量和贝叶斯原理计算后验概率,选择概率最高的违章代码作为识别结果。实现违章代码的智能化识别,提高电网作业管理的效率和准确性。
技术关键词
自动识别方法
电网现场作业
贝叶斯原理
文本
标注工具
后验概率
关键词
数据
实体
模型训练模块
电网作业现场
词典
样本
识别模块
算法
表达式
分词
处理器
计算机设备
优化器
系统为您推荐了相关专利信息
字词
职业技能评估方法
大数据
文本生成模型
分词
敏感信息识别
文本识别模型
策略
识别置信度
识别方法