摘要
本发明涉及自然语言处理技术领域,特别涉及一种适用于不平衡小样本电力敏感数据的识别方法及系统。本发明对电力负面清单数据从两个维度对数据进行标注,即根据数据的敏感程度将数据标记为敏感或者不敏感,之后,再根据各类样本的数量将其标记为“少类别”或“多类别”,以此来引入标签间的关联信息。数据标注完成之后,使用双分支网络BERT‑Att‑KAN进行训练学习,其中BERT‑Att‑KAN的一个分支用于识别数据的敏感性,另一个分支用于判断数据的样本分布类别。本发明提升了电力负面清单数据的识别准确度。
技术关键词
Attention机制
识别方法
语义向量
电力
数据
样本
双标签
BERT模型
字词
注意力
训练集
文本
可读存储介质
双分支网络
标记
优化器
系统为您推荐了相关专利信息
资源调度模型
网络资源调度
网络调度方法
深度强化学习
空间金字塔池化
混合整数规划模型
配载方法
邻域搜索算法
堆场
装船