摘要
本申请提供了一种基于主题相关性的电力系统威胁情报收集方法及系统,方法包括以下步骤:从语义、词频和关键词三个角度提取网页文本的特征向量;构建基于堆叠BiGRU的主题相关性评估模型,并设定以网页文本的特征向量作为模型输入,以构建的主题相关性评估模型为评估模型主体的主题相关性评估方法;集成提取的网页文本的特征向量以及主题相关性评估方法到主题爬虫中,采用所述主题爬虫爬取网页的分类结果。通过结合语义、词频和关键词构建了更具表征力的文本特征向量,使用堆叠的BiGRU避免不同类型向量相互干扰,提升了模型对文本序列的特征提取效果,将主题相关性评估与主题爬虫进行集成,从而实现面向公开互联网收集威胁情报。
技术关键词
相关性评估方法
主题爬虫
电力系统
文本特征向量
组合特征向量
情报收集系统
模型主体
爬取网页
生成关键词
标签
词袋模型
模块通信
语义特征
种子
输出特征
系统为您推荐了相关专利信息
文本特征向量
多层感知机
生成方法
引入注意力机制
矩阵
电力系统负荷预测
负荷预测模型
历史负荷数据
预测误差
前馈神经网络
服务器集群
协同系统
优先级管理系统
分布式缓存技术
电厂设备
超大规模
调度优化模型
发电机组
经济调度模型
解码器