摘要
本发明公开了一种基于主题模型与专家知识融合的电力负荷多维特征量化方法,对政策文档集合进行预处理,得到预处理后的政策文档集合;定义核心特征维度作为一级变量,为每个一级变量下设二级变量,并确定每个二级变量对应的关键词集合;采用LDA模型对得到的预处理后的政策文档集合进行无监督主题发现,得到潜在主题分布以及词汇分布;构建一级变量映射矩阵和二级变量映射矩阵;利用小样本专家标注数据构建损失函数,对一级变量映射矩阵和二级变量映射矩阵进行优化;对于任意政策文档,根据优化后的一级变量映射矩阵计算其一级特征向量,根据优化后的二级变量映射矩阵计算其二级特征向量,以全面刻画政策文本的多维属性。
技术关键词
特征量化方法
主题模型
变量
矩阵
多层级特征
狄利克雷分布模型
梯度下降算法
电网结构优化
电力市场化改革
负荷
关键词
LDA模型
无监督
文本
核心
元素
定义
数据