摘要
本发明涉及电力大数据处理技术领域,公开了基于改进SO‑PMI算法的电力大数据词典构建系统。该系统包含语料预处理模块、算法适配模块、词频关联分析模块、词典层级构建模块和领域词库融合模块。语料预处理模块获取领域文本,提取基础词元,标记专业术语位置与频率,筛选高频核心词元,构建基础词元库;算法适配模块对词元权重赋值,调整SO‑PMI算法共现窗口与关联阈值,构建适配参数集;词频关联分析模块提取共现序列,比较关联强度,筛选关联词元组,得到关联关系集合;词典层级构建模块采集层级标签,匹配后得到层级归属标签组;领域词库融合模块将词元关联组划分至对应分类节点,生成领域词典。
技术关键词
词典
构建系统
层级
子模块
大数据
序列
标签组
算法
文本
节点
参数
索引
分析模块
基础
关系
生成电力
系统为您推荐了相关专利信息
家居管理系统
智能家居传感器
线性回归模型
线性回归方程
大数据分析技术
金融大数据分析
风险评估模型
分析单元
金融风险评估方法
多源异构数据
智能花卉培养装置
永磁式步进电机
视觉识别技术
减速步进电机
金属框架
产品推荐系统
计算机网络安全
智能预测方法
指数
数据预测模型