摘要
本申请提供了一种面向政务公共数据的挖掘分析方法及系统,在对第一政务公共文本进行文本挖掘分析时,将第一政务公共文本的第一文本编码向量在语义角度进行分解得到主要语义成分向量和次要语义成分向量,然后基于权重进行合并,得到第二文本编码向量,该权重是调取训练政务公共文本进行调试得到的,可以聚焦政务公共文本中的主要语义特征。特征提取器也为结合训练政务公共文本进行调试得到的,能补齐自缺失语义的政务公共文本到语义完整政务文本之间的特征差异,则可还原第一政务公共文本到语义完整政务文本之间更主要的特征差异,以获得涵盖更完整语义信息的第二政务公共文本,令政务公共文本语义补齐的准确性更高。
技术关键词
编码向量
文本
政务
挖掘分析方法
偏心
误差
支持向量机训练
基准
计算机系统
分子
语义特征
处理器
存储器
样本
参数
数据
机制
程序