摘要
本发明涉及大数据处理技术领域,尤其涉及一种基于大数据的职位名称聚类方法,该方法包括步骤:基于一专业领域内的多个职业转换序列提取职位转换信息;所述职位序列信息包括:职位名称,职位共现频率,职位共现密切度,职位转换持续时间和职位转换方向;基于所述职位序列信息计算表征所述职业转换序列中各职位名称之间相似性的亲密度,并基于所述亲密度构建职位高维矩阵;将所述职位高维矩阵中每个职位名称仅与其亲密度最大的职位名称相关联,得到稀疏化的职位高维矩阵;利用流形学习算法对所述职位高维矩阵进行职位特征提取,得到每个职位名称的职位特征;根据所述职位特征并利用基于密度的聚类算法对所述职位高维矩阵中的职位名称进行聚类,得到具有不同密度级别的相似职位集群;重复上述职位特征提取和聚类步骤,直至无法再进行聚类为止;计算表征各个相似职位集群之间相似性的亲密度,并利用基于密度的聚类算法对多个所述相似职位群进行聚类,得到不同的职位簇类。
技术关键词
职业
聚类方法
密度
流形学习算法
矩阵
数据获取模块
集群
频繁序列挖掘
频繁序列模式
核心
大数据处理技术
识别模块
专业
编码模块
系统为您推荐了相关专利信息
GPU服务器
潮流数据处理方法
批量
计算机设备
计算机程序产品
模型预测控制方法
温度预测模型
炉膛
变量
粒子群优化算法