摘要
本发明实施例中提供了一种基于决策树的社交媒体虚假账号识别方法、装置及电子设备,属于数据处理技术领域,该方法包括:对收集到的行为数据进行数据清洗、数据去重以及数据标准化处理,得到标准数据DB;通过特征提取函数Ft从标准数据DB中提取特征向量X,计算数据集DB的熵H(DB),以及特征Zh、Xw、Sw、Nt的条件熵;基于根节点的特征值,将所述标准数据划分为多个子集Dz;基于特征向量Xn、决策树DT以及预设的分类函数Fc,生成新用户的行为数据Dn所对应的预测结果y=Fc(DT,Xn)。本发明能够提升社交媒体虚假账号识别的准确度。
技术关键词
账号识别方法
决策树模型
社交媒体平台
网络特征
特征值
电子设备
数据处理技术
效应
噪声数据
节点特征
模型更新
处理器通信
识别装置
系统为您推荐了相关专利信息
频域特征分析
程度评估方法
电缆绝缘层
降维特征
分布特征
需求识别方法
家庭
梯度提升决策树
特征值
协方差矩阵