摘要
本说明书涉及机器学习技术领域,具体地公开了一种资源数据分配方法及装置,其中,该方法包括:获取具有用于表征对象风险特征的特征数据的样本集、及标签集;利用预设的特征选择算法计算样本集中对应的多个原始特征中各原始特征的特征权重,并根据各原始特征的特征权重筛选出目标特征集;基于目标特征集、样本集及标签集,构建分类器;各原始特征的特征权重是基于不同样本在各原始特征下的距离确定的;不同样本在各原始特征下的距离是基于内部距离和外部距离计算得到的,内部距离用于表征当前原始特征下两个样本之间的距离,外部距离用于表征其他原始特征对当前原始特征下两个样本之间的距离的影响。上述方法能够提高特征选择的效率和准确率。
技术关键词
资源数据分配方法
样本
特征值
特征选择算法
构建分类器
风险
数据分配装置
粗糙集
对象
机器学习技术
处理器
指令
计算机程序产品
计算机设备
可读存储介质
模块
系统为您推荐了相关专利信息
生成对抗网络
联合损失函数
机器学习模型
传播算法
参数
指数
模型训练方法
生成训练样本
管理系统
XGBoost模型
带钢表面缺陷
连续学习方法
流式数据处理方法
蓄水池
记忆