摘要
本发明属于数据分类技术领域,公开了模拟决策过程中人类成对比较的二分类方法及系统,该方法通过对输入数据进行清洗和特征标准化处理,引入随机森林方法进行数据的特征提取;利用乘法优先度模拟决策过程中人类成对比较构建二分类模型并进行模型优化;使用训练数据对分类模型进行训练;采用交叉验证技术评估模型性能和泛化能力,选择性能最佳的模型参数;将待分类的数据输入训练好的模型,得到二分类结果,并输出类别标签或属于每个类别的概率值。本发明将传统特征工程方法与随机森林方法有机结合,可更为全面、精准地对数据特征加以提取。相较于单一方法或其他常规组合方式,本发明所采用的方法显著提升了分类的准确性与可靠性。
技术关键词
分类方法
二分类模型
决策
人类
分类模型构建
样本
随机梯度下降
分类规则
特征工程方法
数据分类技术
表达式
分类器
标签
更新模型参数
随机森林模型
指标
非线性