摘要
本发明涉及风险检测的技术领域,公开了基于数据挖掘的税务数据风险检测方法及系统。首先基于改进的孤独森林算法进行数据质量评价,将质量得分低的税务数据进行指标化分解,得到处理后的税务数据集合;其次,使用XGBoost算法构建决策树,使用决策树组成初始XGBoost预测模型;再使用巨型犰狳优化算法优化初始XGBoost预测模型中决策树的个数和层数,生成最终XGBoost预测模型,根据处理后的税务数据集合输出税务数据预测值集合;最后,训练得到最小二乘支持向量机模型,结合税务数据预测值集合检测税务数据是否存在风险,完成税务数据风险检测。本发明通过对税务数据进行处理和分析,实现税务数据风险检测的目的,方法客观准确。
技术关键词
风险检测方法
支持向量机模型
数据
森林算法
XGBoost算法
白蚁
构建决策树
样本
指标
误差
模块
位置更新
分支
训练集
节点
因子
系统为您推荐了相关专利信息
分类模型训练方法
特征提取模块
对象识别方法
因子
图像组合
时序特征
双向长短期记忆网络
动态规划模型
历史销量数据
依赖特征
防撞预警方法
图像获取设备
多层感知机
超声波传感器
智能算法
推荐方法
多模态数据采集
工业
数据特征提取
文本
漏洞风险评估方法
图谱
实体
计算机程序产品
关系