摘要
本发明实施例提供一种数据清洗方法、数据清洗装置、设备及存储介质,涉及人工智能领域。该方法包括:获取第一数据分类模型对应的训练数据集和模型训练参数,并根据训练数据集和模型训练参数确定训练数据集的数据稳定程度和数据信息量并对训练数据集进行分类,得到第一类训练数据、第二类训练数据;根据上述训练数据训练第一数据分类模型,得到第二数据分类模型并对目标训练数据集进行分类,得到第四类训练数据和第五类训练数据;若第五类训练数据质量校验失败,则根据第四类训练数据和第五类训练数据重新训练第二数据分类模型,直至第五类训练数据质量校验成功。本申请旨在解决现有的机器学习模型在大部分金融分类任务中效果不佳的问题。
技术关键词
数据分类模型
信息熵
数据清洗方法
数据清洗装置
优化训练数据
参数
计算机设备
模型训练模块
数据分析模块
可读存储介质
机器学习模型
存储计算机程序
处理器
网络
存储器
金融