摘要
本申请提供一种数据清洗方法、装置、设备、介质及产品,涉及大数据领域。包括:获取待清洗数据;根据预设的增强学习模型,确定数据清洗规则,其中,预设的增强学习模型的状态空间为当前数据的质量特性,预设的增强学习模型的动作空间为清洗操作,预设的增强学习模型的奖励函数为基于清洗效果的提升度量,每个清洗操作包括对应的至少一个数据清洗规则;根据数据清洗规则,对待清洗数据进行数据清洗处理,以得到清洗后数据;根据清洗后数据和待清洗数据,确定待清洗数据的清洗效果;根据待清洗数据的清洗效果,优化预设的增强学习模型。本申请的方法,提升了数据清洗灵活性和数据清洗效果。
技术关键词
清洗规则
计算机执行指令
数据清洗方法
数据清洗设备
数据清洗装置
企业内部数据
度量
异常数据
度计算方法
可读存储介质
计算机程序产品
统计方法
聚类算法
处理器通信
存储器
模块
格式化
大数据
系统为您推荐了相关专利信息
运载火箭控制设备
蜻蜓算法
计算机执行指令
冗余
偏差
路面
车辆环境感知技术
语义分割网络
识别方法
后处理模块
动态
注意力
处理单元
覆冰检测方法
计算机执行指令
原型
客户端
计算机执行指令
联邦学习方法
分类器