摘要
本申请公开了一种数据清洗方法、装置、设备及存储介质,涉及数据处理技术领域,包括:从目标数据源中采集待清洗数据,并记录待清洗数据对应的元数据;基于元数据对待清洗数据进行数据类型分析、数据分布特征分析以及语义信息挖掘,以获取待清洗数据对应的数据分析结果;根据数据分析结果生成待清洗数据对应的若干数据清洗规则;基于若干数据清洗规则获取目标数据清洗规则集,并利用目标数据清洗规则集对待清洗数据进行数据清洗。通过根据对待清洗数据的实时分析结果生成数据清洗规则集,解决了数据清洗规则不够准确的问题。
技术关键词
清洗规则
数据清洗方法
数据分布
数据格式
自然语言
语义
数据清洗装置
数据挖掘算法
数据分析模块
深度学习模型
数据处理技术
关系
数据采集模块
可读存储介质
实体
时效性
逻辑
处理器
数值
系统为您推荐了相关专利信息
动态控制参数
环境光照强度
LED显示屏
环境交互系统
反射点
医疗数据分析方法
医疗知识图谱
大语言模型
生成智能
多智能体协作
故障诊断方法
注意力神经网络
故障特征
故障类别
异质