摘要
本发明公开了数仓自动化ETL过程中的数据处理方法及系统;本发明涉及数据仓库技术领域;按照ETL流程图中定义的数据抽取步骤,从数据源表中抽取数据。在抽取过程中,根据配置的完整性检测规则,对抽取的数据进行初步检查,包括检查记录行数是否符合预期,和字段值是否为空或缺失;通过完整性检测规则,在数据抽取阶段就能有效过滤掉不符合要求的数据,如记录行数不符、字段值为空或缺失的数据。这避免了“垃圾数据”进入后续处理流程,保证了进入转换阶段的数据具有较高的质量基础。例如在客户信息抽取过程中,若客户姓名、联系方式等关键字段为空的数据会被标记并后续处理,确保后续分析基于完整有效的客户数据。
技术关键词
数据处理方法
一致性检测
可视化界面
清洗规则
告警规则
数据格式
支持动态配置
数据抽取工具
临时存储区域
生成算法
数据仓库技术
关键字
报表
报告
指标
逻辑
数据存储
可视化模块
通知
系统为您推荐了相关专利信息
鸟巢识别方法
电力设施
检测头
文本编码器
图像编码器
搜索模块
空间金字塔池化
测距模块
图像
数据采集模块
预训练语言模型
文本
数据处理方法
计算机程序产品
可读存储介质
足底压力图像
足底压力数据
数据处理方法
高分辨率相机
融合特征
芯片数据处理方法
双精度浮点数
逼近算法
芯片数据处理技术
数据处理系统