摘要
本申请属于数据库结构中用于提高数据质量的技术,涉及数据清洗规则的生成方法、数据资产的生成方法及设备和存储介质。在所述数据清洗规则的生成方法中使用蚁群算法从所述预设规则集中选择解决问题集合Q的最优的规则序列作为所述数据清洗规则。本发明通过规范表达式遍历数据库表字段及记录问题,同时模拟蚂蚁觅食行为的概率性优化算法,全局搜索数据清洗规则序列解空间,寻找最优规则序列,提高数据清洗效率。同时避免人工检索导致遗漏问题数据,也避免通过人工经验判断元数据、主数据问题带来的冗余及组合性能低效的问题,降低手动规划字段清洗规则序列的工作量和成本,提高解空间搜索能力和求最优解能力。
技术关键词
清洗规则
生成方法
蚂蚁
蚁群算法
表达式
数据清洗效率
资产
生成设备
数据库结构
序列
可读存储介质
周期
终点
节点
存储器
规则集
程序
处理器
计算机
系统为您推荐了相关专利信息
可编程交换机
线性回归模型
流水线
索引
层次化结构
物品位置信息
家居场景
定位方法
像素点
卡尔曼滤波
航空复合材料
批调度方法
热压成型工序
启发式方法
决策
机械臂标定方法
奇异值分解算法
矩阵
方程
基座坐标系