基于大数据分析的数据清洗方法

AITNT
正文
推荐专利
基于大数据分析的数据清洗方法
申请号:CN202411823896
申请日期:2024-12-12
公开号:CN119293408B
公开日期:2025-04-18
类型:发明专利
摘要
本申请涉及数据处理技术领域,尤其涉及一种基于大数据分析的数据清洗方法,方法包括:依据待清洗数据的低维表征获取核心数据,利用核心数据训练神经网络;计算各核心数据的训练有效性和低维表征中各维度的损失敏感度;计算核心数据之外各待清洗数据的选择概率,将选择概率大于选取阈值的待清洗数据作为新的核心数据;利用新的核心数据训练神经网络,迭代地获取新的核心数据,直至无法获取新的核心数据,或不存在核心数据之外的待清洗数据,完成数据清洗。通过本申请的技术方案,能够准确评估每一个待清洗数据的训练效果,提高数据清洗的准确性。
技术关键词
数据清洗方法 数据训练神经网络 核心 神经网络模型 降维算法 有效性 邻域 数据处理技术 密度 数值 参数 基准 编码 图像
系统为您推荐了相关专利信息
1
一种用户画像构建方法、装置、电子设备及存储介质
初始聚类中心 画像构建方法 构建用户画像 对象 因子
2
一种基于聚类算法的5G通信基站地址规划方法
地址规划方法 斯皮尔曼等级相关系数 聚类算法 通信基站 数据融合技术
3
拨测路径选择方法、装置、设备、存储介质和程序产品
链路 注意力机制 云主机 标识 数据
4
交易风险确定方法、装置、电子设备及计算机程序产品
长短期记忆网络 聚类算法 数据 交易特征 特征选择方法
5
一种基于图像识别技术的交通疏导系统
交通疏导系统 图像识别技术 交通诱导屏 图像处理单元 图像采集模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号