一种基于机器学习的数据清洗方法及系统

正文

推荐专利

一种基于机器学习的数据清洗方法及系统

申请号：CN202410933762

申请日期：2024-07-12

公开号：CN118469044B

公开日期：2024-09-24

类型：发明专利

摘要

本发明涉及数据处理技术领域，具体涉及一种基于机器学习的数据清洗方法及系统，获取空气中PM2.5的浓度数据时序序列，计算时序序列内每个数据点的初始标签值；得到PM2.5的浓度数据时序序列中每个数据点的相似数据点；根据每个数据点的初始标签值构成每个数据点的修正标签序列；根据修正标签序列中的每个标签值、每个相似数据点的标签值以及每个数据点与每个数据点的每个相似数据点的时间间隔，得到每个数据点的最终修正标签序列，最后从所有数据点中筛选出若干个异常数据点。本发明通过对每个数据点的标签值进行不断的修正，结合每个数据点的修正标签序列中每种标签值出现的频数，提高了识别异常数据的准确性。

技术关键词

标签数据清洗方法序列皮尔逊相关系数异常数据点时序数据清洗系统识别异常数据周期性数据处理技术处理器存储器时间段聚类空气算法

系统为您推荐了相关专利信息

基于联盟链和深度学习的数字金融欺诈识别方法及系统

欺诈识别方法数字金融业务预警机制深度学习模型数据共享平台

异形曲面楼承板混凝土喷射成型方法及系统

混凝土坍落度坐标孔洞喷射成型方法曲面

一种铁包调度的方法及装置

转炉数据高炉计划粒子群算法

基于自适应分层学习的长尾人类移动预测方法

移动预测方法层级分层树结构马斯洛需求层次理论标签

一种数据标签确定方法、电子设备及存储介质

列表数据标签字段特征值电子设备

一种基于机器学习的数据清洗方法及系统

站点导航

APP 下载