一种基于加权图模型的数据清洗方法

正文

推荐专利

一种基于加权图模型的数据清洗方法

申请号：CN202510247208

申请日期：2025-03-04

公开号：CN120162527A

公开日期：2025-06-17

类型：发明专利

摘要

本发明涉及数据处理技术领域，特别是涉及一种基于加权图模型的数据清洗方法。包括：收集并预处理原始数据，得到数据矩阵，基于数据矩阵构建无向加权图，并计算相似度；基于相似度计算得到节点的局部熵；基于局部熵，构建结构熵；引入正则化项，构建目标函数，并对目标函数进行优化处理，得到最优数据子集，作为数据清洗的结果。解决了现有的数据清洗方法依赖于大规模、已标注的数据集，而在实际应用场景中，高质量标注数据的获取成本较高，且在数据量不足时模型的性能会显著下降，限制广泛应用；传统的数据清洗算法在处理数据时缺乏对样本之间关系的深层次分析，容易遗漏重要的代表性样本或选入过多冗余样本的技术问题。

技术关键词

数据清洗方法节点邻居数据清洗算法变量索引正则化参数矩阵数据处理技术样本冗余度量指数场景关系

系统为您推荐了相关专利信息

一种基于B2B平台的超级商情招商平台及方法

平台项目招商方法展示产品图片展示企业信息

图节点分类模型的训练方法、图节点分类方法及相关设备

拓扑特征标签节点分类方法文本分类模型训练样本集

一种酒体勾调方法、装置、设备和存储介质

半成品规划算法指标勾调方法数据

基于用户行为模式识别的数据安全审计方法

数据安全审计方法模式识别嵌入特征基线生成图谱

一种欠驱动无人艇分布式协同队形重构的任务分配方法

欠驱动无人艇任务分配方法分布式协同任务分配策略无人艇编队

一种基于加权图模型的数据清洗方法

站点导航

APP 下载