摘要
本申请提供了文化大数据计算清洗方法、系统和介质。该方法包括:通过获取初始文化数据集,并进行预处理,获得结构化文化数据集,并通过预设数据清洗方法进行数据清洗,获得待评估文化数据集,对待评估文化数据集进行数据提取,获得数据质量评测数据,并进行处理,获得数据质量评测参数,再与预设数据质量需求阈值进行阈值对比,根据阈值对比结果生成计算清洗报告;本申请通过对获取多源的初始文化数据集并进行预处理、清洗和计算获得数据质量评测参数,通过阈值对比确定文化大数据的质量并生成计算清洗报告,从而实现了对多源文化大数据的计算清洗,提高数据质量和可用性。
技术关键词
数据清洗方法
大数据
非物质文化遗产
重复数据检测方法
清洗系统
报告
标签
参数
格式
艺术品
可读存储介质
去噪方法
时效性
程序
处理器
存储器
计算机