摘要
本发明公开了一种基于云计算的交通大数据清洗系统,包括数据采集与分布式存储模块、多级动态清洗模块、质量评估模块;涉及数据处理技术领域,通过统计分析法计算得到数据缺失率和异常数据占比,动态选择三级清洗模式,实现清洗强度的智能调节,而通过质量评估模块中的设置,通过计算清洗数据与质量模板库中历史质量模板的时空相似性,将余弦相似度和基于欧氏距离的衰减因子相结合,综合考虑数据的方向和距离信息,从多个维度对清洗后数据与历史质量模板的相似性进行评估,避免了单一指标评估的片面性,以支持清洗策略升级,形成数据质量提升的闭环反馈,降低清洗策略决策单元的误判风险。
技术关键词
策略决策单元
多源交通数据
分布式存储模块
清洗策略
数据处理单元
模板
路段
识别异常数据
特征选择
分布式文件系统
支持向量回归
分区
三次样条插值
动态
交通运输工具
实时监测数据
地图数据库
系统为您推荐了相关专利信息
喷涂机器人
高速无线传输
无线通讯模块
实时通讯
无线传输协议
人工智能图片
人工智能技术
信息传输接口
图像采集系统
人工智能芯片
车辆自组网系统
中继节点
区块链智能合约
策略决策单元
多模通信模块
焦化用煤
化学分析模块
煤炭
采样系统
多元线性回归模型
快速存储方法
影像
数据安全
数据完整性校验
机器学习技术