摘要
本发明涉及数据清洗领域,具体涉及一种互联网开源信息数据清洗方法及系统。该方法首先获取不同用户选择的每条出行路线的出行开始时间和出行结束时间,以及用户在每条出行路线上的每个时刻的行车速度数据,根据用户的出行路线的出行开始时间的分布,获得用户的出行时间聚集度,并从每个用户的出行路线中筛选出旅行路线,根据选择相同旅行路线的用户的出行时间聚集度和数量,并结合各用户之间在相同旅行路线上的每个时刻的行车速度数据的差异,获得每个用户的旅行喜好程度,基于旅行喜好程度,对各用户的旅行信息数据进行清洗,并构建出知识图谱。本发明能够有效对非旅行爱好者的旅行信息数据进行清洗去除,提高知识图谱的构建质量。
技术关键词
数据清洗方法
车流量数据
互联网
时间差
速度
图谱
动态时间规整算法
数据清洗系统
皮尔逊相关系数
结点
指数
序列
处理器
存储器
时间段
实体
分子
系统为您推荐了相关专利信息
物流车辆调度方法
ADAS系统
工业车辆
修正代价函数
网格