摘要
本发明涉及数据分析技术领域,公开了一种基于大数据的用户行为分析方法和装置,包括数据收集,收集用户生成的大量数据、数据清洗和预处理,处理原始数据,清除不准确、不完整或重复的信息、数据存储,将清洗后的数据存储在数据存储系统中、特征工程,提取有用的特征或属性,以便更好地描述用户行为、数据分析、模型建立、结果反馈、可视化和报告。本发明通过数据收集以及对收集的数据进行预处理,能够分辨数据中的缺失部分,并针对异常缺失数据以及不准确的数据进行筛除或自动补充,从而提高了整体数据中用户操作数据的连续性,同时也降低了因数据不完整而影响分析结果的现象,并提高整体分析结果的置信度。
技术关键词
分析方法
大数据
NoSQL数据库
特征工程
网站访问记录
数据存储系统
分布式存储系统
数据存储结构
数据存储方式
模型算法
推荐系统
关系型数据库
分析装置
数据分析模块
数据采集器
数据处理模块
数据储存空间
地理位置特征