摘要
本申请涉及数据处理技术领域,具体涉及基于数据挖掘的用户数据分析方法,该方法包括:获取用户浏览的网页文本数据,对文本数据进行预处理,获取网页中所有语句以及对应的单词;基于网页文本数据中单词的词频及词性分布状态,构建网页关键词性特征系数;基于单词对于网页的重要程度及语句之间的语义相似程度,构建主题内容连贯指数;基于网页之间的内容相关性构建核心内容关联指数,获取阻尼系数,结合PageRank算法,获取用户浏览网页的数据分析结果。本申请旨在结合用户浏览网页的主要内容特征获取阻尼系数,避免PageRank算法中的阻尼系数过大或过小,影响用户数据分析结果的准确性。
技术关键词
数据分析方法
语句
网页关键词
特征值
指数
语义向量
阻尼
主题
文本
数据处理技术
神经网络模型
度量
字符
因子
算法
序列
关系
系统为您推荐了相关专利信息
扩展模块
主控单元
一体化管理方法
磁吸式键盘
电源管理机制