摘要
本申请涉及数据处理技术领域,具体涉及基于数据分析的客户行为特征提取方法,该方法包括:获取客户浏览的网页文本数据,对文本数据进行预处理,获取网页中所有语句以及对应的单词;基于网页文本数据中单词的词频及词性分布状态,构建网页关键词性特征系数;基于单词对于网页的重要程度及语句之间的语义相似程度,构建主题内容连贯指数,利用PageRank算法获取PageRank值;综合网页之间的内容相关性、客户对网页的点击次数以及停留时长,得到客户行为特征提取结果。本申请旨在抵御低质量链接对网页排名的影响,提升客户行为特征提取的精确度。
技术关键词
语句
网页关键词
特征提取方法
客户
PageRank算法
特征值
语义向量
主题
指数
兴趣
因子
文本
数据处理技术
神经网络模型
度量
字符
序列
阻尼
标记
系统为您推荐了相关专利信息
智能服务机器人
供电营业厅
机器人躯干
二维码扫码器
人脸识别摄像头
工业互联网平台
客户端
无依赖关系
识别码
服务端
智能响应方法
流量预测模型
物联网流量
历史流量数据
凸优化算法
选品方法
分布式日志采集系统
混合整数规划模型
分布式数据采集
协同过滤算法