摘要
本发明公开了一种集成文本特征和方面特征的虚假评论检测方法,包括获取评论文本数据,对所述评论文本数据进行预处理;提取所述评论文本数据的文本特征,提取所述评论文本数据的方面特征;对所述评论文本数据进行第一聚类获得第一分类数据,对所述评论文本数据进行第二聚类获得第二分类数据;对所述第一分类数据进行语义关联分析得到虚假程度,对所述第二分类数据进行离散分析得到偏离程度;根据所述虚假程度和所述偏离程度建立虚假评论检测模型,将待检测评论文本输入所述虚假评论检测模型中,得到检测结果。该方法不仅可以提高集成文本特征和方面特征的虚假评论检测的精度,同时具有较好的可解释性,可以直接应用于虚假评论检测系统中。
技术关键词
虚假评论检测方法
数据
文本
论文
协方差矩阵
混合算法
情感分析模型
虚假评论检测系统
概率密度函数
拉格朗日乘子法
语义
模糊聚类算法
肘部法则
情感特征
因子
后验概率
邻域
标签