摘要
本发明涉及数据挖掘技术领域,特别涉及一种基于用户发言多维特征的高影响力社交用户识别方法及系统,通过对社交网络数据进行社交主题划分,获取每个用户在各社交主题中的所有发言集合;基于各用户的发言集合从多个维度提取每个社交主题中用户特征,并基于用户特征预测在对应社交主题下的用户影响力,所述多个维度包括:用户发言内容、用户发言风格、用户发言互动量及用户发言时间分布;统计各用户在所有社交主题下的用户影响力并形成用户表示向量,基于用户表示向量并利用集成学习方法识别高影响力用户。本发明能够提取更全面的发言特征,在提升高影响力用户识别准确度的同时,能够使高影响力用户识别范围更广。
技术关键词
社交
主题
识别方法
集成学习方法
文本
分布特征
词语
网络
预训练模型
特征提取模块
时间段
序列
预训练语言模型
数据挖掘技术
矩阵
输出模块
字符
词典
可读存储介质
系统为您推荐了相关专利信息
工作流
非暂时性机器可读存储介质
编排方法
网格
处理器
击剑系统
摩擦材料
深度学习模型
信息识别方法
热力图