摘要
本发明公开了一种面向社交媒体热点话题的情感倾向分类方法,包括:收集社交媒体的用户公开属性信息和曾发表过的博文并格式化为字符串,形成待分类文档;建立词节点和文档节点,在词节点与文档节点之间以及词节点与词节点之间建立边,计算词频‑逆文档频率的值和正逐点互信息的值作为边的权重,利用RoBERTa模型对文档节点进行嵌入,得到文档特征向量,将词节点特征初始化为0,得到文本图的节点特征矩阵;分别得到基于RoBERTa模型的分类概率向量和基于GCN模型的分类概率向量,对两者进行加权求和,得到联合分类概率向量,从联合分类概率向量中选择概率最高的类别,作为分类的结果。本发明能够客观且全面地挖掘用户面对不同社交媒体热点话题所隐含的情感倾向。
技术关键词
GCN模型
情感倾向分类方法
节点特征
滑动窗口
社交
媒体
矩阵
格式化
文本
计算机程序产品
处理器
计算机设备
可读存储介质
频率
存储器
参数
标签
代表