摘要
本发明公开了一种基于BERT模型和结合K‑means思想的LDA主题模型的文本情感分析方法,包括以下步骤:(1)对文本数据集进行预处理;(2)使用LDA主题模型获取每个文本的主题分布及词分布,提取权重最高的主题词并与原始文本拼接生成新数据集;(3)结合K‑means聚类思想,新数据集再次应用LDA主题模型,迭代提取主题词并与原始文本重复拼接,直至主题分布收敛;(4)将最终拼接主题词的文本输入BERT模型生成上下文感知的词向量;(5)通过SoftMax分类器输出文本情感类别;本发明提高了文本与主题词的相符度,增强了文本的情感极性。
技术关键词
文本情感分析方法
BERT模型
LDA主题模型
生成上下文感知
情感类别
数据
生成文档
分类器
分类特征
处理器
分词
矩阵
存储器
注意力
编码器
电子设备
索引
系统为您推荐了相关专利信息
数据分析方法
情感词典
预训练语言模型
Word2Vec模型
数据分析系统
文本分类方法
文本分类模型
BERT模型
注意力机制
语义
布局生成方法
BERT模型
生成用户界面
节点特征
文本分类模型
产品智能推荐方法
问答知识库
文本
关键词
生成产品