摘要
本发明公开了一种基于无监督词重构的评论主题识别方法、系统、设备及存储介质,包括以下过程:S1,获取训练文本数据,将训练文本数据编码后得到向量矩阵;S2,将向量矩阵通过注意力加权运算得到训练文本数据的文本特征;S3,对文本特征进行降维计算后进行重构,得到主题词向量的线性组合;S4,将主题词向量的线性组合分类为相应的主题,选取可能性最高的结果为最终的主题词。促使模型在训练过程中专注于挖掘与输入文本主题语义一致性最高的主题词,从而进一步提高了主题提取的准确性,实现了利用无监督学习的方式从无标注输入文本中准确提取主题词。
技术关键词
主题识别方法
训练文本数据
主题词向量
矩阵
数据编码
注意力
词特征
主题语义
无监督学习
可读存储介质
处理器
重构模块
编码模块
识别系统
样本
计算机设备
系统为您推荐了相关专利信息
图像像素
变换算法
图像编码方法
曲线
计算机设备
蛋白质构象变化
深度生成模型
动态时空特征
噪声预测
注意力
聚类方法
全局结构信息
矩阵
迭代优化算法
拉普拉斯