一种基于无监督词重构的评论主题识别方法、系统、设备及存储介质

AITNT
正文
推荐专利
一种基于无监督词重构的评论主题识别方法、系统、设备及存储介质
申请号:CN202411870698
申请日期:2024-12-18
公开号:CN119647463A
公开日期:2025-03-18
类型:发明专利
摘要
本发明公开了一种基于无监督词重构的评论主题识别方法、系统、设备及存储介质,包括以下过程:S1,获取训练文本数据,将训练文本数据编码后得到向量矩阵;S2,将向量矩阵通过注意力加权运算得到训练文本数据的文本特征;S3,对文本特征进行降维计算后进行重构,得到主题词向量的线性组合;S4,将主题词向量的线性组合分类为相应的主题,选取可能性最高的结果为最终的主题词。促使模型在训练过程中专注于挖掘与输入文本主题语义一致性最高的主题词,从而进一步提高了主题提取的准确性,实现了利用无监督学习的方式从无标注输入文本中准确提取主题词。
技术关键词
主题识别方法 训练文本数据 主题词向量 矩阵 数据编码 注意力 词特征 主题语义 无监督学习 可读存储介质 处理器 重构模块 编码模块 识别系统 样本 计算机设备
系统为您推荐了相关专利信息
1
基于变换和量化的图像编码方法、装置和计算机设备
图像像素 变换算法 图像编码方法 曲线 计算机设备
2
基于深度生成模型与强化学习的蛋白质构象变化预测方法
蛋白质构象变化 深度生成模型 动态时空特征 噪声预测 注意力
3
一种自然语言处理方法
语句 特征值 自然语言 列表 主题
4
一种融合子空间表示与图结构学习的多视图聚类方法
聚类方法 全局结构信息 矩阵 迭代优化算法 拉普拉斯
5
一种基于实体对齐的网络数据资产安全识别方法及系统
实体 资产 图谱 识别方法 节点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号