摘要
本发明属于但不限于主题挖掘技术领域,公开了基于Wasserstein自编码器的网络事件主题挖掘方法及系统,构建基于Wasserstein自编码器的神经主题模型EWTM,输入为事件中的文本数据,先对文本数据进行数据清洗、分词、去停用词的操作,得到词袋表示;在每个训练周期中,对词袋表示进行编码操作,获得文档的主题向量;使用贝塔分布从隐变量中采样计算MMD损失;之后计算重构损失,最终得到了总体损失;进行反向传播,并使用优化器进行参数更新,从而优化EWTM模型;这个过程不断迭代,直到达到指定的训练周期数。本发明能够自动发现和提取社交网络事件的主题,从而更好地理解事件的核心信息以及用户关注的焦点。
技术关键词
主题挖掘方法
编码器
神经主题模型
信息数据处理终端
网络
多层感知器
挖掘系统
重构
解码器
文本
计算机设备
变量
优化器
处理器
高斯核函数
挖掘技术
周期
系统为您推荐了相关专利信息
图像特征向量
电子
高层次
深度学习模型
识别方法
组件检测方法
白名单库
黑名单库
漏洞平台
特征值
代理模型构建方法
微带阵列天线
物理
模型训练算法
仿真软件
监测方法
人脸
Sigmoid函数
车辆
生成字符图像