摘要
本发明涉及一种基于多编码器生成对抗学习的半监督文本分类方法及系统,属于监督学习技术领域,引入多编码器结构,为同一个文本样本提供多个输出表示。生成器部分将从随机噪声中采样得到的向量转化为和编码器的输出具有相同维度的向量表示,同时为了实现半监督文本分类,在判别器上构建无监督和有监督损失结合模块,利用生成对抗学习,不断促进生成器生成近似真实的对抗样本,同时提升判别器鉴别真实文本样本和生成器生成的对抗样本的能力,以及类别分类的能力。此外,通过生成器和判别器的联合优化,进一步提升编码器的文本语义表征能力。
技术关键词
生成对抗学习
监督文本分类
无标签样本
编码器结构
数据
随机噪声
监督学习技术
无监督
生成对抗网络
处理器
程序
模块
可读存储介质
存储器
参数
系统为您推荐了相关专利信息
风电功率预测方法
并行集成学习
XGBoost模型
模型预测值
粒子
自动化开发平台
数据采集单元
数据存储单元
数据管理模块
数据处理模块
风速风向传感器
大口径射电望远镜
传感器布局方法
风场
风速风向信息
隧道排水管道
管道横截面积
识别方法
高清摄像机
RANSAC算法
区块链技术
存储方法
资产
动态加密密钥
动态加密算法