摘要
本发明公开了一种基于Transformer的半监督文本分类算法,涉及文本分类算法技术领域,包括以下步骤:步骤1:数据预处理;步骤2:数据划分;步骤3:Transformer模型训练;步骤4:打标:步骤5:置信度筛选;步骤6:随机化;步骤7:模型训练;步骤8:模型评估。本发明中,利用置信度以及随机化技术,只需要在小部分标注数据的基础上,就能接近原先需要大量标注数据的分类效果,从而大幅提高了文本分类的效率。
技术关键词
监督文本分类
训练集
bert模型
文本分类算法
策略
梯度下降算法
模型主体
中文分词
解码器
数据
样本
比率
网络结构
参数
编码器
阶段
模块
框架
系统为您推荐了相关专利信息
充放电策略
等效电路模型
蓄电池荷电状态
蓄电池储能优化
在线
温度预测模型
计算机散热
历史温度数据
进程
计算机组件
板材冷却装置
温度采集模块
焊接热源模型
接触式温度传感器
液氮喷淋装置