摘要
本发明提供了一种基于迁移学习的长文本分类方法,属于文本自动分类技术领域,包括以下步骤:基于覆盖分割和层级位置编码对长文本序列进行编码,获得多文本编码;将所述多文本编码输入到并行的预训练语言模型中,获得多文本特征;将所述多文本特征输入到层级注意力模型中,获得长文本特征;基于长文本特征通过全连接网络层对文本进行分类,获得长文本分类结果。本发明可以有效进行文本分类,并提高长文本分类的准确率。
技术关键词
文本分类方法
注意力模型
注意力机制
编码
序列
Softmax函数
自动分类技术
层级
双向长短期记忆
预训练语言模型
表达式
计算方法
批量
矩阵
参数
系统为您推荐了相关专利信息
状态诊断方法
融合特征
交互特征
多模态交互
时间序列预测模型
评标方法
大语言模型
实体
解析工具
语义理解模型
重排特征
融合特征
表面缺陷检测方法
多层次特征
表面缺陷检测装置
风险
大语言模型
数据处理方法
文本
数据处理设备