摘要
本申请公开了一种长文本的标签分类方法、装置、设备、存储介质及产品,涉及计算机技术领域,公开了长文本的标签分类方法,包括:获取待分类文本;基于所述待分类文本,通过预设的大语言模型进行标签分类处理,得到标签分类结果。本申请中大语言模型通过位置编码将待分类文本转换为文本序列向量,再利用多头自注意力机制并行计算文本序列向量间的相关性,也即大语言模型能够并行处理文本序列向量,以此提高大语言模型的显存利用率,而显存利用率的提高能够实现大语言模型处理更多字符的长文本,也即大语言模型无需对长文本进行分割,从而避免分割所导致的语义丢失,进而提高长文本的标签分类准确性。
技术关键词
标签分类方法
文本
大语言模型
注意力机制
梯度下降算法
矩阵
误差
计算机程序产品
字符
信息编码
语义
序列
更新模型参数
分类设备
分段
特征值
处理器
系统为您推荐了相关专利信息
弱监督学习
非线性特征
聚类
深度神经网络
解码网络
语音识别模块
设备运行状态
交互终端
自然语言
多模态数据融合
分类系统
多模态信息融合
深度学习分类
EDA技术
BERT模型
重型燃气轮机
智能建模方法
数据驱动模型
序列
历史运行数据