摘要
本申请公开了一种文本数据的分类方法、装置、存储介质及电子装置,涉及自然语言处理技术领域,该方法包括:对原始文本对应的语义嵌入向量进行分组,得到多组向量数据,其中,语义嵌入向量是原始文本的编码结果;确定每一组向量数据的主题文本,根据原始文本和主题文本确定分段嵌入向量;获取对待检测文本进行编码得到的上下文语义嵌入向量,其中,待检测文本包括以下之一:原始文本,主题文本;根据上下文语义嵌入向量与分段嵌入向量生成融合嵌入向量;将融合嵌入向量输入分类模型,得到分类模型输出的分类结果,其中,分类模型被训练为对文本数据进行情感倾向分类。采用上述技术方案,解决了文本分类模型分类性能不稳定的技术问题。
技术关键词
语义
大语言模型
分类方法
主题
分段
数据
前馈神经网络
分词
电子装置
注意力
文本分类模型
模块
解码器
分类装置
编码器
序列
聚类算法
词语