文本数据的分类方法、装置、存储介质及电子装置

正文

推荐专利

申请号：CN202510621482

申请日期：2025-05-14

公开号：CN120541231A

公开日期：2025-08-26

类型：发明专利

摘要

本申请公开了一种文本数据的分类方法、装置、存储介质及电子装置，涉及自然语言处理技术领域，该方法包括：对原始文本对应的语义嵌入向量进行分组，得到多组向量数据，其中，语义嵌入向量是原始文本的编码结果；确定每一组向量数据的主题文本，根据原始文本和主题文本确定分段嵌入向量；获取对待检测文本进行编码得到的上下文语义嵌入向量，其中，待检测文本包括以下之一：原始文本，主题文本；根据上下文语义嵌入向量与分段嵌入向量生成融合嵌入向量；将融合嵌入向量输入分类模型，得到分类模型输出的分类结果，其中，分类模型被训练为对文本数据进行情感倾向分类。采用上述技术方案，解决了文本分类模型分类性能不稳定的技术问题。

技术关键词

语义大语言模型分类方法主题分段数据前馈神经网络分词电子装置注意力文本分类模型模块解码器分类装置编码器序列聚类算法词语

文本数据的分类方法、装置、存储介质及电子装置

站点导航

APP 下载