文本数据的分类方法、装置、存储介质及电子装置

AITNT
正文
推荐专利
文本数据的分类方法、装置、存储介质及电子装置
申请号:CN202510621482
申请日期:2025-05-14
公开号:CN120541231A
公开日期:2025-08-26
类型:发明专利
摘要
本申请公开了一种文本数据的分类方法、装置、存储介质及电子装置,涉及自然语言处理技术领域,该方法包括:对原始文本对应的语义嵌入向量进行分组,得到多组向量数据,其中,语义嵌入向量是原始文本的编码结果;确定每一组向量数据的主题文本,根据原始文本和主题文本确定分段嵌入向量;获取对待检测文本进行编码得到的上下文语义嵌入向量,其中,待检测文本包括以下之一:原始文本,主题文本;根据上下文语义嵌入向量与分段嵌入向量生成融合嵌入向量;将融合嵌入向量输入分类模型,得到分类模型输出的分类结果,其中,分类模型被训练为对文本数据进行情感倾向分类。采用上述技术方案,解决了文本分类模型分类性能不稳定的技术问题。
技术关键词
语义 大语言模型 分类方法 主题 分段 数据 前馈神经网络 分词 电子装置 注意力 文本分类模型 模块 解码器 分类装置 编码器 序列 聚类算法 词语
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号