一种基于大模型的不平衡文本多层级分类方法及装置

正文

推荐专利

申请号：CN202411806282

申请日期：2024-12-10

公开号：CN119760136A

公开日期：2025-04-04

类型：发明专利

摘要

本发明公开了一种基于大模型的不平衡文本多层级分类方法及装置，本发明利用生成式大型语言模型分析不平衡文本数据，识别并筛选出互斥性标签集，并对样本量少的标签类别进行数据增加，将生成的新的文本加入到不平衡文本数据中，构成训练样本数据，并根据互斥性标签集和训练样本数据训练得到互斥标签多分类模型和非互斥多标签分类模型，先利用互斥标签多分类模型判断待分类样本是否属于互斥标签中的某一类文本，再根据判断结果决定是否进入非互斥多标签分类模型，能够更精准地处理标签之间的依赖关系，避免互斥标签被错误地同时预测，有效地解决了互斥标签和多标签分类问题。

技术关键词

层级分类方法训练样本数据多标签文本信息更新标签类别离线重构分类装置在线模块关系语义参数

系统为您推荐了相关专利信息

一种磨煤机一次风量预测方法

长短期记忆网络核主成分分析磨煤机度函数记忆单元

一种基于违规溯源路径评分的文档合规性判定方法

判定方法合规性报告路径结构版面分析技术

智能答复方法、智能答复装置、电子设备、存储介质

关键词模板语义答复方法标签

信息生成方法及其装置

问答模型记忆参数信息生成方法文本

一种文本快速生成视频的方法

视频数据字段查询匹配方法命名实体识别模型

一种基于大模型的不平衡文本多层级分类方法及装置

站点导航

APP 下载