摘要
本发明公开了一种基于大模型的不平衡文本多层级分类方法及装置,本发明利用生成式大型语言模型分析不平衡文本数据,识别并筛选出互斥性标签集,并对样本量少的标签类别进行数据增加,将生成的新的文本加入到不平衡文本数据中,构成训练样本数据,并根据互斥性标签集和训练样本数据训练得到互斥标签多分类模型和非互斥多标签分类模型,先利用互斥标签多分类模型判断待分类样本是否属于互斥标签中的某一类文本,再根据判断结果决定是否进入非互斥多标签分类模型,能够更精准地处理标签之间的依赖关系,避免互斥标签被错误地同时预测,有效地解决了互斥标签和多标签分类问题。
技术关键词
层级分类方法
训练样本数据
多标签
文本
信息更新
标签类别
离线
重构
分类装置
在线
模块
关系
语义
参数
系统为您推荐了相关专利信息
长短期记忆网络
核主成分分析
磨煤机
度函数
记忆单元