基于检索的多标签文本分类方法、装置及可读介质

AITNT
正文
推荐专利
基于检索的多标签文本分类方法、装置及可读介质
申请号:CN202411383870
申请日期:2024-09-30
公开号:CN119322851A
公开日期:2025-01-17
类型:发明专利
摘要
本发明公开了一种基于检索的多标签文本分类方法、装置及可读介质,包括:采用混合增强方式对老师模型进行训练;将样本空间中的候选文本输入经训练的老师模型,建立用于检索的知识向量库;将训练文本分别输入经训练的老师模型和学生模型,得到第二嵌入表示、第二logits特征以及第三嵌入表示、第三logits特征,以构建基于贴近约束损失函数和交叉熵损失函数的知识蒸馏的损失函数,对学生模型进行训练;将待分类文本输入经训练的学生模型,得到第四嵌入表示和第四logits特征,根据第四嵌入表示在知识向量库中检索出k个近邻的第一嵌入表示及其对应的k个近邻的第一logits特征,以进行增强融合,得到增强的logits特征,以提高学生模型的文本分类准确率。
技术关键词
标签文本分类 老师 学生 焦点损失函数 模型训练模块 蒸馏 样本 分类准确率 处理器 非线性 数学 存储装置 可读存储介质 程序 电子设备 计算机 矩阵
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号