一种基于知识蒸馏的文本分类方法、装置、设备及介质

正文

推荐专利

申请号：CN202510023145

申请日期：2025-01-07

公开号：CN119848256A

公开日期：2025-04-18

类型：发明专利

摘要

本申请公开了一种基于知识蒸馏的文本分类方法、装置、设备及介质，涉及自然语言处理领域，包括：将预设数据集输入至预训练文本分类模型得到第一输出结果、并输入至预设卷积神经网络模型得到第二输出结果；所述预训练文本分类模型为预训练模型微调后的模型；确定第一输出结果和第二输出结果的交叉熵，并根据交叉熵确定目标交叉熵损失，以及确定对应的蒸馏损失；基于目标交叉熵损失和蒸馏损失利用预设数据集对预设卷积神经网络模型进行训练得到目标文本分类模型，并部署至通用图形处理器，以便利用通用图形处理器处理文本分类任务。通过知识蒸馏轻量化大模型并部署到通用图形处理器，在减小模型尺寸和复杂度的同时又能保证良好的计算性能。

技术关键词

文本分类模型通用图形处理器文本分类方法卷积神经网络模型蒸馏数据预训练模型文本分类装置预训练语言模型模型训练模块存储计算机程序特征值内存电子设备标签自然语言可读存储介质存储器

系统为您推荐了相关专利信息

一种基于深度学习的服务器安全风险识别方法及系统

风险识别方法服务器运行日志网络流量数据特征值初始聚类中心

云边协同的配电网小电流单相接地故障识别方法及装置

多粒度特征学生教师信号特征语义特征

结合模型蒸馏与离线缓存的模型优化管理系统

优化管理系统蒸馏离线缓存命中率复杂度

一种基于5G网络的电厂巡检机器人及方法

电厂巡检方法巡检路径局部路径规划算法卷积神经网络模型全局路径规划

一种车用线束视觉焊接系统

车用线束焊接系统颜色烙铁头焊锡丝

一种基于知识蒸馏的文本分类方法、装置、设备及介质

站点导航

APP 下载