一种基于知识蒸馏的文本分类方法、装置、设备及介质

AITNT
正文
推荐专利
一种基于知识蒸馏的文本分类方法、装置、设备及介质
申请号:CN202510023145
申请日期:2025-01-07
公开号:CN119848256A
公开日期:2025-04-18
类型:发明专利
摘要
本申请公开了一种基于知识蒸馏的文本分类方法、装置、设备及介质,涉及自然语言处理领域,包括:将预设数据集输入至预训练文本分类模型得到第一输出结果、并输入至预设卷积神经网络模型得到第二输出结果;所述预训练文本分类模型为预训练模型微调后的模型;确定第一输出结果和第二输出结果的交叉熵,并根据交叉熵确定目标交叉熵损失,以及确定对应的蒸馏损失;基于目标交叉熵损失和蒸馏损失利用预设数据集对预设卷积神经网络模型进行训练得到目标文本分类模型,并部署至通用图形处理器,以便利用通用图形处理器处理文本分类任务。通过知识蒸馏轻量化大模型并部署到通用图形处理器,在减小模型尺寸和复杂度的同时又能保证良好的计算性能。
技术关键词
文本分类模型 通用图形处理器 文本分类方法 卷积神经网络模型 蒸馏 数据 预训练模型 文本分类装置 预训练语言模型 模型训练模块 存储计算机程序 特征值 内存 电子设备 标签 自然语言 可读存储介质 存储器
系统为您推荐了相关专利信息
1
一种基于深度学习的服务器安全风险识别方法及系统
风险识别方法 服务器运行日志 网络流量数据 特征值 初始聚类中心
2
云边协同的配电网小电流单相接地故障识别方法及装置
多粒度特征 学生 教师 信号特征 语义特征
3
结合模型蒸馏与离线缓存的模型优化管理系统
优化管理系统 蒸馏 离线 缓存命中率 复杂度
4
一种基于5G网络的电厂巡检机器人及方法
电厂巡检方法 巡检路径 局部路径规划算法 卷积神经网络模型 全局路径规划
5
一种车用线束视觉焊接系统
车用线束 焊接系统 颜色 烙铁头 焊锡丝
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号