摘要
本公开提供一种基于知识蒸馏的模型训练方法、装置、电子设备及可读存储介质,涉及深度学习、计算机视觉、大语言模型等人工智能技术领域。其中,基于知识蒸馏的模型训练方法包括:根据目标任务确定目标领域,获取与所述目标领域对应的目标教师模型;根据所述目标教师模型中的教师骨干网络进行知识蒸馏,训练初始学生骨干网络,得到目标学生骨干网络;根据所述目标学生骨干网络以及与所述目标任务对应的目标头部网络,得到与所述目标任务对应的目标学生模型。本公开一方面有效地提升了目标学生骨干网络在针对目标任务进行特征提取时的性能,另一方面能够简化目标学生模型的获取步骤,提升目标学生模型的获取效率。
技术关键词
预测特征
学生
教师
网络
模型训练方法
蒸馏
数据
模型训练装置
电子设备
大语言模型
人工智能技术
计算机程序产品
计算机视觉
处理器通信
指令
可读存储介质
处理单元
存储器
系统为您推荐了相关专利信息
话题
数据生成器
生成对抗网络
矩阵
狄利克雷分配模型
工控入侵检测方法
内存模块
重构误差
注意力
编码器
长短期记忆神经网络模型
锂电池组动态
动态均衡调节
锂电池组管理
均衡方法