基于知识蒸馏的模型训练方法、装置、电子设备与可读存储介质

AITNT
正文
推荐专利
基于知识蒸馏的模型训练方法、装置、电子设备与可读存储介质
申请号:CN202411677371
申请日期:2024-11-21
公开号:CN119761456A
公开日期:2025-04-04
类型:发明专利
摘要
本公开提供一种基于知识蒸馏的模型训练方法、装置、电子设备及可读存储介质,涉及深度学习、计算机视觉、大语言模型等人工智能技术领域。其中,基于知识蒸馏的模型训练方法包括:根据目标任务确定目标领域,获取与所述目标领域对应的目标教师模型;根据所述目标教师模型中的教师骨干网络进行知识蒸馏,训练初始学生骨干网络,得到目标学生骨干网络;根据所述目标学生骨干网络以及与所述目标任务对应的目标头部网络,得到与所述目标任务对应的目标学生模型。本公开一方面有效地提升了目标学生骨干网络在针对目标任务进行特征提取时的性能,另一方面能够简化目标学生模型的获取步骤,提升目标学生模型的获取效率。
技术关键词
预测特征 学生 教师 网络 模型训练方法 蒸馏 数据 模型训练装置 电子设备 大语言模型 人工智能技术 计算机程序产品 计算机视觉 处理器通信 指令 可读存储介质 处理单元 存储器
系统为您推荐了相关专利信息
1
一种基于情感迁移和演化博弈的衍生话题传播预测方法
话题 数据生成器 生成对抗网络 矩阵 狄利克雷分配模型
2
一种基于动态语义元体驱动的小样本事件检测方法
事件检测方法 句法结构 条件随机场 节点 文本
3
基于图注意力网络和变分自编码器的工控入侵检测方法
工控入侵检测方法 内存模块 重构误差 注意力 编码器
4
微电网日前风险规避投标方法及相关装置
电力 微电网 风险 投标方法 场景
5
锂电池组动态均衡方法、装置、设备、存储介质及计算机程序产品
长短期记忆神经网络模型 锂电池组动态 动态均衡调节 锂电池组管理 均衡方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号