模型蒸馏方法、装置、介质、设备以及计算机程序产品

AITNT
正文
推荐专利
模型蒸馏方法、装置、介质、设备以及计算机程序产品
申请号:CN202411449233
申请日期:2024-10-16
公开号:CN119378646A
公开日期:2025-01-28
类型:发明专利
摘要
本公开涉及一种模型蒸馏方法、装置、介质、设备以及计算机程序产品,方法包括:获取用于进行模型蒸馏的教师模型的词表和学生模型的词表;基于所述教师模型的词表和所述学生模型的词表,确定所述教师模型和所述学生模型对应的共享词表;基于所述共享词表,对所述教师模型和所述学生模型输出的概率分布分别进行转换,获得所述教师模型和所述学生模型分别对应的转换概率分布,所述转换概率分布为所述共享词表中的词对应的概率分布;基于所述教师模型对应的转换概率分布和所述学生模型对应的转换概率分布,确定所述学生模型的目标损失;基于所述目标损失对所述学生模型进行训练。
技术关键词
学生 教师 模型蒸馏方法 计算机程序产品 矩阵 存储装置 蒸馏装置 模块 介质 电子设备 处理器
系统为您推荐了相关专利信息
1
基于地下介质传热模型的底部热流及深层温度反演方法
温度反演方法 热物性参数 数据 介质 电磁
2
一种基于人工智能的空间域识别方法
识别方法 基因表达数据 跨模态 注意力机制 卷积网络模型
3
赤潮藻环境下鱼类胁迫行为检测方法、装置、设备及介质
视觉特征 轨迹 多头注意力机制 全局特征提取 运动
4
一种基于动力学系统最优分岔的电力系统最优潮流全局优化方法
电力系统最优潮流 全局优化方法 积分系统 因子 局部优化算法
5
一种车载诊断和远程诊断结合方法和系统
车载诊断单元 车辆诊断系统 故障特征模型 诊断中心 历史运行数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号