摘要
本申请公开了模型蒸馏方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及大模型、深度学习等人工智能领域。具体实现方案为:获取第一样本;其中,第一样本是采用多个教师模型生成的,第一样本包括第一提示词及第一提示词对应的第一答复信息;将第一样本输入到学生模型,以获取学生模型输出的第一答复信息的第一概率;其中,教师模型的正向评估指标大于学生模型的正向评估指标;根据第一概率,对学生模型进行训练,得到第一蒸馏模型。
技术关键词
语句
模型蒸馏方法
教师
样本
学生
生成提示词
模块
蒸馏装置
指标
聚类
电子设备
计算机程序产品
处理器通信
生成装置
生成方法
指令
可读存储介质
系统为您推荐了相关专利信息
抗菌药物
耐药表型
优化预测模型
前馈神经网络
标签
设备状态监测方法
待测设备
计算机执行指令
算法模型
策略
路面附着系数
车辆控制方法
识别神经网络
点云
训练集优化