基于多损失函数组合与TOP-K的知识蒸馏方法及装置

正文

推荐专利

申请号：CN202510575473

申请日期：2025-05-06

公开号：CN120524980A

公开日期：2025-08-22

类型：发明专利

摘要

本发明提出一种基于多损失函数组合与TOP‑K的知识蒸馏方法和装置，包括将训练文本分别输入教师模型和学生模型执行文本翻译任务，得到教师概率分布和学生概率分布；保存该教师概率分布中K个最高的概率值及其对应的类别，并将其余类别对应的概率置零，得到TOP‑K概率分布；基于该学生概率分布和该TOP‑K概率分布的差异，构建多个损失函数，训练该学生模型；将该训练文本输入训练后的学生模型，得到该学生模型的性能指标，根据该性能指标判断是否继续训练该学生模型，若是，则再次执行该初始步骤，否则保存当前学生模型作为翻译模型，将待翻译的文本数据输入该分类模型，得到翻译结果。

技术关键词

知识蒸馏方法学生指标信息显示设备文本翻译模型教师蒸馏装置训练装置人工智能模型计算机程序产品非线性筛选装置电子设备可读存储介质因子处理器数据参数

系统为您推荐了相关专利信息

一种水利工程混凝土质量检测分析系统

评估预测模型水利工程混凝土检测分析系统分子模型特征提取单元

一种基于Blending集成学习的窃电检测识别方法

检测识别方法集成学习模型学习器台区用电量样本

一种智能化工作面煤与瓦斯突出危险区域动态预测方法

动态预测方法钻屑瓦斯解吸指标动态数据集瓦斯放散初速度多参数

一种基于mRMR和PO-LightGBM的光伏故障诊断方法

LightGBM模型故障诊断方法故障特征量 mRMR算法老化故障

一种幼儿及失能老人智能护理方法及系统

智能护理方法 LSTM模型生命体征数据生理指标监测成分分析

基于多损失函数组合与TOP-K的知识蒸馏方法及装置

站点导航

APP 下载