一种大语言模型主动反馈知识蒸馏方法

正文

推荐专利

一种大语言模型主动反馈知识蒸馏方法

申请号：CN202510179132

申请日期：2025-02-18

公开号：CN120124671A

公开日期：2025-06-10

类型：发明专利

摘要

本发明公开了一种大语言模型主动反馈知识蒸馏方法，属于人工智能技术领域，包括模块一与模块二，模块一由教师大语言模型库、轻量级学生模型、输入样本组成，模块二由输出样本、微调教师模型组成；知识蒸馏方法包括以下步骤：S1、轻量级学生模型通过输入样本进行监督学习；S2、教师大语言模型库对轻量级学生模型进行知识蒸馏；S3、轻量级学生模型经过知识蒸馏输出知识形成输出样本，筛选采样其中m%的输出样本作为反馈样本；S4、将反馈样本输入到教师大语言模型库中进行微调并形成微调教师模型，通过微调教师模型对轻量级学生模型再次进行知识蒸馏；本发明可以增强模型的泛化能力并提高知识传递的效率与效果。

技术关键词

知识蒸馏方法样本教师模型库学生大语言模型梯度下降算法文本句式结构模块预训练模型人工智能技术矩阵策略编码器数据分区参数标签

系统为您推荐了相关专利信息

一种多源感知下基于沙普利值的权重分配方法和系统

权重分配方法网络分配系统确定性策略梯度参数

语音增强模型训练方法、语音增强方法及设备

语音模型训练方法生成对抗网络训练训练样本数据多任务损失函数

基于声信号的断路器机械故障诊断方法

诊断断路器信号短时傅里叶变换峭度特征编码器训练

一种SMT物料数量统计方法及装置

样本视觉特征数量统计方法语义特征预测类别

智能对话方法、装置、计算机设备、存储介质及产品

意图类别智能对话方法意图识别模型样本数据

一种大语言模型主动反馈知识蒸馏方法

站点导航

APP 下载