一种大语言模型主动反馈知识蒸馏方法

AITNT
正文
推荐专利
一种大语言模型主动反馈知识蒸馏方法
申请号:CN202510179132
申请日期:2025-02-18
公开号:CN120124671A
公开日期:2025-06-10
类型:发明专利
摘要
本发明公开了一种大语言模型主动反馈知识蒸馏方法,属于人工智能技术领域,包括模块一与模块二,模块一由教师大语言模型库、轻量级学生模型、输入样本组成,模块二由输出样本、微调教师模型组成;知识蒸馏方法包括以下步骤:S1、轻量级学生模型通过输入样本进行监督学习;S2、教师大语言模型库对轻量级学生模型进行知识蒸馏;S3、轻量级学生模型经过知识蒸馏输出知识形成输出样本,筛选采样其中m%的输出样本作为反馈样本;S4、将反馈样本输入到教师大语言模型库中进行微调并形成微调教师模型,通过微调教师模型对轻量级学生模型再次进行知识蒸馏;本发明可以增强模型的泛化能力并提高知识传递的效率与效果。
技术关键词
知识蒸馏方法 样本 教师 模型库 学生 大语言模型 梯度下降算法 文本 句式结构 模块 预训练模型 人工智能技术 矩阵 策略 编码器 数据 分区 参数 标签
系统为您推荐了相关专利信息
1
一种多源感知下基于沙普利值的权重分配方法和系统
权重分配方法 网络 分配系统 确定性策略梯度 参数
2
语音增强模型训练方法、语音增强方法及设备
语音 模型训练方法 生成对抗网络训练 训练样本数据 多任务损失函数
3
基于声信号的断路器机械故障诊断方法
诊断断路器 信号 短时傅里叶变换 峭度特征 编码器训练
4
一种SMT物料数量统计方法及装置
样本 视觉特征 数量统计方法 语义特征 预测类别
5
智能对话方法、装置、计算机设备、存储介质及产品
意图类别 智能对话方法 意图识别模型 样本 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号