大语言模型知识蒸馏的自然语言处理方法、装置及设备

AITNT
正文
推荐专利
大语言模型知识蒸馏的自然语言处理方法、装置及设备
申请号:CN202510865556
申请日期:2025-06-26
公开号:CN120781049A
公开日期:2025-10-14
类型:发明专利
摘要
本发明提供大语言模型知识蒸馏的自然语言处理方法、装置及设备,涉及知识蒸馏技术领域。本发明能够通过在监督微调阶段,对教师模型的各中间层特征进行聚合和降维,与学生模型中间层特征对齐,将教师模型的各中间层特征动态映射到学生模型的各中间层。各中间层特征对齐后,基于教师模型与学生模型的中间层特征差异,构建损失函数,以此训练学生模型。由此,训练得到的学生模型不仅能够模仿教师模型的输出结果,还能够学习到教师模型的推理逻辑与决策路径等深层特征。学生模型能够学习到教师模型不同层次的特征信息,从而更好地理解和模仿教师模型的推理过程,提升了学生模型自然语言处理的准确率。
技术关键词
中间层 学生 教师 大语言模型 分析自然语言 知识蒸馏技术 注意力 适配器 对齐模块 滑动窗口 文本 存储器 策略 处理器 电子设备 决策 逻辑
系统为您推荐了相关专利信息
1
一种补考重修自动排考算法
试卷 时间段 列表 组合表 学生
2
一种用于英语教学的智能型英语教学系统
数据储存服务器 学生 视频传输设备 视频显示设备 模块
3
基于人工智能的学生学习状态监督方法、装置、终端设备以及存储介质
文本生成模型 关键词 学生学习状态 三元组 关节
4
基于物联网的档案信息安全追踪与实时监控系统及方法
关键词 分类档案 实时监控系统 神经网络模型 检测设备
5
基于多模态大模型的文本到图像生成模型评估方法及系统
图像生成模型 多模态 文本 生成图像集合 大语言模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号