一种基于动态图神经网络的大模型知识蒸馏架构与高效训练方法及系统

AITNT
正文
推荐专利
一种基于动态图神经网络的大模型知识蒸馏架构与高效训练方法及系统
申请号:CN202511026489
申请日期:2025-07-24
公开号:CN120874899A
公开日期:2025-10-31
类型:发明专利
摘要
本发明涉及多模态学习技术领域,具体为一种基于动态图神经网络的大模型知识蒸馏架构与高效训练方法及系统,包括以下步骤:构建动态图神经网络,提取大语言模型知识,设计知识蒸馏架构,实现高效训练技术;有益效果为:通过动态图神经网络提取语义知识,并将其融入知识蒸馏过程,学生模型能够更深入地学习教师模型的知识,从而实现高效的知识迁移;将大语言模型的知识迁移到轻量级的学生模型中,显著降低了模型的参数规模和计算复杂度,使得模型更适合在资源受限的环境中部署。
技术关键词
高效训练方法 蒸馏 学生 大语言模型 神经网络架构 训练算法 教师 注意力机制 节点 多阶段 缩放技术 内容更新 多模态 语义特征 动态更新 浮点数 梯度下降算法
系统为您推荐了相关专利信息
1
基于声音变化的LED灯带智能控制方法及系统
智能控制方法 粒子群优化算法 MFCC特征 波束成形算法 麦克风阵列
2
一种基于页面语义图的移动应用行为表征方法
语义 摘要 表征方法 大语言模型 元素
3
一种文本可视化语音编辑方法、系统、存储介质和设备
文本可视化 语音编辑系统 编辑方法 音频 语音编码器
4
一种生成CTO-PCI手术评估报告的方法和系统
冠状动脉血管造影 手术 CT扫描系统 报告 大语言模型
5
群体成员识别方法、装置、计算机设备和存储介质
兴趣 文本 主题关键词 分词 识别方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号