基于蒸馏学习的学生模型优化方法、设备及可读存储介质

AITNT
正文
推荐专利
基于蒸馏学习的学生模型优化方法、设备及可读存储介质
申请号:CN202510132774
申请日期:2025-02-06
公开号:CN119558353B
公开日期:2025-05-30
类型:发明专利
摘要
本申请公开了基于蒸馏学习的学生模型优化方法、设备及可读存储介质,该方法包括:根据学生模型的各第一编码模块中每一注意力层的查询向量、键向量和值向量中的至少一个确定各第一编码模块的第一向量关系值和/或任两第一编码模块之间的第二向量关系值;根据教师模型的各第二编码模块中每一注意力层的查询向量、键向量和值向量中的至少一个确定各第二编码模块的第三向量关系值和/或任两第二编码模块之间的第四向量关系值;根据第一向量关系值和第三向量关系值之间的第一关系差异和/或根据第二向量关系值和第四向量关系值之间的第二关系差异确定学生模型的目标损失值,并根据目标损失值优化学生模型。由此可以提高学生模型的性能。
技术关键词
编码模块 模型优化方法 注意力 学生 关系 图像编码 蒸馏 教师 文本 优化装置 数据 存储器 程序 处理器 可读存储介质 电子设备 指令
系统为您推荐了相关专利信息
1
一种稀疏遥感卫星数据下的大气与海色参数联合反演方法
编码器解码器 联合反演方法 遥感卫星数据 网络 卫星遥感数据
2
融合单目视觉与力反馈信息的机械臂遥操方法及相关装置
融合单目视觉 力反馈信息 关节 单目视觉相机 神经网络模型
3
一种基于扩散模型的零样本快速物体迁移方法
迁移方法 物体 注意力 文本编码器 图像编码器
4
一种基于线性注意力机制的知识图谱推理方法
知识图谱推理方法 注意力机制 三元组 邻居 关系
5
一种基于长短期记忆网络的多模式交通客流动态预测方法
LSTM神经网络 动态预测方法 长短期记忆网络 自动编码器 综合交通枢纽
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号