摘要
本申请公开了基于蒸馏学习的学生模型优化方法、设备及可读存储介质,该方法包括:根据学生模型的各第一编码模块中每一注意力层的查询向量、键向量和值向量中的至少一个确定各第一编码模块的第一向量关系值和/或任两第一编码模块之间的第二向量关系值;根据教师模型的各第二编码模块中每一注意力层的查询向量、键向量和值向量中的至少一个确定各第二编码模块的第三向量关系值和/或任两第二编码模块之间的第四向量关系值;根据第一向量关系值和第三向量关系值之间的第一关系差异和/或根据第二向量关系值和第四向量关系值之间的第二关系差异确定学生模型的目标损失值,并根据目标损失值优化学生模型。由此可以提高学生模型的性能。
技术关键词
编码模块
模型优化方法
注意力
学生
关系
图像编码
蒸馏
教师
文本
优化装置
数据
存储器
程序
处理器
可读存储介质
电子设备
指令
系统为您推荐了相关专利信息
编码器解码器
联合反演方法
遥感卫星数据
网络
卫星遥感数据
融合单目视觉
力反馈信息
关节
单目视觉相机
神经网络模型
LSTM神经网络
动态预测方法
长短期记忆网络
自动编码器
综合交通枢纽