摘要
本发明公开了一种轻量级视觉Transformer的训练优化方法、装置及介质,其中方法包括:使用未训练的Transformer模型在GPU上,针对不同的注意力头数量进行推理速度测试,以获得合适推理速度的第一数量;将Transformer模型的注意力头数量设置为第一数量,使用MAE以及蒸馏方法对Transformer模型进行自监督预训练;将自监督训练后的Transformer模型,应用于不同的下游任务,以及进行微调训练;将微调后的模型进行推理速度测试以及精确度测试,以评估模型的性能。本发明能够根据GPU的自身计算特性,针对不同的场景,对模型选择合适的参数,同时利用蒸馏技术和自监督预训练,得到一个轻量级的视觉预训练模型,可广泛应用于图像处理和计算机视觉领域。
技术关键词
训练优化方法
蒸馏方法
速度
教师
学生
优化装置
线性变换矩阵
处理器
预训练模型
计算机视觉
注意力机制
测试模块
程序
图像处理
参数
可读存储介质
样本
系统为您推荐了相关专利信息
变速抽蓄机组
复合控制方法
复合控制器
前馈控制器
功率
采煤机
有效值
故障诊断方法
故障诊断模型
噪音传感器
三相母线
平衡度
三相不平衡电流
参数
三相不平衡监测