轻量级视觉Transformer的训练优化方法、装置及介质

AITNT
正文
推荐专利
轻量级视觉Transformer的训练优化方法、装置及介质
申请号:CN202410783754
申请日期:2024-06-18
公开号:CN118690812A
公开日期:2024-09-24
类型:发明专利
摘要
本发明公开了一种轻量级视觉Transformer的训练优化方法、装置及介质,其中方法包括:使用未训练的Transformer模型在GPU上,针对不同的注意力头数量进行推理速度测试,以获得合适推理速度的第一数量;将Transformer模型的注意力头数量设置为第一数量,使用MAE以及蒸馏方法对Transformer模型进行自监督预训练;将自监督训练后的Transformer模型,应用于不同的下游任务,以及进行微调训练;将微调后的模型进行推理速度测试以及精确度测试,以评估模型的性能。本发明能够根据GPU的自身计算特性,针对不同的场景,对模型选择合适的参数,同时利用蒸馏技术和自监督预训练,得到一个轻量级的视觉预训练模型,可广泛应用于图像处理和计算机视觉领域。
技术关键词
训练优化方法 蒸馏方法 速度 教师 学生 优化装置 线性变换矩阵 处理器 预训练模型 计算机视觉 注意力机制 测试模块 程序 图像处理 参数 可读存储介质 样本
系统为您推荐了相关专利信息
1
DPU芯片及电子设备
芯片 数据 封装外壳 节点 存储单元
2
一种变速抽蓄机组功率主控模式下转速调节复合控制方法及系统
变速抽蓄机组 复合控制方法 复合控制器 前馈控制器 功率
3
一种采煤机故障诊断方法及系统
采煤机 有效值 故障诊断方法 故障诊断模型 噪音传感器
4
一种使用国产深度学习加速卡的振动光谱模拟系统
加速卡 电子结构 演化算法 模拟系统 受力
5
电机三相不平衡的检测方法及系统
三相母线 平衡度 三相不平衡电流 参数 三相不平衡监测
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号