摘要
本发明公开了一种基于内存高效注意力机制的分割一切模型优化方法及装置,通过对分割一切模型进行分析,本发明实现了更加可控的内存高效注意力机制,并利用其重新替换了分割一切模型中传统的注意力计算方式,显著降低了模型的推理及测试峰值显存。本发明同时具有高适用性,对于相关衍生的高效分割一切模型,只要其拥有类似传统注意力计算的结构,本发明则同样有效。此外,本发明还解决了分割一切模型中传统的显存优化方式会降低精度这一难题,在无需任何重新训练微调的情况下,本发明可以显著降低模型的推理及测试峰值的显存占用,同时不会带来任何精度效果上的损失。
技术关键词
模型优化方法
优化装置
双向注意力机制
内存
图像
信息显示设备
编码器
多层感知机
解码器
分块
人工智能模型
矩阵
模块
上采样
存储器
语义
显卡
系统为您推荐了相关专利信息
环保塑料袋
红外计数器
喷淋器
图像处理模块
供水部件
智能巡检机器人
图像分析算法
自动化养鸡设备
移动摄像头
健康状态评估系统
DDR3存储器
图像传输方法
图像传输系统
图像处理模块
图像格式转换
最佳拍摄位置
服务端
佩戴安全帽
对象
违章识别方法
现场数据采集
Ku波段卫星通信
L波段卫星通信
广播系统
数据采集回传系统