摘要
本发明公开了一种针对多模态目标检测大模型的推理加速方法,其包括以下步骤:S1、提取待部署模型的目标文本标签的文本语义向量;S2、依据文本语义向量构建文本语义线性层;S3、将待部署模型中的文本编码器部分替换为文本语义线性层,再将模型保存为一个完整的模型权重结构;S4、以新的多模态目标检测大模型进行推理。本方案可使多模态目标检测大模型在部署推理时显著提升推理效率并减少部署模型的显存资源消耗,且对模型推理时的精度不会造成影响。
技术关键词
语义向量
文本编码器
多模态
初始化方法
线性
文本特征向量
标签
优化器
矩阵
算法
误差
资源
图像
精度
系统为您推荐了相关专利信息
信道估计
重构方法
压缩感知理论
特征提取算法
融合算法
自动化进料出料
指标
机器学习算法
线性回归方法
窑炉
视频编码参数
视频特征数据
计算机视觉
模块通信
优化视频编码
组装机构
运动平台
光纤阵列
自动装配装置
点胶机构