一种针对多模态目标检测大模型的推理加速方法

AITNT
正文
推荐专利
一种针对多模态目标检测大模型的推理加速方法
申请号:CN202410842938
申请日期:2024-06-27
公开号:CN118863056A
公开日期:2024-10-29
类型:发明专利
摘要
本发明公开了一种针对多模态目标检测大模型的推理加速方法,其包括以下步骤:S1、提取待部署模型的目标文本标签的文本语义向量;S2、依据文本语义向量构建文本语义线性层;S3、将待部署模型中的文本编码器部分替换为文本语义线性层,再将模型保存为一个完整的模型权重结构;S4、以新的多模态目标检测大模型进行推理。本方案可使多模态目标检测大模型在部署推理时显著提升推理效率并减少部署模型的显存资源消耗,且对模型推理时的精度不会造成影响。
技术关键词
语义向量 文本编码器 多模态 初始化方法 线性 文本特征向量 标签 优化器 矩阵 算法 误差 资源 图像 精度
系统为您推荐了相关专利信息
1
基于压缩感知的通信感知一体化信道估计重构方法
信道估计 重构方法 压缩感知理论 特征提取算法 融合算法
2
基于钠离子电池硬碳制备窑炉的自动化进料出料方法及系统
自动化进料出料 指标 机器学习算法 线性回归方法 窑炉
3
基于深度学习的煤矿井下人员检测方法及装置
煤矿井下 融合特征 可见光 智能传感器 邻域
4
基于计算机视觉的智能视频编码优化系统及其方法
视频编码参数 视频特征数据 计算机视觉 模块通信 优化视频编码
5
一种光纤阵列自动装配装置及装配方法
组装机构 运动平台 光纤阵列 自动装配装置 点胶机构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号