一种基于混合精度量化的多模态模型轻量化部署方法

AITNT
正文
推荐专利
一种基于混合精度量化的多模态模型轻量化部署方法
申请号:CN202510148735
申请日期:2025-02-11
公开号:CN120124676A
公开日期:2025-06-10
类型:发明专利
摘要
本发明提供了一种基于混合精度量化的多模态模型轻量化部署方法,本发明的技术方案通过混合精度量化方法得到的经训练的量化多模态大模型,将其部署在电子设备上;获取为经训练的量化多模态大模型搭建能在通用CPU上执行该模型的运行环境,其中,该运行环境是通过C标准库构建的,该C标准库中包括用C语言编写的机器学习张量库GGML;利用机器学习张量库GGML,在电子设备上利用部署的经训练的量化多模态大模型进行推理,从而解决边缘端、移动终端等电子设备上部署多模态大模型的开发成本高的问题。
技术关键词
多模态 语言模块 视觉特征 精度 电子设备 子模块 计算机程序产品 处理器 标记 序列 文本 投射器 图文 指令 可读存储介质 移动终端 存储器 参数
系统为您推荐了相关专利信息
1
掩膜制造方法、装置、存储介质及电子设备
蚀刻偏差 测量点 版图 LLE算法 图案
2
一种用于监控告警信息的方法及相关设备
推送告警信息 告警信息内容 历史告警数据 多模态 资源
3
基于多模态深度学习的医疗耗材需求预测方法
多模态深度学习 需求预测方法 医疗耗材 文本特征向量 交叉注意力机制
4
基于LEO星座卫星多源机会信号融合的高精度导航方法
高精度导航方法 系统噪声 信号 观测噪声 构建系统
5
基于用户画像的教学资源个性化推荐系统
动态权重分配 个性化推荐系统 跨模态 画像 多源异构数据处理
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号