摘要
本发明提供了一种基于混合精度量化的多模态模型轻量化部署方法,本发明的技术方案通过混合精度量化方法得到的经训练的量化多模态大模型,将其部署在电子设备上;获取为经训练的量化多模态大模型搭建能在通用CPU上执行该模型的运行环境,其中,该运行环境是通过C标准库构建的,该C标准库中包括用C语言编写的机器学习张量库GGML;利用机器学习张量库GGML,在电子设备上利用部署的经训练的量化多模态大模型进行推理,从而解决边缘端、移动终端等电子设备上部署多模态大模型的开发成本高的问题。
技术关键词
多模态
语言模块
视觉特征
精度
电子设备
子模块
计算机程序产品
处理器
标记
序列
文本
投射器
图文
指令
可读存储介质
移动终端
存储器
参数
系统为您推荐了相关专利信息
推送告警信息
告警信息内容
历史告警数据
多模态
资源
多模态深度学习
需求预测方法
医疗耗材
文本特征向量
交叉注意力机制
高精度导航方法
系统噪声
信号
观测噪声
构建系统
动态权重分配
个性化推荐系统
跨模态
画像
多源异构数据处理