一种基于多模态大模型压缩的移动端AI高效部署方法及系统

正文

推荐专利

申请号：CN202511009902

申请日期：2025-07-22

公开号：CN120911546A

公开日期：2025-11-07

类型：发明专利

摘要

本发明涉及一种基于多模态大模型压缩的移动端AI高效部署方法及系统，包括获取原始多模态大模型，该模型能够处理多种类型的数据，包括但不限于文本、图像、音频；对所述原始多模态大模型进行模型剪枝，通过分析模型中各参数的重要性，采用基于敏感度分析的剪枝算法，计算每个参数对模型输出的影响程度。本发明降低了计算资源需求，通过模型剪枝、量化和知识蒸馏等压缩技术，有效减少了多模态大模型的参数数量和计算量，使模型能够在移动端设备有限的计算资源下高效运行，提高了模型的推理速度，减少了存储容量占用，量化技术将模型参数转换为低精度表示，大幅降低了模型的存储需求，知识蒸馏得到的小型化模型进一步减少了存储空间占用。

技术关键词

模型压缩多模态移动端模型剪枝高效部署系统参数模块增量更新文本情感分析知识蒸馏方法教师学生浮点数资源图像规模保障系统计划

系统为您推荐了相关专利信息

基于多传感器融合的健康监测系统及方法

健康监测系统多传感器融合多模态数据分析指标报告系统

基于注意力和图增强文本的多模态情感分析方法及系统

文本情感分析方法矩阵跨模态索引

基于隐含特征的无监督跨模态哈希检索方法、系统及设备

矩阵交替迭代优化样本多模态特征标签

一种对话式记账方法及电子设备

记账方法文本远程服务器输入区记账电子

一种无纺过滤制品压纹设备的智能控制方法及系统

滤布压纹设备智能控制方法褶皱多模态

一种基于多模态大模型压缩的移动端AI高效部署方法及系统

站点导航

APP 下载