一种基于双通道稀疏蒸馏的多模态模型轻量化方法

正文

推荐专利

申请号：CN202510366527

申请日期：2025-03-26

公开号：CN120197666A

公开日期：2025-06-24

类型：发明专利

摘要

本发明公开了一种基于双通道稀疏蒸馏的多模态模型轻量化方法，包含五个核心步骤：连接预训练视觉编码器与语言模型，构建混合专家架构；通过特征映射和跨模态注意力实现视觉‑语言特征初步对齐；设计双通道知识迁移，显式通道用自适应KL散度对齐师生模型输出分布，隐式通道通过跨模态注意力适配器迁移特征知识；通过构建正负样本对训练集推理优化训练，指导学生模型学习区分高质量和低质量输出；推理部署时动态选择Top‑k专家，通过路由权重加权聚合专家输出。本发明在保持模型表达能力的同时显著降低计算开销，参数量降低约60％，在跨模态理解任务上准确率提升5％以上，在边缘设备上推理延迟控制在300ms以内。

技术关键词

轻量化方法蒸馏交互注意力适配器 Softmax函数跨模态教师学生置信度阈值样本多层感知机训练集通道视觉矩阵语义网络基础机制

系统为您推荐了相关专利信息

一种面向低质量深度人脸图像的鲁棒性特征学习方法

鲁棒性特征图像编码器身份图像特征组合 Softmax函数

MaaS多模型发布管理方法、系统及存储介质

发布管理方法模型库发布管理系统查询字词创建全局

一种轻量化的文本生成视频方法和装置

令牌时序视频装置适配器滤波器

一种基于机器学习的外墙隔热涂料外观质量检测方法

外墙隔热涂料光照强度数据参数天气图像

水电行业科技文档评价方法及装置

科技知识蒸馏技术指标语义特征数据提取

一种基于双通道稀疏蒸馏的多模态模型轻量化方法

站点导航

APP 下载