针对视觉大模型的蒸馏和图像识别方法、设备、装置及程序

正文

推荐专利

申请号：CN202411684539

申请日期：2024-11-22

公开号：CN119600411B

公开日期：2025-12-09

类型：发明专利

摘要

本发明提供了一种针对视觉大模型的蒸馏方法，包括：获取教师模型，所述教师模型是具有Transformer结构的视觉大模型；对所述教师模型进行结构剪枝，生成多个辅助模型；利用优化损失函Loss数通过参数共享方式优化训练所述教师模型和多个所述辅助模型；在优化后的多个所述辅助模型中选取综合得分最高的为选定辅助模型；利用优化损失函数训练所述选定辅助模型和学生模型，得到最终的学生模型。利用本发明的技术方案，可将模型知识从全尺度的教师模型尽可能传递到学生模型，使得学生模型在规模和性能上达到最佳，该学生模型的规模足够小，能方便地嵌入到实际的应用设备中。

技术关键词

蒸馏方法教师学生图像识别单元图像识别方法生成超声图像视觉图像生成单元图像识别装置图像识别模块图像获取模块蒸馏装置注意力规模处理器参数标签

系统为您推荐了相关专利信息

一种智能互动玩具的语音交互识别方法

语音交互识别方法智能互动玩具滤波器教师学生

一种用于肝癌诊断的多模态成像数据处理方法

成像数据处理方法肝脏融合网络架构三维可视化模型患者

一种网络教学用摄像头及报警系统

学生级联分类器面部特征指数识别模块

一种提高中小学学生单词学习效率的方法及装置

词典单词学习效率听力学生语音识别技术

基于深度集成的内容管控方法、装置及设备

深度集成学习内容管控方法数据基础文本

针对视觉大模型的蒸馏和图像识别方法、设备、装置及程序

站点导航

APP 下载