针对视觉大模型的蒸馏和图像识别方法、设备、装置及程序

AITNT
正文
推荐专利
针对视觉大模型的蒸馏和图像识别方法、设备、装置及程序
申请号:CN202411684539
申请日期:2024-11-22
公开号:CN119600411B
公开日期:2025-12-09
类型:发明专利
摘要
本发明提供了一种针对视觉大模型的蒸馏方法,包括:获取教师模型,所述教师模型是具有Transformer结构的视觉大模型;对所述教师模型进行结构剪枝,生成多个辅助模型;利用优化损失函Loss数通过参数共享方式优化训练所述教师模型和多个所述辅助模型;在优化后的多个所述辅助模型中选取综合得分最高的为选定辅助模型;利用优化损失函数训练所述选定辅助模型和学生模型,得到最终的学生模型。利用本发明的技术方案,可将模型知识从全尺度的教师模型尽可能传递到学生模型,使得学生模型在规模和性能上达到最佳,该学生模型的规模足够小,能方便地嵌入到实际的应用设备中。
技术关键词
蒸馏方法 教师 学生 图像识别单元 图像识别方法 生成超声图像 视觉 图像生成单元 图像识别装置 图像识别模块 图像获取模块 蒸馏装置 注意力 规模 处理器 参数 标签
系统为您推荐了相关专利信息
1
一种智能互动玩具的语音交互识别方法
语音交互识别方法 智能互动玩具 滤波器 教师 学生
2
一种用于肝癌诊断的多模态成像数据处理方法
成像数据处理方法 肝脏 融合网络架构 三维可视化模型 患者
3
一种网络教学用摄像头及报警系统
学生 级联分类器 面部特征 指数 识别模块
4
一种提高中小学学生单词学习效率的方法及装置
词典 单词学习效率 听力 学生 语音识别技术
5
基于深度集成的内容管控方法、装置及设备
深度集成学习 内容管控方法 数据 基础 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号