摘要
本发明公开了基于文本提示的图像分类模型知识蒸馏方法,获取图片分类数据集,构建知识蒸馏模型框架,将蒸馏模型中的文本编码器以及教师模型的参数进行冻结,将训练集中的文本信息token化后向量化得到可学习的提示向量,再对可学习的提示向量进行对比学习预训练;将可学习向量冻结,同时文本编码器以及教师模型保持冻结状态不变,进行学生模型知识蒸馏训练;本发明通过预训练可优化的提示向量将提示学习引入蒸馏训练的方法,文本提示很大程度需要依赖提示词的优劣,为了更好地适应不同的蒸馏任务,通过引入可优化的提示向量,在蒸馏训练前进行提示词微调,使得当前提示词更契合教师模型,帮助学生模型更快地收敛到有用的关键信息点上。
技术关键词
知识蒸馏方法
图像分类模型
文本编码器
教师
学生
多模态机器学习
投影器
图片
标签
前馈神经网络
瓶颈结构
训练集数据
残差网络
视觉特征
阶段
系统为您推荐了相关专利信息
调制特征
语义特征
变化检测模型
多层感知机
聚类
个性化学习路径
知识点
推荐方法
长短期记忆网络
加权有向图
医学超声图像
图像分类模型
标签
分类方法
分类器
大语言模型
知识图谱构建方法
机电设备
实体
三元组