摘要
本申请实施例提供了一种数据蒸馏方法和装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:基于原始视觉语言数据集对原始基准模型进行训练得到目标基准模型;基于候选数据集对原始学生模型进型训练得到目标学生模型;对目标基准模型和目标学生模型进行对比学习得到模型学习差异数据;基于模型学习差异数据对候选数据集的图像样本进行像素调整得到目标图像;基于模型学习差异数据对候选数据集的文本样本进行文本表示调整得到目标文本;基于目标图像和目标文本构建目标视觉语言数据集。本申请可应用于金融科技、医疗科技等需要大量视觉语言数据的业务系统中,通过数据蒸馏技术对大量视觉语言数据进行蒸馏,能够提高数据蒸馏的准确性。
技术关键词
文本
数据
学生
样本
基准
嵌入特征
视觉
参数
蒸馏方法
模型训练模块
矩阵
电子设备
可读存储介质
人工智能技术
蒸馏装置
图像像素
业务系统
系统为您推荐了相关专利信息
权限管理
权限特征
机器学习算法
项目特征
数据访问权限
卫星遥测数据
生成对抗网络
滑动窗口
时序
归一化模块
层次结构模型
KANO模型
需求分析方法
矩阵
直流接地
人脸特征
卷积特征
训练样本图像
人脸图像数据
预测特征
智能巡检方法
电站现场
检查点
动态数据同步
对象