一种基于对比学习的数据集蒸馏方法、装置、设备及介质

AITNT
正文
推荐专利
一种基于对比学习的数据集蒸馏方法、装置、设备及介质
申请号:CN202510844793
申请日期:2025-06-23
公开号:CN120744492A
公开日期:2025-10-03
类型:发明专利
摘要
本发明涉及人工智能技术,可应用于医疗健康、金融科技等业务系统平台中,公开了一种基于对比学习的数据集蒸馏方法、装置、设备及介质,包括:基于原始图文数据集对初始教师模型进行训练,生成教师模型,并记录教师模型参数;构建初始合成数据集,基于初始合成数据集对初始学生模型进行训练,生成学生模型,并记录学生模型参数;计算学生模型参数与教师模型参数的参数偏离度,根据参数偏离度对初始合成数据集进行修改,得到修改后的学生模型参数,当检测到学生模型参数对应的参数偏离度满足预设条件时,将修改后的合成数据集记为目标合成数据集。本发明通过联合优化图文合成数据,实现极高数据压缩率的同时保留关键的跨模态信息。
技术关键词
学生 教师 蒸馏方法 参数 数据 图文 网络结构 文本 计算机可执行指令 样本 深度学习神经网络 图像像素 处理器 偏差 计算机设备 编辑 可读存储介质 人工智能技术 医疗健康
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号