面向文图跨模态行人检索模型的知识蒸馏方法

AITNT
正文
推荐专利
面向文图跨模态行人检索模型的知识蒸馏方法
申请号:CN202510963970
申请日期:2025-07-14
公开号:CN120930720A
公开日期:2025-11-11
类型:发明专利
摘要
本申请公开了一种面向文图跨模态行人检索模型的知识蒸馏方法,包括:构建教师模型和学生模型,对学生模型进行初始化,其中教师模型与学生模型均具有文本编码器和图像编码器;对学生模型进行三阶段的知识蒸馏,其中,在第一阶段通过教师模型对学生模型的图像编码器进行知识蒸馏,在第二阶段通过教师模型对学生模型的文本编码器进行知识蒸馏,在第三阶段通过教师模型对学生模型的文本编码器以及图像编码器同时进行知识蒸馏;根据各个阶段的任务损失以及蒸馏损失,对学生模型进行训练直至收敛,得到轻量化学生模型。本申请能够强化学生模型与教师模型在跨模态任务学习上的关联,提升学生模型获得文本图像多模态特征高度对齐的能力。
技术关键词
知识蒸馏方法 文本编码器 图像编码器 学生 教师 计算机程序产品 图像多模态 数据载体 阶段 标签 参数
系统为您推荐了相关专利信息
1
一种基于5G大数据的智能管理系统
智能管理系统 教师 数据处理模块 数据分析模块 教务信息
2
一种基于多模态融合的生猪健康监测方法及系统
健康监测方法 视频数据特征 生猪疾病 多模态数据采集 健康监测模块
3
基于图像指示的语音生成方法、装置、设备及介质
语音生成模型 语音生成方法 嵌入特征 图像编码器 分类器
4
教师AI素养多模态诊断与培养路径生成系统
路径生成系统 知识点 教师 多模态数据采集 知识图谱构建
5
一种实验室教学管控系统
管控系统 身份识别模块 学生成长档案系统 数据分析模块 管理终端
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号