摘要
本申请实施例提供一种基于动态结构感知的跨模态知识蒸馏方法及系统,通过接收目标任务数据集,从目标任务数据集中划分得到训练集,将训练集输入至预设教师模型和预设学生模型得到文本特征和视觉特征;基于模型之间的参数规模差异实时确定结构差异指标,基于结构差异指标得到投影矩阵;基于实时的投影矩阵得到对应的传输矩阵,并提取预设教师模型的注意力分布信息,基于注意力分布完成预设教师模型至预设学生模型的知识蒸馏并对目标任务数据集进行语义分割,得到语义分割结果。该方法有效解决了不同深度的网络模型之间难以对齐方面的不足,显著减少用于处理目标任务的模型的体量。
技术关键词
视觉特征
矩阵
教师
知识蒸馏方法
跨模态
文本
学生
注意力
训练集
双曲正切函数
指标
参数
元素
语义
模态特征
基础
动态
数据
蒸馏系统
系统为您推荐了相关专利信息
功能性近红外光谱
情绪分类方法
信号
训练集数据
数据预处理方法
家电控制系统
接触式智能
多模态特征
特征提取模型
融合特征
电功率预测方法
多元时间序列数据
电功率预测装置
矩阵
误差
知识检索方法
知识检索系统
语义
大语言模型
分类阈值