基于动态结构感知的跨模态知识蒸馏方法及系统

AITNT
正文
推荐专利
基于动态结构感知的跨模态知识蒸馏方法及系统
申请号:CN202511094146
申请日期:2025-08-06
公开号:CN120598016B
公开日期:2025-10-31
类型:发明专利
摘要
本申请实施例提供一种基于动态结构感知的跨模态知识蒸馏方法及系统,通过接收目标任务数据集,从目标任务数据集中划分得到训练集,将训练集输入至预设教师模型和预设学生模型得到文本特征和视觉特征;基于模型之间的参数规模差异实时确定结构差异指标,基于结构差异指标得到投影矩阵;基于实时的投影矩阵得到对应的传输矩阵,并提取预设教师模型的注意力分布信息,基于注意力分布完成预设教师模型至预设学生模型的知识蒸馏并对目标任务数据集进行语义分割,得到语义分割结果。该方法有效解决了不同深度的网络模型之间难以对齐方面的不足,显著减少用于处理目标任务的模型的体量。
技术关键词
视觉特征 矩阵 教师 知识蒸馏方法 跨模态 文本 学生 注意力 训练集 双曲正切函数 指标 参数 元素 语义 模态特征 基础 动态 数据 蒸馏系统
系统为您推荐了相关专利信息
1
一种基于功能性近红外光谱信号的情绪分类方法
功能性近红外光谱 情绪分类方法 信号 训练集数据 数据预处理方法
2
一种基于姿态识别的无接触式智能家电控制系统及方法
家电控制系统 接触式智能 多模态特征 特征提取模型 融合特征
3
一种基于三维网格计算人脸模型容积差的方法
纹理 人脸关键点检测 三维人脸模型 容积 顶点
4
基于K-means聚类和灰色关联-TCN的风电功率预测方法、装置、电子设备及存储介质
电功率预测方法 多元时间序列数据 电功率预测装置 矩阵 误差
5
一种基于语义分类的发电领域知识检索方法及系统
知识检索方法 知识检索系统 语义 大语言模型 分类阈值
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号