一种基于属性驱动融合的文本引导知识蒸馏方法

正文

推荐专利

申请号：CN202510977213

申请日期：2025-07-16

公开号：CN120494040B

公开日期：2025-09-30

类型：发明专利

摘要

本发明公开了一种基于属性驱动融合的文本引导知识蒸馏方法，该方法首先构建多模态数据集以及各模态的硬属性字符串，将多模态数据集和硬属性字符串输入到属性驱动的跨模态动态融合模块中，实现多模态图像自适应融合。然后基于硬属性字符串组合生成可学习交替提示文本序列，经由多模态大模型文本编码器及多层感知机，对融合后的图像特征进行特征调制。最后基于以上融合及调制特征训练教师模型，并指导学生模型完成知识蒸馏。本发明有效提升教师模型构建特征的鲁棒性及其所传递知识的全面性，显著增强学生模型的学习效率、泛化能力及其在多噪声干扰复杂实际环境下的表现。

技术关键词

知识蒸馏方法多模态图像数据融合特征浅层特征提取文本编码器对象主体学生多层感知机预测类别教师显著性检测算法特征加权融合通道个性化特征边缘检测算法调制特征

系统为您推荐了相关专利信息

一种融合特征增强和骨结构约束的三维CBCT合成CT图像模型及方法

融合特征图像生成器图像结构对抗性医疗信息技术

一种目标行为的识别方法、系统及设备

叠加特征关键点热力图视频流对象

一种基于ViT架构和视觉状态空间模型的舰船检测方法

舰船检测方法状态空间模型视觉令牌混合器

文本实体联合关系抽取模型的训练方法、装置及计算机可读存储介质

实体关系抽取模型融合特征文本上下文特征

焊接射线照片缺陷检测方法、装置、计算机设备及介质

焊接视觉焊接缺陷检测掩模文本编码器图像编码器

一种基于属性驱动融合的文本引导知识蒸馏方法

站点导航

APP 下载