基于持续学习的开放词汇多任务图像分类方法

正文

推荐专利

申请号：CN202511096243

申请日期：2025-08-06

公开号：CN120599385A

公开日期：2025-09-05

类型：发明专利

摘要

本发明涉及图像处理技术领域，公开基于持续学习的开放词汇多任务图像分类方法，包括步骤：对原始图像数据进行预处理得到对应的文本信息，将文本信息输入文本编码器，得到文本特征；将原始图像数据输入图像编码器，得到图像特征；将文本特征和图像特征共同输入引导注意力模块，对图像特征进行加权整合，得到多模态特征；将多模态特征输入随机投影模块进行随机投影，通过非线性激活函数得到激活特征；通过预测模块对每个类别的激活特征取均值生成类原型向量，将非线性激活函数输入到Gram矩阵，得到图像类别。本发明对图像编码器的微调增分类强模型的特征提取能力，引入引导注意力模块实现图文特征的深度融合，提升了对关键语义特征的识别能力。

技术关键词

原始图像数据图像编码器图像分类方法文本编码器多任务图像块注意力非线性编码块投影模块原型矩阵序列特征提取能力多模态特征

系统为您推荐了相关专利信息

一种基于自适应频域分离增强网络的红外小物体目标检测方法

频域特征物体编码特征原始图像数据残差网络

一种基于图像识别的抗体药物残留检测方法及系统

药物残留检测方法递归神经网络卷积特征抗体预处理图像数据

基于SAM模型的语义分割方法、装置、设备及存储介质

语义标签语义分割方法语义分割模型语义特征图像分割模型

一种导航系统陀螺仪故障诊断方法及装置

导航系统数据特征提取电磁干扰数据时序高维特征向量

一种工业操作合规性的监测方法及系统

多模态传感器数字孪生模型合规性监测方法推理网络

基于持续学习的开放词汇多任务图像分类方法

站点导航

APP 下载