一种基于多模态预训练模型的类增量图像分类方法及系统

正文

推荐专利

申请号：CN202510760095

申请日期：2025-06-09

公开号：CN120673143A

公开日期：2025-09-19

类型：发明专利

摘要

本发明公开了一种基于多模态预训练模型的类增量图像分类方法及系统，方法包括：获取类增量学习数据集，对于每个任务，模型训练包含两个阶段，分别是任务内训练阶段和跨任务微调阶段；任务内训练阶段：对于当前任务的数据，采用任务特定的适配器对预训练视觉语言模型进行微调，实现任务内类别之间可分；跨任务微调阶段：引入一个图像特征表达的映射模块，实现将任务特定特征空间的特征映射到任务共享的特征空间，实现跨任务类别可分；推理时，采用一种基于预测不确定性的推理策略进行图像分类。本发明能够解决跨任务间存在类别混淆问题，提高选择输出特征的精准度。

技术关键词

图像分类方法预训练模型文本编码器图像编码器多模态适配器模块阶段数值图像分类系统特征选择视觉图像特征向量策略图像校准网络分配感应机

系统为您推荐了相关专利信息

面向低空典型场景的飞行器驾驶舱模拟方法及设备

飞行器驾驶舱飞行器动力学仿真模型模拟器人机交互数据

基于多示例学习的图像分类方法

图像分类方法图像分类网络特征提取网络图像分类模型注意力

一种基于改进YOLOX的变电站金具磨损检测方法和相关装置

磨损检测方法多尺度注意力机制变电站金具多模态

一种用于社交媒体评论的多模态情感分析与理解方法

情感特征社交媒体 BERT模型多模态

面向开放世界的遥感影像因果表征方法

独立语义表征方法预训练模型遥感图像数据分区

一种基于多模态预训练模型的类增量图像分类方法及系统

站点导航

APP 下载