一种基于多模态预训练模型的类增量图像分类方法及系统

AITNT
正文
推荐专利
一种基于多模态预训练模型的类增量图像分类方法及系统
申请号:CN202510760095
申请日期:2025-06-09
公开号:CN120673143A
公开日期:2025-09-19
类型:发明专利
摘要
本发明公开了一种基于多模态预训练模型的类增量图像分类方法及系统,方法包括:获取类增量学习数据集,对于每个任务,模型训练包含两个阶段,分别是任务内训练阶段和跨任务微调阶段;任务内训练阶段:对于当前任务的数据,采用任务特定的适配器对预训练视觉语言模型进行微调,实现任务内类别之间可分;跨任务微调阶段:引入一个图像特征表达的映射模块,实现将任务特定特征空间的特征映射到任务共享的特征空间,实现跨任务类别可分;推理时,采用一种基于预测不确定性的推理策略进行图像分类。本发明能够解决跨任务间存在类别混淆问题,提高选择输出特征的精准度。
技术关键词
图像分类方法 预训练模型 文本编码器 图像编码器 多模态 适配器 模块 阶段 数值 图像分类系统 特征选择 视觉 图像特征向量 策略 图像校准 网络分配 感应机
系统为您推荐了相关专利信息
1
面向低空典型场景的飞行器驾驶舱模拟方法及设备
飞行器驾驶舱 飞行器动力学 仿真模型 模拟器 人机交互数据
2
基于多示例学习的图像分类方法
图像分类方法 图像分类网络 特征提取网络 图像分类模型 注意力
3
一种基于改进YOLOX的变电站金具磨损检测方法和相关装置
磨损检测方法 多尺度注意力机制 变电站 金具 多模态
4
一种用于社交媒体评论的多模态情感分析与理解方法
情感特征 社交 媒体 BERT模型 多模态
5
面向开放世界的遥感影像因果表征方法
独立语义 表征方法 预训练模型 遥感图像数据 分区
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号