摘要
本发明提供了一种基于自进化条件表征的组合泛化图像多标签分类方法,利用预测出的其他概念元文本提示特征矩阵与输入图像原始特征矩阵的交叉融合特征矩阵作为条件,与要进行表征自进化的概念元语义和视觉表征进行特征融合,实现了各概念元语义和视觉表征针对不同输入图像的即时性自进化,不仅使学习出的语义和视觉表征更加适应不同的输入图像,而且能够解决以往方法缺乏对概念元之间的相互关系进行建模的问题。在多个数据集上的分类精确度均获得了突出进步。能够根据输入图像所属的其他种类概念元表征与输入图像视觉表征对某种概念元的视觉与语义表征进行即时性自进化,使学习到的表征更加灵活,对新组合的泛化性能更强。
技术关键词
概念
多标签分类方法
矩阵
视觉特征
编码器
通道
多层感知器
注意力
语义特征
反向传播方法
文本
线性
元素
可读存储介质
图像缩放
模板
单层
系统为您推荐了相关专利信息
三维场景数据
大语言模型
图像嵌入
模板
文本编码器
动态情感识别方法
无监督
预训练模型
时序特征
电信号
参数优化模型
性能优化方法
语义特征
工艺参数动态
设备状态数据