摘要
本申请提供一种开集细粒度的识别方法和装置,涉及图像识别技术领域。方法包括:基于细粒度识别数据集训练得到多模态特征提取模型,在训练过程中,视觉特征样本和文本特征样本对齐后进行对比学习;将待识别图像数据输入至预设视觉特征提取网络,得到待识别图像特征;将待识别图像特征和预设细粒度视觉特征查询条件输入至预设Transformer模型,得到待识别细粒度视觉特征;将类别文本描述输入至预设自然语言特征提取模型,得到待识别文本特征;将待识别细粒度视觉特征和待识别文本特征输入至多模态特征提取模型,进行特征对齐得到融合特征;将融合特征输入至开集细粒度分类模型,得到目标细粒度类别,从而实现开集识别且准确率高。
技术关键词
特征提取模型
自然语言特征提取
细粒度分类
融合特征
视觉特征提取
文本
多模态
样本
多组图像数据
识别方法
图像识别技术
模型训练模块
神经网络模型
标签
处理器
识别装置
系统为您推荐了相关专利信息
数据交互模块
传感
标记
融合特征
激光雷达点云数据
融合视觉特征
融合策略
局部视觉特征
全局视觉特征
特征选择
稳定评估方法
计算机可执行指令
模式检测
特征提取模型
高风险
特征提取模型
特征提取方法
水工建筑物
地形特征
全卷积神经网络