多标签图像识别方法、装置、电子设备和存储介质

正文

推荐专利

申请号：CN202510384883

申请日期：2025-03-28

公开号：CN120526189A

公开日期：2025-08-22

类型：发明专利

摘要

本发明涉及计算机视觉技术领域，提供一种多标签图像识别方法、装置、电子设备和存储介质，其中方法包括：对待识别图像和各候选文本标签进行特征提取，得到待识别图像的图像特征以及各候选文本标签的文本特征；利用大语言模型组件对图像特征进行特征迁移，并对迁移后的图像特征进行适配；根据适配后的图像特征和各候选文本标签的文本特征，确定待识别图像对应的多个目标文本标签。本发明通过引入大语言模型组件、构建特征增强和适配模块，实现了跨模态的知识迁移与增强，显著提升了多标签图像识别的准确性和鲁棒性。

技术关键词

图像识别模型多标签图像识别方法图像全局特征图像局部特征编码模块图像块图像嵌入非暂态计算机可读存储介质大语言模型图像识别装置计算机视觉技术文本编码器图像编码器电子设备

系统为您推荐了相关专利信息

模型训练系统、图像识别设备、模型训练方法及识别方法

模型训练系统二值化图像图像识别设备样本模型训练模块

基于SNN信息补充的图像识别方法、装置、设备及介质

图像识别模型脉冲图像识别方法阶段样本

一种无人机起降停机坪

停机坪定位标记轮廓识别训练图像识别模型图像采集单元

面部图像识别方法、装置、计算机设备及存储介质

面部图像识别方法面部特征面部识别模型真实面部计算机可读指令

基于上下文感知与模仿学习的目标驱动导航方法及装置

物体导航方法多头注意力机制关系残差神经网络

多标签图像识别方法、装置、电子设备和存储介质

站点导航

APP 下载