多标签图像识别方法、装置、电子设备和存储介质

AITNT
正文
推荐专利
多标签图像识别方法、装置、电子设备和存储介质
申请号:CN202510384883
申请日期:2025-03-28
公开号:CN120526189A
公开日期:2025-08-22
类型:发明专利
摘要
本发明涉及计算机视觉技术领域,提供一种多标签图像识别方法、装置、电子设备和存储介质,其中方法包括:对待识别图像和各候选文本标签进行特征提取,得到待识别图像的图像特征以及各候选文本标签的文本特征;利用大语言模型组件对图像特征进行特征迁移,并对迁移后的图像特征进行适配;根据适配后的图像特征和各候选文本标签的文本特征,确定待识别图像对应的多个目标文本标签。本发明通过引入大语言模型组件、构建特征增强和适配模块,实现了跨模态的知识迁移与增强,显著提升了多标签图像识别的准确性和鲁棒性。
技术关键词
图像识别模型 多标签 图像识别方法 图像全局特征 图像局部特征 编码模块 图像块 图像嵌入 非暂态计算机可读存储介质 大语言模型 图像识别装置 计算机视觉技术 文本编码器 图像编码器 电子设备
系统为您推荐了相关专利信息
1
模型训练系统、图像识别设备、模型训练方法及识别方法
模型训练系统 二值化图像 图像识别设备 样本 模型训练模块
2
基于SNN信息补充的图像识别方法、装置、设备及介质
图像识别模型 脉冲 图像识别方法 阶段 样本
3
一种无人机起降停机坪
停机坪 定位标记 轮廓识别 训练图像识别模型 图像采集单元
4
面部图像识别方法、装置、计算机设备及存储介质
面部图像识别方法 面部特征 面部识别模型 真实面部 计算机可读指令
5
基于上下文感知与模仿学习的目标驱动导航方法及装置
物体 导航方法 多头注意力机制 关系 残差神经网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号