一种基于图语义交互的多标签图像分类方法

AITNT
正文
推荐专利
一种基于图语义交互的多标签图像分类方法
申请号:CN202510172949
申请日期:2025-02-17
公开号:CN120147696A
公开日期:2025-06-13
类型:发明专利
摘要
本发明公开了一种基于图语义交互的多标签图像分类方法,解决了现有技术中缺乏动态适应能力,导致分类性能不佳,且不能充分利用标签之间的复杂关系的问题,该方法包括:获取与待分类图像对应的高维视觉特征图、各标签对应的描述文本和标签嵌入向量;计算各标签之间的初始相似度矩阵,引入多尺度保留机制模型生成标签关系图,进而映射得到高维标签语义特征;将高维视觉特征图与高维标签语义特征进行特征交互,通过跨模态注意力机制生成语义通道注意力向量,并根据语义通道注意力进行动态调整图像特征,得到当前层的输出图像特征;将其输入至分类层中,得到各个标签的分类概率,完成多标签分类任务。
技术关键词
图像分类方法 语义特征 全局视觉特征 注意力机制 多尺度 矩阵 跨模态 标签类别 生成标签 保留特征 关系 多标签 文本 全局平均池化
系统为您推荐了相关专利信息
1
一种悬架系统的调节方法、装置、车载设备和计算机程序产品
悬架系统 数据 车辆 风格 传感器
2
一种基于机器视觉的智慧农业导航方法
图像分割网络 透视变换矩阵 大田作物 标注工具 导航方法
3
一种基于预激活多尺度的病灶图像分割方法及系统
克罗恩病 图像分割方法 组合特征提取 多尺度 深度学习技术
4
一种番茄腋芽实时识别、测量与摘除点定位的方法
番茄 端点 图像 农业管理设备 实例分割
5
一种基于多模态融合的3D场景理解与交互方法及装置
交互方法 彩色点云 多模态 深度相机 跨模态
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号