一种基于D-GCN和目标检测网络yolov5的多标签图像分类方法

正文

推荐专利

申请号：CN202510902816

申请日期：2025-07-01

公开号：CN120894602A

公开日期：2025-11-04

类型：发明专利

摘要

本发明涉及深度学习计算机视觉技术等领域，公开了一种基于D‑GCN和目标检测网络yolov5的多标签图像分类方法，用目标检测的方法精准地提取图像各个类别的视觉特征，并且提出了一种语义解耦方法，将词向量和图像特征进行多模态融合，生成图的节点，包括下述步骤：使用ResNet101模型对输入图像进行特征提取，经过一个最大池化层和一个全连接层进行分类，得到第一组置信分数；使用预训练的yolov5对输入的图像进行目标检测，然后对于网络检测出的边框进行汇总，统计各个类别的边框，计算得到第二组置信分数；对于每个类别，将图像按照检测出的边框裁剪出来，并使用ResNet101模型对每张剪裁出的图像进行特征提取，生成tensor向量，最后求得加权平均值特征向量。

技术关键词

图像分类方法网络深度学习计算机视觉双线性池化注意力 sigmoid函数融合视觉特征多模态融合特征双曲正切函数全局平均池化解耦方法二分类器节点矩阵多标签

系统为您推荐了相关专利信息

一种分布式计算框架下的视频加速处理方法

分布式计算框架分块关键帧网络传输开销 NTP服务器

考虑多重优化的长距离引调水泵站系统调度方法及系统

水泵站系统调度调水工程构建机器学习模型长短期记忆网络泵站运行状态

一种基于深度神经网络优化模糊PID参数的屑饼热压温度控制方法

温度控制方法深度神经网络 PID控制参数模糊推理热压

基于复杂场景下无人机LiDAR建模的误差抑制方法

误差抑制方法深度学习网络模型纹理特征数据点云

一种自动解密数据库字段的方法

解密算法数据加密算法字段网络攻击信息内存

一种基于D-GCN和目标检测网络yolov5的多标签图像分类方法

站点导航

APP 下载