摘要
本发明公开了基于图像增强和多尺度学习的复杂光线下的行人检测方法。该方法首先使用LENet作为数据增强的部分,对原始图片进行曝光处理,在提升亮度的同时更好地保留图像质量和细节,增加数据集的多样性,增强模型的鲁棒性和泛化能力。然后针对行人检测的复杂性,构建了一个yolov7网络模型,并对其颈部进行了优化,通过增加SFR注意力机制进行结构调整,实现多尺度信息的利用,让网络能够更好地理解不同尺度下的特征,提高网络对小物体的检测能力。通过将不同层次的特征进行紧密的融合,提高了网络对复杂语义的理解能力。可以大幅度提升复杂光线下行人的识别准确率。
技术关键词
行人检测方法
图像增强网络
注意力机制
金字塔池化
多尺度信息
训练集数据
计算机
可读存储介质
上采样
鲁棒性
语义
光照
图片
亮度
系统为您推荐了相关专利信息
单轨吊设备
路径设计方法
数据处理单元
注意力机制
视觉摄像头
有雾图像
视频去雾方法
标记存储器
注意力机制
颜色查找表
配电网设备状态
数据驱动模型
多模态
深度学习模型优化
数字孪生建模
物联网传感器数据
多模态数据融合
动态预测模型
动态调整机制
蒙特卡洛方法