摘要
本发明公开了基于大规模视觉模型和扩散模型的荔枝病虫害检测方法。本发明中,InternImage模型利用3x3DCNv3算子实现了自适应空间聚合和动态感受野,有效捕捉了全局图像信息并加强了特征提取,尤其是在复杂的果园环境中。与其他骨干网络(如ResNet50、ConvNeXt和SwinTransformer)相比,Internation提高了检测精度。此外,DyHead模块集成了规模、空间和任务意识的注意机制,增强了模型检测各种大小物体以及区分位置接近或重叠目标的能力。此外,与NMS相比,CP‑Cluster是一种完全可并行的新型聚类框架。在后处理阶段采用CP‑Cluster,通过生成正信息来增强真实的正方框,同时合成负信息来惩罚多余的方框,从而增强了检测结果。
技术关键词
病虫害检测方法
荔枝
病虫害图像
YOLO模型
视觉
图像嵌入
果园环境
图像编码器
高像素摄像头
注意力机制
病虫害监测
后处理算法
特征提取能力
更新模型参数
智能手机
特征金字塔