摘要
本发明涉及基于Swin‑Transformer和YOLOv8融合检测算法的高空抛物检测方法,首先将视频流并解码为RGB图像序列并预处理,将预处理后的图像分割为图像块,通过线性嵌入转化为初始特征序列;再利用Swin‑Transformer的Transformer Block分层提取特征,先以窗口自注意力捕捉底层局部特征,融合后下采样,再通过移动窗口注意力捕捉跨窗口特征得到高级特征;随后将高级特征输入YOLOv8检测网络,经多尺度特征融合、锚框匹配及预测解码,获取目标框及置信度;最后通过非极大值抑制优化检测结果并输出。通过Swin‑Transformer与YOLOv8的融合,兼顾全局上下文与局部细节特征,提升了多尺度抛物目标的识别精度,解决了传统方法漏检、误检及定位偏差问题,且能适配复杂场景,实现实时检测。
技术关键词
高空抛物检测方法
序列
图像块特征
局部细节特征
线性变换矩阵
注意力
算法
视频流
矩阵乘法运算
分支
尺寸
图像分割
空间位置关系
亮度直方图
坐标
像素
融合全局
系统为您推荐了相关专利信息
母线负荷预测方法
时间卷积网络
分布式光伏
多阶段
灰狼优化算法
样本生成方法
序列模式挖掘算法
深度Q网络
贪婪策略
位置识别
风险导向审计方法
风险防控策略
规则集
网络拓扑结构
项目
智慧管理方法
序列特征
主特征向量
识别模块
特征提取单元
光伏电池参数
误差补偿模型
实时监测数据
粒子群优化算法
二极管