摘要
本发明涉及计算机视觉技术领域,公开了一种基于注意力机制的实时视频目标检测方法及系统,其中,一种基于注意力机制的实时视频目标检测方法包括:多模态数据获取与预处理,获取包括至少两种不同传感器的数据,并进行时空对齐、噪声过滤和格式标准化处理;模态效用评估,对预处理后的各模态数据的效用值进行评估;自适应模态激活控制,生成满足资源约束和性能要求的模态激活方案;可迁移模态配置优化,构建迁移学习模块将先前场景的优化经验迁移到新场景;跨模态注意力融合与目标检测,动态评估激活模态的可靠性,计算注意力权重,执行特征融合和目标检测;本发明通过自适应模态选择和注意力机制融合,实现了全天候环境下的高效目标检测。
技术关键词
注意力机制
实时视频
微分搜索算法
感知损失函数
跨模态
多模态数据采集
卷积神经网络提取特征
场景
轻量级传感器
分层次
数据传输能耗
配置适配器
计算机视觉技术
热点检测
可见光图像
系统为您推荐了相关专利信息
闯入检测方法
权重模型
动态
关键点
全局平均池化
组件特征
推荐方法
图像处理模型
项目
文本处理模型
金字塔结构
跨尺度特征融合
解码器执行
引入注意力机制
上采样
数据安全管控
时序
深度学习模型
分层策略
特征提取网络