摘要
本发明涉及计算机视觉技术领域,公开了一种基于注意力机制的实时视频目标检测方法及系统,其中,一种基于注意力机制的实时视频目标检测方法包括:多模态数据获取与预处理,获取包括至少两种不同传感器的数据,并进行时空对齐、噪声过滤和格式标准化处理;模态效用评估,对预处理后的各模态数据的效用值进行评估;自适应模态激活控制,生成满足资源约束和性能要求的模态激活方案;可迁移模态配置优化,构建迁移学习模块将先前场景的优化经验迁移到新场景;跨模态注意力融合与目标检测,动态评估激活模态的可靠性,计算注意力权重,执行特征融合和目标检测;本发明通过自适应模态选择和注意力机制融合,实现了全天候环境下的高效目标检测。
技术关键词
注意力机制
实时视频
微分搜索算法
感知损失函数
跨模态
多模态数据采集
卷积神经网络提取特征
场景
轻量级传感器
分层次
数据传输能耗
配置适配器
计算机视觉技术
热点检测
可见光图像
系统为您推荐了相关专利信息
服务协同系统
多模态信息
服务需求信息
智能派单
环境数据采集单元
神经网络模型
语义特征
计算机可执行指令
关系建模
序列