摘要
本发明公开了一种基于广义隐式反射感知的镜像检测方法,构建了一个基于视觉提示的广义隐式反射感知框架。具体来说,引入了一个提示链生成模块,通过思维链推理来感知镜像区域特征,即使在没有实体的情况下也能做到镜像区域特征感知。明确的视觉提示在图像级别是固定的或稍作更新,本发明提出了一个基于门控机制的提示更新模块,以实现特征级别和语义感知更新,减少反射干扰并增强提示链。此外,本发明提出了一个提示注入模块来驱动模型定位镜子。所提出的模块都是即插即用的。本发明在四个镜像基准上以极低的计算复杂度实现了最先进的性能,超越了完全监督和弱监督的单模态、多模态和视频级方法。在七个玻璃、伪装和水下基准上也取得了良好的性能。
技术关键词
生成特征
参数
模块
生成多尺度
广义
镜像
通道
视觉
解码
上采样
全局平均池化
网络
金字塔
多尺度特征
依赖特征
转换器
图像
镜面
多模态
系统为您推荐了相关专利信息
三维卷积神经网络
识别方法
教师
专用数据集
人体骨架
可降解冠脉支架
负泊松比结构
优化设计方法
有限元仿真模拟
结构单元
综合验光仪
判断受检者
人工智能模型
验光方法
场景
早期预警方法
监督学习模型
深度生成模型
时间序列特征
设施