摘要
本发明公开了一种基于注意力机制的单目图像的语义补全方法、介质和设备,该方法包括:接收单目室内场景图像并进行预处理;通过卷积神经网络提取包含深度特征图和语义特征图的原始特征图;将深度特征图与语义特征图进行通道维度拼接形成拼接特征图;通过可学习的卷积层处理拼接特征图,基于深度特征与语义特征的耦合关系计算归一化注意力权重,并对特征值进行加权优化得到注意力特征图;将注意力特征图与原始特征图逐元素相加融合;最后通过上采样恢复图像尺寸并预测每个像素点的语义类别,生成语义补全结果。本发明通过深度特征与语义特征的动态耦合及注意力加权机制,有效解决了传统方法中深度信息与语义信息融合不足的问题。
技术关键词
室内场景图像
补全方法
像素点
注意力机制
语义特征
特征值
卷积神经网络提取
计算机程序指令
因子
融合特征
空洞
幅值
高斯滤波器
上采样
存储计算机程序
邻域
系统为您推荐了相关专利信息
多模态
数据采集层
异构数据语义
生命周期管理
强化学习算法
轨道提取方法
模板
相机外参
加速模型训练
坐标系
虚拟网络功能
启发式信息
匹配注意力机制
资源
节点
视觉定位导航
数据自动标注方法
语义特征
图像
坐标点