摘要
本发明公开了一种基于几何感知与通道注意力机制的深度补全方法,涉及计算机视觉与深度学习技术领域。包括:利用非线性传播模型生成初始稠密深度图;采用PointNet++提取全局3D几何特征;使用U‑Net对初始密集深度图和图像特征进行初步融合;并通过基于通道注意力机制的多模态融合模块对全局3D几何特征和初步融合特征进行加权融合,生成优化后的融合特征;利用该融合特征进行残差学习修正初始稠密深度图;采用CSPN++结合稀疏深度图中的原始稀疏真值,对补全结果进行优化。本发明通过对GAC‑Net结构进行整体的优化,提高了场景几何感知能力,充分利用3D全局特征,提升对复杂环境的适应性。
技术关键词
稠密深度图
通道注意力机制
深度补全方法
融合特征
激光雷达点云数据
稀疏深度图
多模态特征融合
金字塔结构
残差学习
图像
模块
非线性
深度学习技术
场景结构
计算机视觉
多尺度
系统为您推荐了相关专利信息
人脸超分辨率
视频流
低分辨率人脸图像识别
高分辨率人脸图像
直方图均衡化方法
融合多模态特征
损失函数优化
注意力机制
多层感知机
时序