摘要
深度估计在医学影像中具有重要应用价值,可以弥补医生在手术过程中由于观察目镜感官受限而难以获得精确深度信息的不足。针对内腔手术场景动态多变、软组织尺度微小等原因导致深度估计精度不高的问题,本发明提出了一种结合迁移学习和注意力机制的内腔图像深度估计方法。通过利用U‑net网络对内腔图像进行多尺度的特征提取,并结合通道和空间注意力来优化解码的精度,利用多层级深度优化对图像深度进行估计。同时,针对内腔环境中数据集较少、缺少可靠真值的问题,利用室内数据集对MVSNet网络进行预训练,再将学到的特征和权重利用迁移学习对目标内腔数据集的训练网络进行微调。并针对内腔表面图像引入邻域平滑损失项约束具有相似外观的相邻像素,达到生成平滑深度表面的效果。实验表明,本发明的深度估计网络在Hamlyn公开内腔数据集上显著提高了内腔图像的深度估计精度和完整性。
技术关键词
图像深度估计方法
注意力机制
特征提取网络
深度图
内腔
预训练网络
数据
金字塔网络
金字塔结构
手术场景
解码
层级
视角
残差网络
精度
系统为您推荐了相关专利信息
表面缺陷检测
模型构建方法
注意力机制
钢材
模块
地基激光雷达数据
垂直廓线
反演系统
粒子
皮尔逊相关系数
对话状态跟踪方法
关系
预训练语言模型
编码器
链接方法
追踪仪
视觉注意力模型
医学影像诊断报告
眼动数据
培训系统