一种结合迁移学习和注意力机制的内腔图像深度估计方法

正文

推荐专利

申请号：CN202410904753

申请日期：2024-07-07

公开号：CN118887270A

公开日期：2024-11-01

类型：发明专利

摘要

深度估计在医学影像中具有重要应用价值，可以弥补医生在手术过程中由于观察目镜感官受限而难以获得精确深度信息的不足。针对内腔手术场景动态多变、软组织尺度微小等原因导致深度估计精度不高的问题，本发明提出了一种结合迁移学习和注意力机制的内腔图像深度估计方法。通过利用U‑net网络对内腔图像进行多尺度的特征提取，并结合通道和空间注意力来优化解码的精度，利用多层级深度优化对图像深度进行估计。同时，针对内腔环境中数据集较少、缺少可靠真值的问题，利用室内数据集对MVSNet网络进行预训练，再将学到的特征和权重利用迁移学习对目标内腔数据集的训练网络进行微调。并针对内腔表面图像引入邻域平滑损失项约束具有相似外观的相邻像素，达到生成平滑深度表面的效果。实验表明，本发明的深度估计网络在Hamlyn公开内腔数据集上显著提高了内腔图像的深度估计精度和完整性。

技术关键词

图像深度估计方法注意力机制特征提取网络深度图内腔预训练网络数据金字塔网络金字塔结构手术场景解码层级视角残差网络精度

系统为您推荐了相关专利信息

基于改进YOLOv8n的钢材表面缺陷检测模型构建方法及系统

表面缺陷检测模型构建方法注意力机制钢材模块

基于Transformer与MOPSO的PM2.5化学组分垂直廓线反演系统及方法

地基激光雷达数据垂直廓线反演系统粒子皮尔逊相关系数

基于提示学习的生成式对话状态跟踪方法

对话状态跟踪方法关系预训练语言模型编码器链接方法

基于人工智能的数据可视化方法及系统

联合特征提取数据可视化方法实体视觉分箱

基于混合大模型和眼动追踪仪构建的第一人称阅片经验培训方法

追踪仪视觉注意力模型医学影像诊断报告眼动数据培训系统

一种结合迁移学习和注意力机制的内腔图像深度估计方法

站点导航

APP 下载