一种结合迁移学习和注意力机制的内腔图像深度估计方法

AITNT
正文
推荐专利
一种结合迁移学习和注意力机制的内腔图像深度估计方法
申请号:CN202410904753
申请日期:2024-07-07
公开号:CN118887270A
公开日期:2024-11-01
类型:发明专利
摘要
深度估计在医学影像中具有重要应用价值,可以弥补医生在手术过程中由于观察目镜感官受限而难以获得精确深度信息的不足。针对内腔手术场景动态多变、软组织尺度微小等原因导致深度估计精度不高的问题,本发明提出了一种结合迁移学习和注意力机制的内腔图像深度估计方法。通过利用U‑net网络对内腔图像进行多尺度的特征提取,并结合通道和空间注意力来优化解码的精度,利用多层级深度优化对图像深度进行估计。同时,针对内腔环境中数据集较少、缺少可靠真值的问题,利用室内数据集对MVSNet网络进行预训练,再将学到的特征和权重利用迁移学习对目标内腔数据集的训练网络进行微调。并针对内腔表面图像引入邻域平滑损失项约束具有相似外观的相邻像素,达到生成平滑深度表面的效果。实验表明,本发明的深度估计网络在Hamlyn公开内腔数据集上显著提高了内腔图像的深度估计精度和完整性。
技术关键词
图像深度估计方法 注意力机制 特征提取网络 深度图 内腔 预训练网络 数据 金字塔网络 金字塔结构 手术场景 解码 层级 视角 残差网络 精度
系统为您推荐了相关专利信息
1
基于改进YOLOv8n的钢材表面缺陷检测模型构建方法及系统
表面缺陷检测 模型构建方法 注意力机制 钢材 模块
2
基于Transformer与MOPSO的PM2.5化学组分垂直廓线反演系统及方法
地基激光雷达数据 垂直廓线 反演系统 粒子 皮尔逊相关系数
3
基于提示学习的生成式对话状态跟踪方法
对话状态跟踪方法 关系 预训练语言模型 编码器 链接方法
4
基于人工智能的数据可视化方法及系统
联合特征提取 数据可视化方法 实体 视觉 分箱
5
基于混合大模型和眼动追踪仪构建的第一人称阅片经验培训方法
追踪仪 视觉注意力模型 医学影像诊断报告 眼动数据 培训系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号