摘要
本发明属于眼部医学影像精准识别技术领域,尤其提出一种基于多模态协同对比融合网络的眼部疾病分类方法,包括以下步骤:S1.从Kaggle公共数据集中获取眼底彩照影像和OCT影像数据,并获取其标注的疾病类型标签;S2.对眼底彩照影像和OCT影像数据进行预处理,将处理后的数据集按照7:2:1比例随机划分为训练集,测试集和验证集;S3.对划分后的训练集中的数据采用随机形变、翻转、旋转、随即缩放、随机颜色抖动的方式进行数据增强,扩充数据集。本发明在模态特定特征提取部分,采用了针对眼部医学影像特点进行改进的Swin Transformer V2和ConvNeXt V2作为骨干网络,增强了对眼底彩照和OCT影像特征的捕获能力,在ConvNeXt V2中融入了轴向注意力机制,提高了对OCT层状结构的表征能力。
技术关键词
眼部疾病分类方法
多模态协同
眼底彩照
影像
网络
跨模态
数据
多尺度特征
阶段
平面旋转
对比度
训练集
指标
编码器
注意力机制
成像设备
颜色
饱和度
系统为您推荐了相关专利信息
电信号
数据生成方法
编码器
分类网络
生成对抗模型
新型卷积神经网络
轴承故障诊断方法
卷积网络模型
染色体
轴承故障诊断系统
离散小波变换
医学图像融合方法
特征提取模块
分支
重构
鲜食玉米品质
玉米籽粒品质
组织
注意力机制
神经网络模型训练