摘要
本发明提出了一种基于视觉‑语言预训练模型和排名感知提示策略的糖尿病视网膜病变分级方法。该方法通过图像和文本的双编码方式,将眼底彩色图像与对应的DR分级标签转化为图像特征和文本嵌入,利用图像与文本之间的相似度进行匹配,实现准确的DR分级。为解决类别不平衡和自然顺序建模的问题,引入了排名感知提示模块和相似度矩阵平滑模块,其中排名感知提示确保了模型能够学习并保持不同DR等级之间的顺序关系,SMS模块则有效缓解了数据不平衡带来的影响。本发明的方法能在多种DR分级任务中表现出较高的准确性和鲁棒性,特别是在少样本或类别不均衡的情况下。该方法不仅提高了分级准确性,还为临床诊断提供了有效的辅助工具,具有广泛的应用前景。
技术关键词
糖尿病视网膜病变
预训练模型
图像特征向量
标签
低对比度图像
视觉
数据
文本特征向量
直方图均衡化
图像特征提取
矩阵
网络
文本编码器
图像编码器
高斯滤波器
策略
关系
系统为您推荐了相关专利信息
手机信令数据
模式聚类方法
序列
标签
居民出行调查数据
脑部肿瘤分割方法
医学影像数据
图像重建
网络
分割系统