摘要
本申请公开了一种用于对超广角眼底图像处理模型进行训练的方法及产品,所述方法包括:将第一超广角眼底图像和多模态信息作为训练数据输入至视觉语言模型中进行预训练,以获得预训练后的视觉语言模型;联合所述预训练后的视觉语言模型与下游任务模型,以获得所述超广角眼底图像处理模型;将第二超广角眼底图像和标注信息作为训练数据输入至所述超广角眼底图像处理模型中进行微调,以获得最终的超广角眼底图像处理模型。利用本申请的方案,能够降低对大规模精确标注数据的依赖,并训练出具有较强泛化能力的模型,训练完成的模型能够充分适应超广角眼底图像的复杂性,自动提取和分析覆盖更广视网膜区域的丰富信息。
技术关键词
眼底图像处理
多模态信息
视觉
文本编码器
图像编码器
数据
解码器
处理器
程序
指令
分类器
可读存储介质
报告
视盘
存储器
疾病
电子设备