摘要
本发明涉及一种推理增强型视觉‑语言大模型训练及图像处理方法,其中训练方法包括以下步骤:获取超广角眼底图像作为输入图像,以超广角眼底图像的人工标注DR分级、人工标注病变类型以及临床背景作为提示词,利用具备推理能力的视觉‑语言模型生成推理增强的图像描述以及推理得到的DR分级和病变类型;将生成的图像描述以及推理得到的DR分级和病变类型作为指令,结合超广角眼底图像构建推理增强指令数据集,微调推理增强型视觉‑语言大模型。与现有技术相比,本发明具有能够有效整合临床知识、识别准确性高、可解释性强等优点。
技术关键词
模型训练方法
图像处理方法
多层感知机
指令
标记
答案
处理器
可读存储介质
存储器
视觉特征
电子设备
程序
文本
计算机
布局
格式
逻辑
数据
系统为您推荐了相关专利信息
地源热泵空调系统
碳排放核算方法
数据
温差
排放量
代码切片
代码漏洞检测方法
监督学习模型
数据依赖关系
语句
性预测方法
智能网联汽车
邻居
多模态
注意力机制
需求预测模型
多源特征
产品推荐方法
训练样本数据
客户