一种推理增强型视觉-语言大模型训练及图像处理方法

正文

推荐专利

申请号：CN202510615713

申请日期：2025-05-14

公开号：CN120654766A

公开日期：2025-09-16

类型：发明专利

摘要

本发明涉及一种推理增强型视觉‑语言大模型训练及图像处理方法，其中训练方法包括以下步骤：获取超广角眼底图像作为输入图像，以超广角眼底图像的人工标注DR分级、人工标注病变类型以及临床背景作为提示词，利用具备推理能力的视觉‑语言模型生成推理增强的图像描述以及推理得到的DR分级和病变类型；将生成的图像描述以及推理得到的DR分级和病变类型作为指令，结合超广角眼底图像构建推理增强指令数据集，微调推理增强型视觉‑语言大模型。与现有技术相比，本发明具有能够有效整合临床知识、识别准确性高、可解释性强等优点。

技术关键词

模型训练方法图像处理方法多层感知机指令标记答案处理器可读存储介质存储器视觉特征电子设备程序文本计算机布局格式逻辑数据

系统为您推荐了相关专利信息

一种地源热泵空调系统碳排放核算方法

地源热泵空调系统碳排放核算方法数据温差排放量

一种代码漏洞检测方法、装置、计算机设备及存储介质

代码切片代码漏洞检测方法监督学习模型数据依赖关系语句

基于多维数据校验的企业股权图谱构建方法及存储介质

图谱构建方法文本实体节点关系

智能网联汽车用户多模态评论有用性预测方法和系统

性预测方法智能网联汽车邻居多模态注意力机制

贷款需求预测与产品推荐方法、装置及设备、计算机程序产品

需求预测模型多源特征产品推荐方法训练样本数据客户

一种推理增强型视觉-语言大模型训练及图像处理方法

站点导航

APP 下载