一种推理增强型视觉-语言大模型训练及图像处理方法

AITNT
正文
推荐专利
一种推理增强型视觉-语言大模型训练及图像处理方法
申请号:CN202510615713
申请日期:2025-05-14
公开号:CN120654766A
公开日期:2025-09-16
类型:发明专利
摘要
本发明涉及一种推理增强型视觉‑语言大模型训练及图像处理方法,其中训练方法包括以下步骤:获取超广角眼底图像作为输入图像,以超广角眼底图像的人工标注DR分级、人工标注病变类型以及临床背景作为提示词,利用具备推理能力的视觉‑语言模型生成推理增强的图像描述以及推理得到的DR分级和病变类型;将生成的图像描述以及推理得到的DR分级和病变类型作为指令,结合超广角眼底图像构建推理增强指令数据集,微调推理增强型视觉‑语言大模型。与现有技术相比,本发明具有能够有效整合临床知识、识别准确性高、可解释性强等优点。
技术关键词
模型训练方法 图像处理方法 多层感知机 指令 标记 答案 处理器 可读存储介质 存储器 视觉特征 电子设备 程序 文本 计算机 布局 格式 逻辑 数据
系统为您推荐了相关专利信息
1
一种地源热泵空调系统碳排放核算方法
地源热泵空调系统 碳排放核算方法 数据 温差 排放量
2
一种代码漏洞检测方法、装置、计算机设备及存储介质
代码切片 代码漏洞检测方法 监督学习模型 数据依赖关系 语句
3
基于多维数据校验的企业股权图谱构建方法及存储介质
图谱构建方法 文本 实体 节点 关系
4
智能网联汽车用户多模态评论有用性预测方法和系统
性预测方法 智能网联汽车 邻居 多模态 注意力机制
5
贷款需求预测与产品推荐方法、装置及设备、计算机程序产品
需求预测模型 多源特征 产品推荐方法 训练样本数据 客户
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号