针对眼底图像多任务模型的构建和训练方法及装置

AITNT
正文
推荐专利
针对眼底图像多任务模型的构建和训练方法及装置
申请号:CN202510447878
申请日期:2025-04-10
公开号:CN120297420A
公开日期:2025-07-11
类型:发明专利
摘要
本发明提出一种针对眼底图像多任务模型的构建和训练方法及装置,属于图像处理领域,包括:S1:收集并整理公开的眼底图像数据集,根据真实标注构造图像文本对,对多模态大语言模型进行两阶段的训练,多模态大语言模型包括:视觉编码器、视觉投影器和大语言模型;S2:将图像数据输入训练好的多模态大语言模型中的视觉编码器,得到增强视觉特征,将经过视觉投影器,提取视觉特征;S3:将文本输入进行嵌入得到文本特征,与视觉特征拼接后输入大语言模型生成预测文本A。本发明方法收集了广泛的眼底图像数据进行训练,充分利用眼底图像中的多层次病变特征,能有效提高模型执行眼底疾病辅助诊断任务的表现。
技术关键词
视觉特征 大语言模型 图像 投影器 文本特征向量 数据 多层感知机 模板 训练装置 双三次插值 两阶段 多模态特征 分层特征 语义 标签 策略性 多任务
系统为您推荐了相关专利信息
1
一种AI光伏组件串焊机系统
光伏组件串焊机 图像识别单元 数据处理模块 数据分析单元 控制模块
2
交通拥堵状况评估方法、设备及介质
状况评估方法 交通视频图像 交通车辆 视频图像分割技术 认证设备
3
一种基于特征互补和选择的上采样网络的图像分割方法
图像分割方法 解码器 编码器模块 分辨率 上采样方法
4
基于太赫兹波的术中脑组织漂移实时校正装置及方法
校正装置 实时图像 伸缩柱 检测探头 控制台
5
设备处理方法、数据处理方法、装置、第二设备和系统
密钥 加密 网络配置信息 标识 账户
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号