摘要
本发明公开的是具备同时处理多个医学视觉语言任务能力的多模态大模型设计方法及系统,构建基准数据集MedVision‑MT,涵盖医学问答、放射影像报告生成等五项核心任务,经数据过滤和指令池设计提升数据质量,采用分阶段领域适配训练策略,先在自然图像数据集热身,再用MedVision‑MT迁移多任务能力到医学领域,第二阶段训练视觉编码器并提出多属性专家提示生成方法,模型系统包括基本模块和含图像编码、词汇嵌入等模块的网络结构,本发明解决医学领域多模态大模型数据、跨模态对齐等问题,提升任务泛化和应用能力,推动医学人工智能临床应用。
技术关键词
多任务
大语言模型
模型设计方法
图像编码
文本
实体
提示生成方法
医学图像数据集
生成医学报告
网络结构
医学人工智能
医学图像特征
模块
模态特征
视觉数据集
策略
系统为您推荐了相关专利信息
三维模型生成方法
文本
三维模型表示方法
矩阵
体渲染方法
文档对象模型
网页元素
文本转换方法
分词
计算机程序产品