具备同时处理多个医学视觉语言任务能力的多模态大模型设计方法及系统

正文

推荐专利

申请号：CN202511094000

申请日期：2025-08-06

公开号：CN120597938B

公开日期：2025-11-07

类型：发明专利

摘要

本发明公开的是具备同时处理多个医学视觉语言任务能力的多模态大模型设计方法及系统，构建基准数据集MedVision‑MT，涵盖医学问答、放射影像报告生成等五项核心任务，经数据过滤和指令池设计提升数据质量，采用分阶段领域适配训练策略，先在自然图像数据集热身，再用MedVision‑MT迁移多任务能力到医学领域，第二阶段训练视觉编码器并提出多属性专家提示生成方法，模型系统包括基本模块和含图像编码、词汇嵌入等模块的网络结构，本发明解决医学领域多模态大模型数据、跨模态对齐等问题，提升任务泛化和应用能力，推动医学人工智能临床应用。

技术关键词

多任务大语言模型模型设计方法图像编码文本实体提示生成方法医学图像数据集生成医学报告网络结构医学人工智能医学图像特征模块模态特征视觉数据集策略

系统为您推荐了相关专利信息

基于文本引导的二级串联式三维模型生成方法

三维模型生成方法文本三维模型表示方法矩阵体渲染方法

一种基于小波扩散模型的人脸数据合成方法

人脸识别模型风格身份离散小波变换噪声图像

繁简文本转换方法、装置、设备、存储介质及计算机程序产品

文档对象模型网页元素文本转换方法分词计算机程序产品

一种钻井难点预测与难点解决方案生成方法、装置及设备

地层特征标签图谱列表文本

支付合规性审查方法、装置及电子设备

关键词合规性实体文本三层次结构

具备同时处理多个医学视觉语言任务能力的多模态大模型设计方法及系统

站点导航

APP 下载