具备同时处理多个医学视觉语言任务能力的多模态大模型设计方法及系统

AITNT
正文
推荐专利
具备同时处理多个医学视觉语言任务能力的多模态大模型设计方法及系统
申请号:CN202511094000
申请日期:2025-08-06
公开号:CN120597938B
公开日期:2025-11-07
类型:发明专利
摘要
本发明公开的是具备同时处理多个医学视觉语言任务能力的多模态大模型设计方法及系统,构建基准数据集MedVision‑MT,涵盖医学问答、放射影像报告生成等五项核心任务,经数据过滤和指令池设计提升数据质量,采用分阶段领域适配训练策略,先在自然图像数据集热身,再用MedVision‑MT迁移多任务能力到医学领域,第二阶段训练视觉编码器并提出多属性专家提示生成方法,模型系统包括基本模块和含图像编码、词汇嵌入等模块的网络结构,本发明解决医学领域多模态大模型数据、跨模态对齐等问题,提升任务泛化和应用能力,推动医学人工智能临床应用。
技术关键词
多任务 大语言模型 模型设计方法 图像编码 文本 实体 提示生成方法 医学图像数据集 生成医学报告 网络结构 医学人工智能 医学图像特征 模块 模态特征 视觉数据集 策略
系统为您推荐了相关专利信息
1
基于文本引导的二级串联式三维模型生成方法
三维模型生成方法 文本 三维模型表示方法 矩阵 体渲染方法
2
一种基于小波扩散模型的人脸数据合成方法
人脸识别模型 风格 身份 离散小波变换 噪声图像
3
繁简文本转换方法、装置、设备、存储介质及计算机程序产品
文档对象模型 网页元素 文本转换方法 分词 计算机程序产品
4
一种钻井难点预测与难点解决方案生成方法、装置及设备
地层特征 标签 图谱 列表 文本
5
支付合规性审查方法、装置及电子设备
关键词 合规性 实体 文本 三层次结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号