重建混合策略的三维医学图像视觉语言模型预训练方法

正文

推荐专利

申请号：CN202510119149

申请日期：2025-01-24

公开号：CN119943252B

公开日期：2025-12-12

类型：发明专利

摘要

本发明公开了重建混合策略的三维医学图像视觉语言模型预训练方法，属于医学影像计算技术领域，包括构建医学图像文本对数据集，语言文本掩码重建策略，视觉图像掩码重建策略，语义感知融合策略，多任务联合学习；本发明对大语言模型进行微调，使用微调的大语言模型提取医学报告中的诊断及属性信息并生成高效的提示，并且大语言模型具有较强的泛化能力，大大节省了人工标注的成本；本发明的语义感知融合策略，是将文本编码器得到的文本特征和图像编码器得到的图像特征相结合得到新的文本特征，使文本提前感知图像的诊断及属性信息，进一步优化图像和文本在嵌入空间中的对齐，提升了预训练的效率。

技术关键词

语言模型预训练方法三维医学图像数据生成图像特征文本编码器图像编码器多任务联合学习文本特征向量融合策略三维医学图像分割视觉图像重建序列生成模板大语言模型报告交叉注意力机制图像解码器

系统为您推荐了相关专利信息

一种基于幻觉增强的跨模态检索模型优化系统及方法

文本特征向量图像特征向量模型优化系统文本编码器样本

基于文本反演的内容语义分离图像风格表征学习方法及装置

风格表征学习方法语义反演方法适配器

一种语义引导的极端过曝图像修复方法

亮度图像修复方法变分自动编码器噪声预测校正

一种基于大规模语言模型的地址重写方法

重写方法地址解析数据地址映射多任务语义

基于多模态特征嵌入与关键点特征对齐的大模型问诊系统

关键点特征多模态特征图像问诊系统医疗知识图谱

重建混合策略的三维医学图像视觉语言模型预训练方法

站点导航

APP 下载