重建混合策略的三维医学图像视觉语言模型预训练方法

AITNT
正文
推荐专利
重建混合策略的三维医学图像视觉语言模型预训练方法
申请号:CN202510119149
申请日期:2025-01-24
公开号:CN119943252B
公开日期:2025-12-12
类型:发明专利
摘要
本发明公开了重建混合策略的三维医学图像视觉语言模型预训练方法,属于医学影像计算技术领域,包括构建医学图像文本对数据集,语言文本掩码重建策略,视觉图像掩码重建策略,语义感知融合策略,多任务联合学习;本发明对大语言模型进行微调,使用微调的大语言模型提取医学报告中的诊断及属性信息并生成高效的提示,并且大语言模型具有较强的泛化能力,大大节省了人工标注的成本;本发明的语义感知融合策略,是将文本编码器得到的文本特征和图像编码器得到的图像特征相结合得到新的文本特征,使文本提前感知图像的诊断及属性信息,进一步优化图像和文本在嵌入空间中的对齐,提升了预训练的效率。
技术关键词
语言模型预训练方法 三维医学图像数据 生成图像特征 文本编码器 图像编码器 多任务联合学习 文本特征向量 融合策略 三维医学图像分割 视觉 图像重建 序列 生成模板 大语言模型 报告 交叉注意力机制 图像解码器
系统为您推荐了相关专利信息
1
基于角度解耦与跨模态匹配的新闻素材推荐方法、装置及电子设备
素材推荐方法 语义向量 动态权重优化 图像 多角度
2
一种基于标签噪声感知策略的弱监督视频异常检测方法
视频异常检测方法 视频特征提取 视频帧特征 特征提取器 文本
3
结合临床语义增强的跨模态门控融合放射学报告生成方法
报告生成方法 解码模块 拼接单元 图像编码器 融合神经网络
4
一种基于大型视觉语言模型的自动驾驶解释文本确定方法
文本 视觉 图像编码器 视频编码器 多视角
5
基于扩散模型的高效人脸风格迁移方法、装置及设备
风格迁移方法 人脸 交叉注意力机制 文本编码器 面部
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号