一种通用的视觉语言模型医学影像分割方法

正文

推荐专利

一种通用的视觉语言模型医学影像分割方法

申请号：CN202410853327

申请日期：2024-06-28

公开号：CN118736227A

公开日期：2024-10-01

类型：发明专利

摘要

本发明公开一种通用的视觉语言模型医学影像分割方法，包括步骤：S10,获取医学影像图像数据和临床文本信息数据；S20,通过图像编码器对输入图像进行编码以获取图像特征，通过文本编码器对相应的临床文本信息进行编码以获取文本特征；S30,将文本特征和图像特征同时传递到多模态解码器，多模态解码器包括多个共同注意块CAB，用于逐层融合和解码多模态特征；S40,多模态解码器的数据结果利用分割头得到预测结果。本发明能够有效整合跨模态信息，全面捕获多模态信息，提高了医学影像分割质量，对结合文本信息感染区域自动分割。

技术关键词

医学影像分割方法多模态特征文本编码器图像编码器解码器注意力多模态信息模块线性视觉特征数据跨模态矩阵

系统为您推荐了相关专利信息

一种面向社区的异常行为识别方法及相关设备

高层语义特征视觉特征灰度特征识别方法特征辨识度

一种医学图像增强方法、系统、电子设备及存储介质

医学图像增强方法编码模块残差模块解码模块噪声特征

语音生成方法、装置、电子设备和存储介质

语音生成方法语音生成模型文本生成语音序列

基于扩散、分割和超分辨率模型的去阴影方法及系统

阴影方法读取原始图像超分辨率模型切片图像分割模型

一种水域遥感图像中云层遮挡处理方法

合成孔径雷达图像文本编码器解码模块图像识别模型编码模块

一种通用的视觉语言模型医学影像分割方法

站点导航

APP 下载