摘要
本发明公开了一种基于条件类别特定提示的医学图像分类方法,包括:1、获取数据集,构建对比文本‑图像对的预训练模型、特征记忆库和轻量级网络,在图像编码器中加入提示后提取医学图像的视觉特征;2、根据医学图像的视觉特征,得到类别平均特征并输入轻量级网络得到类别特定提示,类别特定提示与图像类别拼接输入文本编码器,得到文本特征;3、构建损失函数,利用梯度下降法对网络进行训练,更新图像编码器中的提示和轻量级网络的参数权重,得到最优医学图像分类模型,用于对医学图像进行分类。本发明能根据所有图像的特征生成每个类别特定的提示,以表征不同类别的特征属性,从而能增强文本提示对图像细节的感知,实现更高效的训练和推理。
技术关键词
医学图像分类方法
注意力模型
图像块
图像编码器
文本编码器
视觉特征
医学图像数据集
预测类别
线性
矩阵
文本特征向量
图像特征向量
网络
可读存储介质
参数
系统为您推荐了相关专利信息
手语翻译方法
翻译模型
自然语言文本
文本编码器
姿态特征
图像特征向量
神经网络模型
文本特征向量
多模态
文本编码器
人脸关键点
人脸生成方法
训练注意力
图像
文本编码器