摘要
本发明涉及一种跨模态聚类引导图像编码器的训练方法,该方法将对比学习与聚类算法相结合,无缝利用医学图像和放射学文本的全局和局部特征。此方法促进了更为通用和鲁棒的医学视觉表示学习。将图像子区域和文本句子视为进行全局和局部对比学习的基本单元。全局图像和全局文本特征分别通过对编码器提取的局部图像和局部文本特征应用注意力池化得到,随后用于计算全局对比损失。一种跨模态聚类算法,利用通过跨模态注意力获得的局部图像‑文本特征来生成额外的负样本,这些负样本随后被用来计算局部对比损失。
技术关键词
图像编码器
跨模态
局部图像特征
医学
报告
注意力
样本
文本编码器
sigmoid函数
图像解码器
超参数
多层感知机
代表
解码模块
聚类算法
系统为您推荐了相关专利信息
视频生成模型
双向长短期记忆网络
姿势
音频编码器
视频生成方法
隔离开关
智能监测方法
应力
影像捕捉设备
空间分布特征
医学图像分割系统
图像训练样本
医学图像分割方法
医学图像处理
积层
循环生成对抗网络
烟雾方法
有雾图像
无监督
无雾图像