一种跨模态聚类引导图像编码器的训练方法

AITNT
正文
推荐专利
一种跨模态聚类引导图像编码器的训练方法
申请号:CN202510039422
申请日期:2025-01-10
公开号:CN119851065B
公开日期:2025-09-26
类型:发明专利
摘要
本发明涉及一种跨模态聚类引导图像编码器的训练方法,该方法将对比学习与聚类算法相结合,无缝利用医学图像和放射学文本的全局和局部特征。此方法促进了更为通用和鲁棒的医学视觉表示学习。将图像子区域和文本句子视为进行全局和局部对比学习的基本单元。全局图像和全局文本特征分别通过对编码器提取的局部图像和局部文本特征应用注意力池化得到,随后用于计算全局对比损失。一种跨模态聚类算法,利用通过跨模态注意力获得的局部图像‑文本特征来生成额外的负样本,这些负样本随后被用来计算局部对比损失。
技术关键词
图像编码器 跨模态 局部图像特征 医学 报告 注意力 样本 文本编码器 sigmoid函数 图像解码器 超参数 多层感知机 代表 解码模块 聚类算法
系统为您推荐了相关专利信息
1
一种基于姿势对抗网络的人脸视频生成方法及系统
视频生成模型 双向长短期记忆网络 姿势 音频编码器 视频生成方法
2
隔离开关操作安全性智能监测方法及系统
隔离开关 智能监测方法 应力 影像捕捉设备 空间分布特征
3
一种基于先验引导扩散模型的不确定性医学图像分割系统及方法
医学图像分割系统 图像训练样本 医学图像分割方法 医学图像处理 积层
4
一种基于不同应用场景的新数字记录方法
数字记录方法 数值 黄金 服务器 数据
5
一种无监督医学视频去烟雾方法及程序产品
循环生成对抗网络 烟雾方法 有雾图像 无监督 无雾图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号