基于视觉-语言多模态对比学习的超声图像预训练方法

正文

推荐专利

申请号：CN202410932383

申请日期：2024-07-12

公开号：CN118821900B

公开日期：2025-02-18

类型：发明专利

摘要

本发明公开一种基于视觉‑语言多模态对比学习的超声图像预训练方法，通过单模态局部对比学习与多模态局部对比学习实现特征对齐，并创造性地提出自监督预训练方法，该方法使用医学超声图像数据与诊断报告文本数据学习输入图像和报告文本的单模态和多模态特征表示，利用单模态对比损失与多模态对比损失对齐图像与文本特征。本发明考虑到超声图像与诊断报告的特点，本发明采用局部对比学习的方式来细粒度对齐图像与文本特征。本发明以掩码语言建模和图像文本匹配作为预训练目标进行预训练。

技术关键词

预训练方法文本编码器图像编码器局部图像特征多模态图像解码器报告医学超声图像融合视觉特征交叉注意力机制度函数图像块生成答案模态特征

系统为您推荐了相关专利信息

基于知识库与多智能体协同决策的内容审查系统

图谱实体模态分析决策跨模态数据

一种真空浓缩实时监测与智能优化系统

智能优化系统参数优化算法真空浓缩补偿控制器智能决策引擎

服务启动顺序的优化方法和装置、电子设备和存储介质

基板管理控制器指标多模态分支节点更新

语音风格迁移方法、装置、设备及介质

语音风格迁移方法融合特征音频特征信号梅尔频率倒谱系数

一种多模态人群计数方法及系统

计数方法注意力融合特征图像可见光

基于视觉-语言多模态对比学习的超声图像预训练方法

站点导航

APP 下载