基于视觉-语言多模态对比学习的超声图像预训练方法

AITNT
正文
推荐专利
基于视觉-语言多模态对比学习的超声图像预训练方法
申请号:CN202410932383
申请日期:2024-07-12
公开号:CN118821900B
公开日期:2025-02-18
类型:发明专利
摘要
本发明公开一种基于视觉‑语言多模态对比学习的超声图像预训练方法,通过单模态局部对比学习与多模态局部对比学习实现特征对齐,并创造性地提出自监督预训练方法,该方法使用医学超声图像数据与诊断报告文本数据学习输入图像和报告文本的单模态和多模态特征表示,利用单模态对比损失与多模态对比损失对齐图像与文本特征。本发明考虑到超声图像与诊断报告的特点,本发明采用局部对比学习的方式来细粒度对齐图像与文本特征。本发明以掩码语言建模和图像文本匹配作为预训练目标进行预训练。
技术关键词
预训练方法 文本编码器 图像编码器 局部图像特征 多模态 图像解码器 报告 医学超声图像 融合视觉特征 交叉注意力机制 度函数 图像块 生成答案 模态特征
系统为您推荐了相关专利信息
1
基于知识库与多智能体协同决策的内容审查系统
图谱 实体 模态分析 决策 跨模态数据
2
一种真空浓缩实时监测与智能优化系统
智能优化系统 参数优化算法 真空浓缩 补偿控制器 智能决策引擎
3
服务启动顺序的优化方法和装置、电子设备和存储介质
基板管理控制器 指标 多模态 分支 节点更新
4
语音风格迁移方法、装置、设备及介质
语音风格迁移方法 融合特征 音频特征 信号 梅尔频率倒谱系数
5
一种多模态人群计数方法及系统
计数方法 注意力 融合特征 图像 可见光
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号