一种多语义粒度的跨模态预训练方法

正文

推荐专利

一种多语义粒度的跨模态预训练方法

申请号：CN202510238639

申请日期：2025-03-03

公开号：CN120182779A

公开日期：2025-06-20

类型：发明专利

摘要

本发明属于跨模态预训练技术领域，公开一种多语义粒度的跨模态预训练方法。旨在通过融合医学知识库、结构化三元组提取、多任务对比学习与跨模态注意力机制，提升医学影像分析的准确性和可解释性。该方法适用于病灶检测、疾病分型分级诊断，并兼容CTA、IVUS等多种医学影像模态。本发明首先构建了文本处理模块，清洗掉冗余的文本内容，得到关键字，并进行特征提取。然后构建了基于3D视觉编码器的医学影像处理模块。接着进行视觉‑文本标记初步对比，最后通过掩码语言建模和视觉‑文本匹配进行精细对比。最终实现应用于医学影像的跨模态预训练。

技术关键词

预训练方法文本编码器标记特征视觉特征注意力模型三元组语义匹配模块医学知识库疾病分型样本影像注意力机制跨模态代表

系统为您推荐了相关专利信息

基于双态协同解耦与语义精炼的生成式零样本学习方法

零样本学习方法静态特征语义特征原型全局视觉特征

一种视觉语言模型的医疗图像分析方法、装置及存储介质

医学影像诊断报告图像分析方法文本编码器疾病图像编码器

一种基于知识图谱的双分支零样本遥感场景分类方法

遥感场景分类方法典型地物语义向量样本局部视觉特征

一种城市暴雨洪涝灾害链事理图谱构建方法及系统

混合网络模型 BiLSTM模型事理图谱关系多头注意力机制

一种基于交互式小波变换和Transformer的遥感图像长字幕生成方法、系统、设备及介质

字幕生成方法文本图像变换器遥感图像数据视觉特征

一种多语义粒度的跨模态预训练方法

站点导航

APP 下载