摘要
本发明公开了一种基于交换的多模态多尺度变换融合方法和系统,该方法包括:获取原始图像数据和原始文本数据并输入MMTF模型,生成融合结果,其中,MMTF模型包括:多模态编码器模块、解码器模块、基于通道的信息交换模块和多尺度融合模块,多模态编码器模块包括文本编码器和双分支图像解码器;解码器模块对编码器生成的嵌入进行解码;基于通道的信息交换模块对不同通道上的不同模态的嵌入进行信息交换;多尺度融合模块,用于根据不同分支上的图像特征和文本特征,融合来自一个分支的cls令牌和来自另一个分支中的补丁令牌。本发明的方法可以在各种医疗环境中提供可靠的决策支持,提高诊断准确性并减少临床医生的工作量。
技术关键词
令牌
信息交换模块
变换融合方法
分支
图像嵌入
图像编码器
融合图像特征
注意力
多尺度
文本编码器
多模态信息
补丁
编码器模块
原始图像数据
融合系统
解码器
文本生成图像
系统为您推荐了相关专利信息
场景特征
神经网络单元
识别模型训练方法
数据识别方法
误差
智能驾驶环境
枝节
MIMO天线
天线辐射单元
中心对称
细胞分割方法
分水岭算法
拉普拉斯
双分支网络
细胞形态特征
文本编码器
图像编码器
图像空间分辨率
嵌入特征
两阶段