摘要
本发明涉及医疗多模态模型训练方法、装置、电子设备及存储介质,该方法包括:获取多模态医疗数据,包含医疗图像数据和医疗文本数据,并将医疗图像数据和医疗文本数据分别转换为图像标记和文本标记。对图像标记和文本标记进行编码处理,以提取图像特征和文本特征,并将图像特征和文本特征输入至医疗多模态模型进行信息关联。基于图像特征和文本特征的关联信息,通过医疗多模态模型根据预设的任务目标进行迭代训练,得到训练后的医疗多模态模型。医疗多模态模型由医疗图像分割模型、医疗图像分类模型、医疗视觉问答模型以及医疗文本分类模型共同构成,任务目标为医疗图像分割任务、医疗图像分类任务、医疗视觉问答任务以及医疗文本分类任务。
技术关键词
医疗图像数据
医疗文本数据
多模态
医疗图像分类
模型训练方法
标记
视觉问答模型
文本分类模型
图像分割模型
图像块
序列
图像嵌入
神经网络模型
融合网络结构
交叉注意力机制
系统为您推荐了相关专利信息
动态优化系统
数字孪生模型
患者
措施
多模态数据采集
电力设备故障诊断
计算机程序指令
注意力机制
跨模态
时序
模态特征
数据检索方法
非易失性存储介质
多模态
图像特征提取模型