摘要
本发明公开了一种跨模态文本生成方法、装置、电子设备及存储介质,该方法包括:加载图像‑文本迁移模型,图像‑文本迁移模型包括图像编码器和文本编码器;基于图像编码器构建图像分类模型,并对图像分类模型进行微调,更新图像分类模型;获取医学图像数据,基于图像分类模型对医学图像数据进行分类处理,得到分类结果;分类结果包括多个维度的分类标签以及分类标签对应的提示数据;基于文本编码器对分类标签对应的提示数据进行编码处理,形成特征空间;在特征空间中进行检索,得到与医学图像数据的医学图像特征匹配的提示数据组;基于提示数据组生成医学图像数据对应的文本数据。实现图像到文本的跨模态生成。
技术关键词
图像分类模型
图像编码器
医学图像数据
文本编码器
医学图像特征
文本生成方法
标签
跨模态
模块
生成医学图像
文本生成装置
电子设备
分类器
处理器
可读存储介质
计算机
系统为您推荐了相关专利信息
医学图像分类方法
文本编码器
图像编码器
分类器
医学图像数据
生成医学图像
插值方法
网络
医学图像重建技术
立方体
图像分类模型
待检对象
视频
计算机程序指令
人脸关键点识别
乳腺癌病理图像
自动分割方法
训练分类模型
图像嵌入
图像编码器
离散小波变换
EEG信号分类
局部空间特征
样本
标记器