一种跨模态文本生成方法、装置、电子设备及存储介质

AITNT
正文
推荐专利
一种跨模态文本生成方法、装置、电子设备及存储介质
申请号:CN202410997490
申请日期:2024-07-24
公开号:CN118886402B
公开日期:2025-02-25
类型:发明专利
摘要
本发明公开了一种跨模态文本生成方法、装置、电子设备及存储介质,该方法包括:加载图像‑文本迁移模型,图像‑文本迁移模型包括图像编码器和文本编码器;基于图像编码器构建图像分类模型,并对图像分类模型进行微调,更新图像分类模型;获取医学图像数据,基于图像分类模型对医学图像数据进行分类处理,得到分类结果;分类结果包括多个维度的分类标签以及分类标签对应的提示数据;基于文本编码器对分类标签对应的提示数据进行编码处理,形成特征空间;在特征空间中进行检索,得到与医学图像数据的医学图像特征匹配的提示数据组;基于提示数据组生成医学图像数据对应的文本数据。实现图像到文本的跨模态生成。
技术关键词
图像分类模型 图像编码器 医学图像数据 文本编码器 医学图像特征 文本生成方法 标签 跨模态 模块 生成医学图像 文本生成装置 电子设备 分类器 处理器 可读存储介质 计算机
系统为您推荐了相关专利信息
1
一种多模态提示学习的二阶少样本医学图像分类方法、系统、存储介质及设备
医学图像分类方法 文本编码器 图像编码器 分类器 医学图像数据
2
基于图神经网络的医学图像表面插值方法及系统
生成医学图像 插值方法 网络 医学图像重建技术 立方体
3
光序检测方法、电子设备和存储介质
图像分类模型 待检对象 视频 计算机程序指令 人脸关键点识别
4
一种基于通用分割模型与Transformer的乳腺癌病理图像自动分割方法及系统
乳腺癌病理图像 自动分割方法 训练分类模型 图像嵌入 图像编码器
5
一种基于小波神经量化训练与语义对齐的EEG表征方法
离散小波变换 EEG信号分类 局部空间特征 样本 标记器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号