摘要
本申请实施例提供一种图像生成方法、装置及显示设备,该方法包括:获取用户输入的多模态信息;基于图像生成模型中的编码网络分别对多模态信息中的各模态信息进行处理,得到各模态信息对应的特征向量;基于图像生成模型中的融合网络对各模态信息分别对应的特征向量进行融合处理,得到融合向量;基于多模态信息,通过图像生成模型中的多阶段网络对融合向量进行处理,得到多模态信息对应的目标图像。本申请实施的图像生成方法能够基于多模态信息生成对应图像。
技术关键词
图像生成模型
多模态信息
网络
图像生成方法
输入区
多阶段
音频编码
显示设备
视频特征向量
生成预测图像
图像生成装置
文本特征向量
图像特征向量
图像编码
系统为您推荐了相关专利信息
车联网环境
手势特征
车载智能终端
车载终端
车载手势识别系统
边坡生态修复
网络拓扑结构
三维渲染技术
植被
三维数字模型
容器部署方法
系统调用序列
时序预测模型
动态
多路径传输优化