摘要
本发明主要用于计算机视觉技术领域。本发明公开了一种多模态图像融合方法、装置、电子设备及存储介质,该方法包括获取多个图像,并对每个图像进行特征提取,以得到多个图像特征;生成对应每个图像的文本信息;基于多个文本信息,生成文本融合特征;基于多个图像特征以及文本融合特征,通过预设跨模态融合模型,生成融合后的图像。本申请能够通过图像融合的方式,生成高质量图像。
技术关键词
融合特征
文本
令牌
图文
图像融合方法
生成高质量图像
图像融合装置
自然语言模型
电子设备
计算机视觉技术
跨模态
可读存储介质
多层感知机
语义
处理器
模块
解码
多模态
系统为您推荐了相关专利信息
风险预测模型
多维特征数据
预警规则
识别风险
智能预警方法
速度因子
样本
学习分析方法
特征融合网络
解码器