多模态图像融合方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202410761122

申请日期：2024-06-13

公开号：CN118762258B

公开日期：2025-04-22

类型：发明专利

摘要

本发明主要用于计算机视觉技术领域。本发明公开了一种多模态图像融合方法、装置、电子设备及存储介质，该方法包括获取多个图像，并对每个图像进行特征提取，以得到多个图像特征；生成对应每个图像的文本信息；基于多个文本信息，生成文本融合特征；基于多个图像特征以及文本融合特征，通过预设跨模态融合模型，生成融合后的图像。本申请能够通过图像融合的方式，生成高质量图像。

技术关键词

融合特征文本令牌图文图像融合方法生成高质量图像图像融合装置自然语言模型电子设备计算机视觉技术跨模态可读存储介质多层感知机语义处理器模块解码多模态

系统为您推荐了相关专利信息

基于情感识别与图神经网络的企业组织智能预警方法及装置

风险预测模型多维特征数据预警规则识别风险智能预警方法

一种视频生成方法、装置、电子设备及存储介质

文本语音分段画面视频生成方法

剪辑在线流媒体的方法和装置、电子设备

多模态数据序列图像嵌入模板

视频话题峰值的预测方法及装置

话题大语言模型异构文本特征提取模型

一种多模态数据学习分析方法及装置

速度因子样本学习分析方法特征融合网络解码器

多模态图像融合方法、装置、电子设备及存储介质

站点导航

APP 下载