一种基于生成式模型的多模态融合方法及系统

正文

推荐专利

申请号：CN202411727425

申请日期：2024-11-28

公开号：CN119939493A

公开日期：2025-05-06

类型：发明专利

摘要

本发明属于计算机视觉技术领域，提出一种基于生成式模型的多模态融合方法及系统，包括：构建基于CLIP的神经网络模型；构建生成式模型；将多模态训练数据输入所述神经网络模型，通过所述图像编码器和文本编码器提取多模态训练数据的初始特征，将所述初始特征输入生成式模型得到重构特征；基于所述初始特征与重构特征构建缓存式适配器，基于所述适配器更新所述神经网络模型的先验知识，得到多模态融合后的特征表示。本发明降低了数据样本的差异对多模态融合效果的影响。

技术关键词

神经网络模型融合方法图像编码器文本编码器多模态适配器计算机视觉技术关键字特征提取模块融合系统多层感知机数据重构模块表达式处理器存储器

系统为您推荐了相关专利信息

一种基于视频监看的画面识别管理系统

识别管理系统画面图像处理单元照度视频

一种基于人工智能的光伏组件质量检测方法

生成对抗网络光伏组件表面分层注意力区域检测算法多模态特征

一种音频设备的自适应调音方法及系统

调音方法音频设备音乐音频播放设备傅里叶变换处理

一种生产工单排程方法及装置

异常事件列表数据计划资源

一种基于新视角纹理校正的三维模型生成方法

三维面片模型三维模型生成方法校正纹理噪声图像

一种基于生成式模型的多模态融合方法及系统

站点导航

APP 下载