基于多模态扩散模型的视觉诱发脑信号解码方法及系统

正文

推荐专利

申请号：CN202510419993

申请日期：2025-04-03

公开号：CN120526105A

公开日期：2025-08-22

类型：发明专利

摘要

本发明公开了基于多模态扩散模型的视觉诱发脑信号解码方法及系统，该方法能够从fMRI信号中重建高分辨率图像，并生成描述性文本。该方法通过轻量级回归模型将fMRI信号映射到图像‑文本细节潜在特征空间，以及CLIP模型的图像‑文本高级语义特征空间，利用多模态扩散模型在联合条件引导下生成图像与文本。本发明融合图像与文本特征的多条件语义信息，首次实现使用多模态潜在扩散模型从脑信号中同时生成高保真图像和文本描述，功能脑区分析揭示其在特定语义内容解码方面的优越能力。本发明为脑机接口、神经科学研究及医疗辅助诊断提供解决方案。

技术关键词

信号解码方法视觉诱发脑语义特征多模态重建高分辨率图像文本编码器图像编码器预训练模型图像解码器文本生成模型噪声因子图像重建编码模块

系统为您推荐了相关专利信息

一种多模态内容的合规审核方法及系统

图像视觉特征向量多模态语义审核方法合规性

基于多模态感知数据的情绪识别方法及系统

情绪识别方法多模态情感特征数据解析单元

基于多模态数据的健康状态分类模型、训练及分类方法

健康状态分类方法多模态注意力多模态特征融合特征提取模块融合特征

母胎人群队列数据集生成方法、装置、终端及存储介质

图像增强模型原始图像数据文本生成方法卷积神经网络模块

多模态联邦学习的处理方法、装置、设备、介质及产品

样本数据计算机执行指令序列节点

基于多模态扩散模型的视觉诱发脑信号解码方法及系统

站点导航

APP 下载