摘要
本发明公开了基于多模态扩散模型的视觉诱发脑信号解码方法及系统,该方法能够从fMRI信号中重建高分辨率图像,并生成描述性文本。该方法通过轻量级回归模型将fMRI信号映射到图像‑文本细节潜在特征空间,以及CLIP模型的图像‑文本高级语义特征空间,利用多模态扩散模型在联合条件引导下生成图像与文本。本发明融合图像与文本特征的多条件语义信息,首次实现使用多模态潜在扩散模型从脑信号中同时生成高保真图像和文本描述,功能脑区分析揭示其在特定语义内容解码方面的优越能力。本发明为脑机接口、神经科学研究及医疗辅助诊断提供解决方案。
技术关键词
信号解码方法
视觉诱发脑
语义特征
多模态
重建高分辨率图像
文本编码器
图像编码器
预训练模型
图像解码器
文本生成模型
噪声因子
图像重建
编码模块
系统为您推荐了相关专利信息
健康状态分类方法
多模态注意力
多模态特征融合
特征提取模块
融合特征
图像增强模型
原始图像数据
文本
生成方法
卷积神经网络模块