一种联合语音进行多模态对齐的脑电视觉重构方法和系统

正文

推荐专利

申请号：CN202510623868

申请日期：2025-05-15

公开号：CN120540524A

公开日期：2025-08-26

类型：发明专利

摘要

本申请提供了一种联合语音进行多模态对其的脑电视觉重构方法和系统，通过将语音信号与脑电信号、图像信号进行联合训练与对齐，显著提升了多模态信息的利用率，并优化了脑电信号质量，与现有技术中基于脑电‑图像对训练的单一模态重构方法相比，能够显著提高图像重构的质量。

技术关键词

图像嵌入语义图像生成器重构方法采集脑电信号语音识别模型视频帧多模态生成语音语音特征编码器参数音频视觉电视脑电特征