一种联合语音进行多模态对齐的脑电视觉重构方法和系统

AITNT
正文
推荐专利
一种联合语音进行多模态对齐的脑电视觉重构方法和系统
申请号:CN202510623868
申请日期:2025-05-15
公开号:CN120540524A
公开日期:2025-08-26
类型:发明专利
摘要
本申请提供了一种联合语音进行多模态对其的脑电视觉重构方法和系统,通过将语音信号与脑电信号、图像信号进行联合训练与对齐,显著提升了多模态信息的利用率,并优化了脑电信号质量,与现有技术中基于脑电‑图像对训练的单一模态重构方法相比,能够显著提高图像重构的质量。
技术关键词
图像嵌入 语义 图像生成器 重构方法 采集脑电信号 语音识别模型 视频帧 多模态 生成语音 语音特征 编码器参数 音频 视觉 电视 脑电特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号