融合声音和脑电信号的目标人物语音提取方法、装置

正文

推荐专利

申请号：CN202411518863

申请日期：2024-10-29

公开号：CN119049495B

公开日期：2025-01-28

类型：发明专利

摘要

本发明属于语音处理技术领域，具体涉及一种融合声音和脑电信号的目标人物语音提取方法、系统和设备。该方法设计了一个包含脑电编码器、语音编码器、分离网络和语音解码器的语音分离模型，并利用训练好的语音分离模型执行目标人物的语音提取任务。其中，脑电编码器中包括一维卷积层和基于KAN的注意力层。语音编码器中包括一维卷积层和双向Mamba层。分离网络采用交叉注意力模块对提取出的语音特征和脑电特征进行特征融合，并对得到的融合特征进行解析得到目标人物语音的特征掩码。语音解码器利用特征掩码和语音特征重建出目标人物的纯净语音。本发明解决现有方案难以有效捕捉深层脑电特征和全局语音特征，重建出的目标人物语音的精度较差的问题。

技术关键词

语音提取方法语音特征电信号语音解码器语音编码器注意力融合特征脑电特征音频状态空间模型网络信号接收模块采样率信号失真样本卷积模块

系统为您推荐了相关专利信息

多功能照明警示背心及照明灯的控制方法

多功能照明警示背心语音识别控制器照明灯存放袋

一种DIT心理调节系统

静息态脑电信号心理调节方法标签调节系统语言分析

一种基于微流控芯片的细胞样本检测系统

微流控芯片锁相放大器阻抗分析仪辅助成像装置电极

基于量子共振峰扰动反语音深度伪造的方法、装置及设备

重构语音信号噪声非易失性计算机可读存储介质计算机程序指令频率

一种基于ECRAM阵列的脑电信号解码装置及实时学习方法

解码模型学习方法电信号周期精度

融合声音和脑电信号的目标人物语音提取方法、装置

站点导航

APP 下载