摘要
本发明属于语音处理技术领域,具体涉及一种融合声音和脑电信号的目标人物语音提取方法、系统和设备。该方法设计了一个包含脑电编码器、语音编码器、分离网络和语音解码器的语音分离模型,并利用训练好的语音分离模型执行目标人物的语音提取任务。其中,脑电编码器中包括一维卷积层和基于KAN的注意力层。语音编码器中包括一维卷积层和双向Mamba层。分离网络采用交叉注意力模块对提取出的语音特征和脑电特征进行特征融合,并对得到的融合特征进行解析得到目标人物语音的特征掩码。语音解码器利用特征掩码和语音特征重建出目标人物的纯净语音。本发明解决现有方案难以有效捕捉深层脑电特征和全局语音特征,重建出的目标人物语音的精度较差的问题。
技术关键词
语音提取方法
语音特征
电信号
语音解码器
语音编码器
注意力
融合特征
脑电特征
音频
状态空间模型
网络
信号接收模块
采样率
信号失真
样本
卷积模块
系统为您推荐了相关专利信息
多功能照明
警示背心
语音识别控制器
照明灯
存放袋
静息态脑电信号
心理调节方法
标签
调节系统
语言分析
微流控芯片
锁相放大器
阻抗分析仪
辅助成像装置
电极
重构语音信号
噪声
非易失性计算机可读存储介质
计算机程序指令
频率