融合声音和脑电信号的目标人物语音提取方法、装置

AITNT
正文
推荐专利
融合声音和脑电信号的目标人物语音提取方法、装置
申请号:CN202411518863
申请日期:2024-10-29
公开号:CN119049495B
公开日期:2025-01-28
类型:发明专利
摘要
本发明属于语音处理技术领域,具体涉及一种融合声音和脑电信号的目标人物语音提取方法、系统和设备。该方法设计了一个包含脑电编码器、语音编码器、分离网络和语音解码器的语音分离模型,并利用训练好的语音分离模型执行目标人物的语音提取任务。其中,脑电编码器中包括一维卷积层和基于KAN的注意力层。语音编码器中包括一维卷积层和双向Mamba层。分离网络采用交叉注意力模块对提取出的语音特征和脑电特征进行特征融合,并对得到的融合特征进行解析得到目标人物语音的特征掩码。语音解码器利用特征掩码和语音特征重建出目标人物的纯净语音。本发明解决现有方案难以有效捕捉深层脑电特征和全局语音特征,重建出的目标人物语音的精度较差的问题。
技术关键词
语音提取方法 语音特征 电信号 语音解码器 语音编码器 注意力 融合特征 脑电特征 音频 状态空间模型 网络 信号接收模块 采样率 信号失真 样本 卷积模块
系统为您推荐了相关专利信息
1
多功能照明警示背心及照明灯的控制方法
多功能照明 警示背心 语音识别控制器 照明灯 存放袋
2
一种DIT心理调节系统
静息态脑电信号 心理调节方法 标签 调节系统 语言分析
3
一种基于微流控芯片的细胞样本检测系统
微流控芯片 锁相放大器 阻抗分析仪 辅助成像装置 电极
4
基于量子共振峰扰动反语音深度伪造的方法、装置及设备
重构语音信号 噪声 非易失性计算机可读存储介质 计算机程序指令 频率
5
一种基于ECRAM阵列的脑电信号解码装置及实时学习方法
解码模型 学习方法 电信号 周期 精度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号