摘要
本发明涉及语音分离技术领域,具体涉及结合声学特征和状态空间模型的语音分离方法及系统。本发明为了实现语音分离提供了一种语音分离模型,其首先通过音频编码部对混合语音Voicemix进行编码以得到N种不同分辨率的音频特征{F1~FN},接着通过声学特征提取部基于{F1~FN}提取出多尺度语音特征G'm,然后通过状态空间网络部对G'm进行长期建模以得到长时特征IT,out,最后通过音频解码部结合{F1~FN}与IT,out解码重构出{Voice1,…,VoiceN}。本发明解决了现有语音分离方法面对长序列音频会出现建模局限而影响语音分离性能的问题。
技术关键词
状态空间模型
声学特征
音频解码
音频编码
线性
语音特征
音频特征
多层感知机层
注意力
分辨率
计算机程序产品
重构
序列
训练集
标签
样本
系统为您推荐了相关专利信息
混合线性模型
小区收割机
数据分析模型
矫正
玉米育种技术
调参方法
导弹
非线性动力学模型
控制器
数值仿真模型
膈肌肌电信号
表面肌电信号
肌电信号识别
肌电特征
独立成分分析
建筑空调系统
能耗拆分方法
区域空调系统
二元线性回归模型
气象
水面舰艇
状态空间模型
强化学习算法
网络架构
协同控制技术