摘要
本申请涉及一种离线语音数据的处理方法及装置、设备和存储介质,其中,该方法包括:利用麦克风阵列进行语音数据的多样化采集;对采集到的语音数据进行自适应滤波降噪,并对降噪处理后的语音数据进行端点检测以确定出语音数据中的语音起点和语音终点,以及对进行端点检测后的语音数据中的连续数据进行分帧加窗,最后从分帧加窗后的数据中进行梅尔频率倒谱系数和高阶特征提取并融合,得到预处理后的语音数据;基于预处理后的语音数据对语音识别模型进行训练;对训练后的语音识别模型通过模型剪枝和低秩分解,以及参数进行共享,最后对进行参数共享后的语音识别模型进行重训练;基于重训练后的语音识别模型对实时输入的离线语音数据进行处理。
技术关键词
语音识别模型
长短期记忆网络
梅尔频率倒谱系数
数据
麦克风阵列
模型剪枝
指向麦克风
离线
端点
计算机可执行指令
重构
滤波器
注意力
输出特征
终点
通信接口
参数
冗余
系统为您推荐了相关专利信息
参数调优方法
多维度可调
接收端
随机森林模型
均衡器
传递方法
终端设备
生物
人脸识别效率
指纹识别设备
视频生成模型
视频帧
视频生成方法
数据处理模块
计算机可执行指令
季节性冻土区路基
深度学习模型
风险评估方法
数据融合方法
融合卷积神经网络