离线语音数据的处理方法及装置、设备和存储介质

正文

推荐专利

申请号：CN202511024911

申请日期：2025-07-24

公开号：CN120977293A

公开日期：2025-11-18

类型：发明专利

摘要

本申请涉及一种离线语音数据的处理方法及装置、设备和存储介质，其中，该方法包括：利用麦克风阵列进行语音数据的多样化采集；对采集到的语音数据进行自适应滤波降噪，并对降噪处理后的语音数据进行端点检测以确定出语音数据中的语音起点和语音终点，以及对进行端点检测后的语音数据中的连续数据进行分帧加窗，最后从分帧加窗后的数据中进行梅尔频率倒谱系数和高阶特征提取并融合，得到预处理后的语音数据；基于预处理后的语音数据对语音识别模型进行训练；对训练后的语音识别模型通过模型剪枝和低秩分解，以及参数进行共享，最后对进行参数共享后的语音识别模型进行重训练；基于重训练后的语音识别模型对实时输入的离线语音数据进行处理。

技术关键词

语音识别模型长短期记忆网络梅尔频率倒谱系数数据麦克风阵列模型剪枝指向麦克风离线端点计算机可执行指令重构滤波器注意力输出特征终点通信接口参数冗余

系统为您推荐了相关专利信息

一种基于贝叶斯优化SerDes接收端的参数调优方法及装置

参数调优方法多维度可调接收端随机森林模型均衡器

一种高安全特征值传递方法

传递方法终端设备生物人脸识别效率指纹识别设备

视频生成方法、视频生成模型的训练方法、装置、设备、存储介质及程序产品

视频生成模型视频帧视频生成方法数据处理模块计算机可执行指令

一种用于季节性冻土区路基工程冻胀破坏风险评估方法、装置及设备

季节性冻土区路基深度学习模型风险评估方法数据融合方法融合卷积神经网络

一种泊车路径规划方法、装置、车辆以及存储介质

泊车路径规划方法节点列表泊车环境车辆

离线语音数据的处理方法及装置、设备和存储介质

站点导航

APP 下载