离线语音数据的处理方法及装置、设备和存储介质

AITNT
正文
推荐专利
离线语音数据的处理方法及装置、设备和存储介质
申请号:CN202511024911
申请日期:2025-07-24
公开号:CN120977293A
公开日期:2025-11-18
类型:发明专利
摘要
本申请涉及一种离线语音数据的处理方法及装置、设备和存储介质,其中,该方法包括:利用麦克风阵列进行语音数据的多样化采集;对采集到的语音数据进行自适应滤波降噪,并对降噪处理后的语音数据进行端点检测以确定出语音数据中的语音起点和语音终点,以及对进行端点检测后的语音数据中的连续数据进行分帧加窗,最后从分帧加窗后的数据中进行梅尔频率倒谱系数和高阶特征提取并融合,得到预处理后的语音数据;基于预处理后的语音数据对语音识别模型进行训练;对训练后的语音识别模型通过模型剪枝和低秩分解,以及参数进行共享,最后对进行参数共享后的语音识别模型进行重训练;基于重训练后的语音识别模型对实时输入的离线语音数据进行处理。
技术关键词
语音识别模型 长短期记忆网络 梅尔频率倒谱系数 数据 麦克风阵列 模型剪枝 指向麦克风 离线 端点 计算机可执行指令 重构 滤波器 注意力 输出特征 终点 通信接口 参数 冗余
系统为您推荐了相关专利信息
1
一种基于贝叶斯优化SerDes接收端的参数调优方法及装置
参数调优方法 多维度可调 接收端 随机森林模型 均衡器
2
一种高安全特征值传递方法
传递方法 终端设备 生物 人脸识别效率 指纹识别设备
3
视频生成方法、视频生成模型的训练方法、装置、设备、存储介质及程序产品
视频生成模型 视频帧 视频生成方法 数据处理模块 计算机可执行指令
4
一种用于季节性冻土区路基工程冻胀破坏风险评估方法、装置及设备
季节性冻土区路基 深度学习模型 风险评估方法 数据融合方法 融合卷积神经网络
5
一种泊车路径规划方法、装置、车辆以及存储介质
泊车路径规划方法 节点 列表 泊车环境 车辆
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号