摘要
本发明提供了一种语音识别方法、装置、设备及可读存储介质,涉及语音识别技术领域,包括获取历史音频数据;得到处理后的语音数据;进行特征提取得到第一语音特征和第二语音特征;当相似度大于第一设定阈值时,将预设的目标音频数据输入预处理模型中进行预处理,得到目标语音数据;得到语音识别结果。本发明通过将携带噪声的历史语音数据输入模型进行预处理,并将处理后的数据与未携带噪声的历史语音数据进行特征比对,持续优化模型的参数和算法,使得训练得到的预处理模型能够更有效地识别和去除噪声干扰,为后续的语音识别模型提供更清晰、准确的输入信号,确保只有高质量的语音数据进入识别流程,显著提高语音识别模型的识别准确性。
技术关键词
语音特征
语音识别方法
局部特征信息
语音识别模型
梅尔频率倒谱系数
音频
数据
语音识别装置
灰色关联分析
时间段
参数
噪声
位置更新
数值
滤波器
聚类算法
语音识别技术
分支
系统为您推荐了相关专利信息
知识蒸馏方法
权重分配机制
深度学习网络
多任务
语音特征
深度学习模型
解码语音数据
侦听方法
协议识别模型
解码信息
智能机器人
开发方法
三元组损失函数
情感分类器
情感类别