摘要
本发明提出了一种用户端计算边结合的实时语音命令词识别方法,包括:步骤1,在用户端进行语音采集;步骤2,对采集到的语音信号进行数据预处理,并将预处理后的语音信号分块上传至计算中心;步骤3,计算中心合并还原分块的语音信号,并进行语音识别,将语音识别结果回传至用户端;步骤4,用户端对语音识别结果进行命令词提取,获得提取结果并输出,完成所述用户端计算边结合的实时语音命令词识别。本发明显著增强了语音识别的鲁棒性和准确性,保证了在各种智能设备上的高效运行,不仅提升了语音信号在嘈杂环境中的清晰度和可理解性,还通过合理的系统部署策略实现了计算资源的有效利用和快速响应,极大地改善了用户体验。
技术关键词
命令词识别方法
实时语音
编码器
卷积神经网络提取
计算中心
构建语音识别模型
注意力机制
解码器
文本
噪声频谱
降噪方法
时域音频信号
分词
分块