一种语音识别方法、系统、设备及介质

正文

推荐专利

一种语音识别方法、系统、设备及介质

申请号：CN202411723881

申请日期：2024-11-28

公开号：CN119600998A

公开日期：2025-03-11

类型：发明专利

摘要

本发明公开一种语音识别方法、系统、设备及介质，涉及语言信号处理技术领域，该方法包括：采集待识别的语音信号数据，提取语音信号数据的梅尔频率倒谱系数特征；基于Transformer模型构建语音识别模型；将语音信号数据的梅尔频率倒谱系数特征输入语音识别模型中，生成语音信号数据的文本单词与目标端文本之间的对应关系；根据该对应关系生成待识别语音信号对应的文本内容；该方法有效克服了现有离线语音识别方法在多地域战场环境下存在的识别准确率不足的问题。

技术关键词

编码特征生成语音信号识别语音信号注意力机制多层感知机层文本 NMF算法语言信号处理技术离线语音识别方法频率构建语音识别模型人声解码滤波器数据矩阵

一种语音识别方法、系统、设备及介质

站点导航

APP 下载