摘要
本申请提供了一种语音识别方法、装置、电子设备及介质,所述方法包括:响应于用户的语音识别请求,获取待识别音频,对待识别音频进行采样得到初始音频数据,确定初始音频数据的频谱特征数据,根据频谱特征数据对初始音频数据进行处理,得到人声音频数据,拆分人声音频数据得到目标音频数据,将目标音频数据输入预先训练的语音识别模型进行并行识别,得到语音识别模型输出的初始文本序列,根据人声音频数据确定初始文本序列中的单词对应的起止时间,按照起止时间对初始文本序列中的单词进行排序,得到目标文本序列,将目标文本序列作为语音识别结果,并将语音识别结果展示给用户。本申请能够在保证识别速度的同时提高识别准确率,提升用户体验。
技术关键词
语音识别模型
音频
频谱特征
语音识别方法
序列
训练文本数据
注意力
矩阵
上存储计算机程序
滤波器
频率响应
功率
语音识别装置
电子设备
密度
采样率
线性
系统为您推荐了相关专利信息
序列
超短期风电功率
短期风电功率预测
集合经验模态分解
样本
神经网络模型
特征值
融合方法
轮廓区域
稳定特征点
频繁项集挖掘算法
多模型
迭代方法
时间序列模型
生成对抗网络
预测能耗数据
能耗预测模型
能耗特征
因子
电子装置
稀土金属电解炉
状态识别方法
局部时空特征
时序依赖关系
视频帧