一种适应PSTN通话的增量式ASR算法

正文

推荐专利

一种适应PSTN通话的增量式ASR算法

申请号：CN202511149673

申请日期：2025-08-18

公开号：CN120932636A

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了一种适应PSTN通话的增量式ASR算法，包括S1）：数据预处理；S2）：特征提取与归一化，得到当前帧的输入；S3）：将当前帧的输入与缓存中的历史帧拼接，并输入LSTM模型；S4）：更新所有LSTM层的隐藏状态和细胞状态，更新解码器的候选路径集合；S5）：部分结果输出判断，若当前识别路径中某单词的概率超过设定阈值且后续帧未发生改变，则输出至输出缓冲区；否则，跳转执行S7；S6）：输出缓冲区整理输出内容，并输出最终文本，步骤结束；S7）：判断是否存在新帧，若存在新帧则跳至S1，否则步骤结束。本申请适应PSTN通话的增量式ASR算法，采用增量式处理方式，在用户讲话的同时实时进行语音识别，显著减少延迟并提升了响应速度。

技术关键词

更新解码器 LSTM模型滤波器置信度阈值算法梅尔频率倒谱系数音频特征短时傅里叶变换离散余弦变换文本信号数据通道冗余索引语音标记

系统为您推荐了相关专利信息

一种LED显示屏动态拼接控制方法及系统

拼接控制方法像素屏幕深度学习模型比率

一种基于ODMA的上行无源多址接入方法及系统

多址接入方法导频污染消除多用户检测算法索引广义正交匹配追踪算法

一种基于代理模型解决隔板塔设计问题的方法

径向基函数代理模型隔板拉丁超立方采样决策变量

基于多模态耦合预测的飞灰煤富氧熔融智能控制方法

智能控制方法烟气氧浓度多模态液压推杆系统炉膛

一种大气生态环境数据同步监测方法及系统

插值模型地面监测站数据同步监测方法启用无人机

一种适应PSTN通话的增量式ASR算法

站点导航

APP 下载