摘要
本发明实施例公开了一种音频处理方法和装置,所述方法包括遍历基于静音检测结果对音频流进行截取确定的断句列表确定当前断句和当前断句的端点检测结果,在当前断句存在语句起点时将当前断句的起始帧确定为最新待识别语句的起始帧,在当前断句存在语句终点时将当前断句的结束帧确定为最新待识别语句的结束帧,根据最新待识别语句的起始帧和结束帧确定最新待识别语句,并对最新待识别语句进行语音识别确定对应的语音识别结果,能够不断更新音频流中的断句和根据断句的端点检测结果确定待识别语句,实现持续的长语音识别,且通过对待识别语句的起始帧到结束帧的完整内容进行识别,能够提高长语音识别的准确性。
技术关键词
语句
音频特征
语音
计算机程序指令
计算机程序产品
列表
端点
可读存储介质
交互内容
序列
频谱特征
处理器
终点
场景
存储器
电子设备
语义
系统为您推荐了相关专利信息
加密数据
数据交换方法
发送端
接收端
并行计算算法
图片
图像块
输入神经网络模型
三原色
可读存储介质
RTK定位数据
融合定位方法
多传感器
训练样本数据
车辆