一种音频处理方法和装置

AITNT
正文
推荐专利
一种音频处理方法和装置
申请号:CN202511254826
申请日期:2025-09-04
公开号:CN120748375A
公开日期:2025-10-03
类型:发明专利
摘要
本发明实施例公开了一种音频处理方法和装置,所述方法包括遍历基于静音检测结果对音频流进行截取确定的断句列表确定当前断句和当前断句的端点检测结果,在当前断句存在语句起点时将当前断句的起始帧确定为最新待识别语句的起始帧,在当前断句存在语句终点时将当前断句的结束帧确定为最新待识别语句的结束帧,根据最新待识别语句的起始帧和结束帧确定最新待识别语句,并对最新待识别语句进行语音识别确定对应的语音识别结果,能够不断更新音频流中的断句和根据断句的端点检测结果确定待识别语句,实现持续的长语音识别,且通过对待识别语句的起始帧到结束帧的完整内容进行识别,能够提高长语音识别的准确性。
技术关键词
语句 音频特征 语音 计算机程序指令 计算机程序产品 列表 端点 可读存储介质 交互内容 序列 频谱特征 处理器 终点 场景 存储器 电子设备 语义
系统为您推荐了相关专利信息
1
煤炭数质量异常原因的推理方法、装置、电子设备及介质
异常数据 推理方法 实体 图谱 煤炭
2
一种数据交换方法、系统、设备及存储介质
加密数据 数据交换方法 发送端 接收端 并行计算算法
3
路由传输方法、电子设备及可读存储介质
传输方法 输出口 节点 通道 坐标
4
自动聚焦的方法及装置
图片 图像块 输入神经网络模型 三原色 可读存储介质
5
多传感器的观测状态预测模型的训练方法及装置、自动驾驶车辆的融合定位方法及装置、电子设备及计算机程序产品
RTK定位数据 融合定位方法 多传感器 训练样本数据 车辆
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号