摘要
本申请提供一种断句阈值动态调整方法、装置、设备、介质及产品,涉及人工智能技术领域。所述方法包括:获取当前音频信号对应的多帧滤波器组特征;将各所述滤波器组特征输入预设语音活动检测模型,生成对应的音频识别结果;若音频识别结果为存在滤波器组特征为语音特征,则确定用户处于说话状态,并确定所述当前音频信号对应的当前语句时长、语速信息以及连续非语音帧时长;若连续非语音帧时长小于原始断句阈值,则采用训练至收敛的断句阈值生成模型基于所述当前语句时长和所述语速信息调整所述原始断句阈值。本申请的方法,可以根据当前语句时长和语速信息调整原始断句阈值,使断句阈值更符合用户体验的需求,提升用户在语音交互中的体验。
技术关键词
滤波器
语音特征
非语音
语音活动检测
音频
语句
计算机执行指令
深度神经网络模块
信号
深度神经网络模型
动态
可读存储介质
人工智能技术
计算机程序产品
处理器
存储器
输入模块
数值
电子设备
系统为您推荐了相关专利信息
汽车卡钳
纹理特征
编码器
特征选择
图像数据压缩
编队控制方法
模糊状态观测器
误差向量
事件触发机制
编队控制器
资源特征
资源推荐模型
样本
偏好特征
特征提取模块