断句阈值动态调整方法、装置、设备、介质及产品

正文

推荐专利

申请号：CN202410763328

申请日期：2024-06-13

公开号：CN118538250A

公开日期：2024-08-23

类型：发明专利

摘要

本申请提供一种断句阈值动态调整方法、装置、设备、介质及产品，涉及人工智能技术领域。所述方法包括：获取当前音频信号对应的多帧滤波器组特征；将各所述滤波器组特征输入预设语音活动检测模型，生成对应的音频识别结果；若音频识别结果为存在滤波器组特征为语音特征，则确定用户处于说话状态，并确定所述当前音频信号对应的当前语句时长、语速信息以及连续非语音帧时长；若连续非语音帧时长小于原始断句阈值，则采用训练至收敛的断句阈值生成模型基于所述当前语句时长和所述语速信息调整所述原始断句阈值。本申请的方法，可以根据当前语句时长和语速信息调整原始断句阈值，使断句阈值更符合用户体验的需求，提升用户在语音交互中的体验。

技术关键词

滤波器语音特征非语音语音活动检测音频语句计算机执行指令深度神经网络模块信号深度神经网络模型动态可读存储介质人工智能技术计算机程序产品处理器存储器输入模块数值电子设备

系统为您推荐了相关专利信息

一种基于图像数据分析的热压机工件边缘检测校正方法

热压机边缘检测工件图像像素点

一种汽车卡钳生产流水线的切削加工质量评估方法及系统

汽车卡钳纹理特征编码器特征选择图像数据压缩

直播语音生成方法及其系统

语音特征语音生成方法风格文本数据

多无人系统固定时间模糊自适应事件触发编队控制方法

编队控制方法模糊状态观测器误差向量事件触发机制编队控制器

资源推荐方法、训练方法、装置、设备以及介质

资源特征资源推荐模型样本偏好特征特征提取模块

断句阈值动态调整方法、装置、设备、介质及产品

站点导航

APP 下载