一种具有打断处理功能的低延迟流式语音交互系统

正文

推荐专利

申请号：CN202511010209

申请日期：2025-07-22

公开号：CN120636409B

公开日期：2025-12-12

类型：发明专利

摘要

本发明提供了一种具有打断处理功能的低延迟流式语音交互系统，涉及人工智能的技术领域，本发明通过实时声学处理模块进行必要的预处理和声学特征提取，通过鲁棒性增强技术对抗交互信道引入的失真和复杂环境噪声；流式声学解码模块通过实时并行进行声学建模、语言模型应用和解码，输出超低延迟的文本转写结果流；实时声学处理模块结合信号处理技术负责高精度、超低延迟地检测用户语音活动，尤其是在AI播放语音期间的用户语音活动来判断用户的实时语音活动状态；系统各模块之间以及与通信平台之间采用高效、低延迟的双向流式网络传输方式，确保音频流、声学特征流、文本流和控制信号能够以极低的端到端延迟进行实时传输和处理。

技术关键词

语音交互系统实时语音声学特征输入神经网络模型深度学习模型子模块文本解码模块网络传输方式语音活动检测语音输入模块解码器信号处理技术输出模块音频播放器

系统为您推荐了相关专利信息

一种基于混合式检测策略的导电粒子检测方法

导电粒子图像处理算法智能检测算法策略工业视觉检测

一种从文档中自动提前重要参数生成表格的算法

生成表格训练机器学习模型参数解析算法机器学习模型训练

一种井盖智能识别方法

井盖智能嵌入式设备识别方法服务器项目

一种结直肠腺瘤识别语义分割深度学习系统及构建方法

深度学习系统半监督学习模型深度学习模型对抗性语义

基于大数据的电能质量干扰源耐受性检测与优化治理方法

优化治理方法电能密集卷积网络时域特征频域特征

一种具有打断处理功能的低延迟流式语音交互系统

站点导航

APP 下载