语音识别方法、语音识别装置和语音识别系统

正文

推荐专利

申请号：CN202510266935

申请日期：2025-03-07

公开号：CN120089141A

公开日期：2025-06-03

类型：发明专利

摘要

本申请公开了一种语音识别方法、语音识别装置和语音识别系统。本申请实施方式的语音识别方法包括：获取音频流数据；在获取音频流数据的过程中，获取音频流数据对应的多模态端点信号；基于多模态端点信号和语音活动检测模型对音频流数据进行分割，得到至少一个音频段；基于离线语音识别模型对至少一个音频段进行流式语音识别，得到识别文本；流式输出识别文本。如此，降低了输出识别文本的延迟，减少了硬件资源占用，可以适用于实时交互场景以及识别精度需求较高的场景。

技术关键词

离线语音识别模型语音识别方法语音活动检测音频文本多模态语音识别系统端点语音识别装置信号数据处理模块动态视频流标记输出模块字符识别模块终点

系统为您推荐了相关专利信息

一种颜色可控的文本引导灰色图着色方法及系统

语义特征变量颜色着色方法计算机程序指令

音频控制方法、系统、装置和存储介质

音频控制方法蓝牙模组头盔驾驶环境信息移动通讯设备

应用于输入法中的基于“三级上屏”的句子生成和显示方法

生成显示界面输入法拼音显示候选词客户端

一种用户问题文本的主题提取方法及系统

节点多层注意力机制权重分配机制主题提取方法文本

一种基于ezdxf库的水利工程CAD图纸审查方法及系统

比例尺图纸水工结构图框实体

语音识别方法、语音识别装置和语音识别系统

站点导航

APP 下载