摘要
本申请实施例提供了一种语音指令的流式识别方法、装置、计算机可读存储介质以及电子设备,涉及人工智能技术领域。该方法包括:对待处理音频进行语音活动检测,以确定待处理音频中的语音活动子段落,其中,语音活动子段落为经检测依次得到的起始状态和准结束状态之间的音频;在对当前的第i语音活动子段落进行语音识别的过程中,响应于检测得到准结束状态,获取对应于第i语音活动子段落的第i流式语音识别结果,其中,i的取值为不大于待处理音频中语音活动子段落的总量的正整数;将第i流式语音识别结果输入自然语言处理NLP模型,其中,NLP模型输出第i语音活动子段落对应的第i指令。本申请实施例能够在提升指令识别准确度的同时节省计算资源。
技术关键词
语音活动检测
音频
自然语言
识别方法
语义
指令
存储计算机程序
可读存储介质
大语言模型
人工智能技术
频谱特征
总量
电子设备
模块
识别装置
文本
信号
存储器
系统为您推荐了相关专利信息
补偿装置
单相接地故障
智能识别方法
接地故障全补偿
选线装置
调控方法
参数
加权欧氏距离
决策
工业自动化控制技术
情感识别功能
场景控制方法
情感特征
情感类别
场景类别
信息技术咨询服务
逻辑回归模型
管理方法
客户
关键词