摘要
本申请实施例公开语音处理方法、电子设备和存储介质,其中方法包括:接收客户端上传的有效音频检测后的vad时间戳信息、语音开始报文和语音音频流;在当前有效音频的音频下降沿时间戳后的第一预设停顿时长时,基于云vad触发中间识别解码得到中间识别结果,调用文本检测模型判断中间识别结果是否为完整语义句子;若不为完整语义句子,且自当前有效音频的音频下降沿时间戳后的第二预设停顿时长内出现后续语音音频流,对中间识别结果和后续语音音频流的后续文本进行拼接;若为完整语义句子,将中间识别结果携带参数并转给对话中控,基于对话中控触发产品级语义结算并完成技能路由得到技能路由领域,根据技能路由领域判断是否进行回调。
技术关键词
音频
语音
语义
文本检测模型
客户端
报文
电子设备
解码
处理器通信
参数
指令
云端
存储器
标签
系统为您推荐了相关专利信息
语义特征
电力设备
文本
注意力机制
双向长短期记忆网络
手术无影灯
无线通信模组
主控板
X射线机
语音芯片
实体关系抽取方法
知识图谱构建
依存句法分析
文本
双向长短期记忆网络
区块链设备
素材引擎
场景
计算机执行指令
穿戴设备