摘要
本申请提出一种语音处理方法及其装置,包括:接收用户语音指令,根据所述用户语音指令调用对应的声学前端处理引擎对所述用户语音指令进行预处理,输出预处理后的音频数据;根据所述预处理后的音频数据调用对应的唤醒引擎对所述预处理后的音频数据进行处理,输出唤醒信号;响应所述唤醒信号,根据所述预处理后的音频数据调用对应的语音识别引擎对所述预处理后的音频数据进行处理,输出语音文本;根据所述语音文本调用对应的语义理解引擎对所述语音文本进行处理,输出语义理解信息;其中,所述语义理解信息用于驱动上层业务根据所述语义理解信息执行所述用户语音指令。通过本申请,能够提升语音系统的整体性能和用户体验。
技术关键词
语音识别引擎
语义
音频
文本
计算机程序指令
语音播放器
数据
场景
计算机程序产品
语音系统
计算机设备
信号
离线
决策
在线
模块
系统为您推荐了相关专利信息
多模态融合深度学习
语义标签
融合深度学习模型
语义关键词
情感特征
人机协作系统
预测建模
数据收集模块
信息数据处理终端
数据处理模块