摘要
本申请实施例提供一种语音交互方法、装置、设备及存储介质。在本申请实施例中,可获取发起语音交互指令时目标应用的当前页面信息,利用语音识别模型识别语音交互指令对应的语音交互文本,将当前页面信息和语音交互文本输入至指令生成模型,生成语音交互文本对应的目标应用指令,以供目标应用将目标应用指令解析为目标执行逻辑,执行目标执行逻辑,实现与目标用户的语音交互。据此,可利用指令生成模型基于语音交互文本和目标应用的当前页面信息,生成能够被目标应用识别的目标应用指令,这使得,目标应用可准确的确定出语音交互指令所指向的目标执行逻辑,从而可提高对语音交互指令的响应准确度,提高用户与应用程序之间的语音交互体验。
技术关键词
语音识别模型
指令
语音交互方法
文本
页面
逻辑
音频特征
语音识别模块
通信组件
意图识别
语音交互装置
计算机
生成语音
处理器
信号
存储器
系统为您推荐了相关专利信息
乳腺超声图像
图像生成方法
图像生成模型
变量
肿瘤
智能车灯系统
语音识别模块
车灯驱动电路
光敏传感器
电源管理系统
SPGD算法
激光相干
验证平台
数据转换模块
正向电压
融合特征
视频片段检索方法
分支
音频特征
多层感知机