摘要
本发明涉及基于多任务方言识别的智能设备语音交互方法及系统,该方法包括:获取来自用户的语音数据,对语音数据进行预处理,以提取语音数据中的声学特征。通过深度学习框架对用户的地理位置信息和声学特征进行耦合,以构建地理位置与方言分布的概率关联模型,调用概率关联模型生成声学特征与空间特征的融合特征张量。调用LSTM模型基于融合特征张量捕获语音数据中的长时序依赖关系,建立参数共享机制,对概率关联模型进行微调,以输出方言识别结果。将方言识别结果转换为设备控制指令,并响应于设备控制指令调用多级决策树输出自适应交互决策。基于自适应交互决策,结合声学特征生成对应方言的语音回复数据,将语音回复数据反馈至用户终端。
技术关键词
声学特征
设备控制指令
语音交互方法
多级决策树
智能设备
LSTM模型
时序依赖关系
多任务
融合特征
实时语音
韵律特征
深度学习框架
数据
地理位置信息
语音交互系统
声编码器
包络
系统为您推荐了相关专利信息
互动场景
语音识别功能
标签类别
声学特征
生成文字
语音提醒方法
可穿戴智能设备
声纹特征
高斯混合模型
数据
识别方法
方程
空间方位信息
声学特征
声源定位算法
高地温隧道
智能控制方法
胶体结构
设备控制指令
乳化炸药