基于多任务方言识别的智能设备语音交互方法及系统

正文

推荐专利

申请号：CN202511065976

申请日期：2025-07-31

公开号：CN120766677A

公开日期：2025-10-10

类型：发明专利

摘要

本发明涉及基于多任务方言识别的智能设备语音交互方法及系统，该方法包括：获取来自用户的语音数据，对语音数据进行预处理，以提取语音数据中的声学特征。通过深度学习框架对用户的地理位置信息和声学特征进行耦合，以构建地理位置与方言分布的概率关联模型，调用概率关联模型生成声学特征与空间特征的融合特征张量。调用LSTM模型基于融合特征张量捕获语音数据中的长时序依赖关系，建立参数共享机制，对概率关联模型进行微调，以输出方言识别结果。将方言识别结果转换为设备控制指令，并响应于设备控制指令调用多级决策树输出自适应交互决策。基于自适应交互决策，结合声学特征生成对应方言的语音回复数据，将语音回复数据反馈至用户终端。

技术关键词

声学特征设备控制指令语音交互方法多级决策树智能设备 LSTM模型时序依赖关系多任务融合特征实时语音韵律特征深度学习框架数据地理位置信息语音交互系统声编码器包络

系统为您推荐了相关专利信息

一种具备语音识别功能的AI互动场景方法

互动场景语音识别功能标签类别声学特征生成文字

一种基于AI预测的冷热通道风量优化节能方法

对抗网络模型风量节能方法分支通道

一种语音提醒方法及装置、可穿戴智能设备

语音提醒方法可穿戴智能设备声纹特征高斯混合模型数据

一种基于空间方位的蛙类鸣声识别方法、介质及系统

识别方法方程空间方位信息声学特征声源定位算法

用于高地温隧道爆破的乳化炸药智能控制方法、系统及设备

高地温隧道智能控制方法胶体结构设备控制指令乳化炸药

基于多任务方言识别的智能设备语音交互方法及系统

站点导航

APP 下载