摘要
本发明涉及语音交互技术领域,公开一种面向复杂场景的精准语音交互系统,包括:声学特征提取模块,从语音信号中提取声学特征向量并生成抑制方言差异的声学特征表示;自适应语义理解模块,基于声学特征表示生成初始语义向量并进行语义增强,结合动态调整后的语义加权融合权重对历史对话语义向量进行加权融合,生成用户意图表征;语义解码模块,对用户意图表征进行解码生成精准意图指令;上下文管理模块,根据用户意图表征生成对话状态向量,通过计算对话状态向量与历史对话语义向量的关联度,生成对话上下文表征,以动态调整语义加权融合权重。本发明能够提升语音准确识别率,保障上下文连贯性,从而更好地适应复杂多变的现实场景要求。
技术关键词
语义向量
语音交互系统
声学特征
意图指令
深度神经网络
上下文管理
模板
表达式
语音交互方法
特征提取模块
场景
分类器
生成用户
解码模块
动态更新