摘要
本申请涉及语音识别的技术领域,尤其是涉及一种基于特征解耦的自适应口音语音识别方法,包括:调取已经通过多任务元学习型自适应训练得到的语音识别模型作为起点,将微调后的语音识别模型部署于实际应用环境;将预处理后的语音信号输入到语音识别模型中,生成对应的语音识别结果;在生成对应的语音识别结果的过程中,捕捉语音信号中的上下文信息,生成对于待识别声学特征的识别文本输出和识别口音标签,基于所述上下文信息使用解码算法生成最终的文本转录结果,将所述文本转录结果结合识别文本输出和识别口音标签生成对应的语音识别结果。本申请能够提高应对多样性和复杂性口音的语音识别性能。
技术关键词
语音识别模型
语音识别方法
声学特征
多任务
解码器
文本
执行语音识别
编码器
解码算法
参数
处理器
分支
元学习算法
多头注意力机制
神经网络架构
语音识别装置
标签
信号
系统为您推荐了相关专利信息
运动轨迹预测方法
地图特征
车辆传感器组件
意图
坐标系
深度神经网络训练
视点渲染
交叉注意力机制
渲染方法
两阶段
医学图像分割模型
注意力
医学图像分割方法
输出特征
解码模块
声码器系统
音频信号处理方法
音频信号处理装置
编码器参数
计算机可读指令