一种基于特征解耦的自适应口音语音识别方法

正文

推荐专利

申请号：CN202510029575

申请日期：2025-01-08

公开号：CN119964559A

公开日期：2025-05-09

类型：发明专利

摘要

本申请涉及语音识别的技术领域，尤其是涉及一种基于特征解耦的自适应口音语音识别方法，包括：调取已经通过多任务元学习型自适应训练得到的语音识别模型作为起点，将微调后的语音识别模型部署于实际应用环境；将预处理后的语音信号输入到语音识别模型中，生成对应的语音识别结果；在生成对应的语音识别结果的过程中，捕捉语音信号中的上下文信息，生成对于待识别声学特征的识别文本输出和识别口音标签，基于所述上下文信息使用解码算法生成最终的文本转录结果，将所述文本转录结果结合识别文本输出和识别口音标签生成对应的语音识别结果。本申请能够提高应对多样性和复杂性口音的语音识别性能。

技术关键词

语音识别模型语音识别方法声学特征多任务解码器文本执行语音识别编码器解码算法参数处理器分支元学习算法多头注意力机制神经网络架构语音识别装置标签信号

系统为您推荐了相关专利信息

一种障碍物运动轨迹预测方法及装置

运动轨迹预测方法地图特征车辆传感器组件意图坐标系

一种透明物体图像抠图及前景预测方法

图像拉普拉斯金字塔物体解码器训练集

渲染方法、装置、设备以及存储介质

深度神经网络训练视点渲染交叉注意力机制渲染方法两阶段

基于窗口和轴向注意力融合的医学图像分割方法和设备

医学图像分割模型注意力医学图像分割方法输出特征解码模块

一种音频信号处理方法、装置、计算机设备及存储介质

声码器系统音频信号处理方法音频信号处理装置编码器参数计算机可读指令

一种基于特征解耦的自适应口音语音识别方法

站点导航

APP 下载