一种基于特征解耦的自适应口音语音识别方法

AITNT
正文
推荐专利
一种基于特征解耦的自适应口音语音识别方法
申请号:CN202510029575
申请日期:2025-01-08
公开号:CN119964559A
公开日期:2025-05-09
类型:发明专利
摘要
本申请涉及语音识别的技术领域,尤其是涉及一种基于特征解耦的自适应口音语音识别方法,包括:调取已经通过多任务元学习型自适应训练得到的语音识别模型作为起点,将微调后的语音识别模型部署于实际应用环境;将预处理后的语音信号输入到语音识别模型中,生成对应的语音识别结果;在生成对应的语音识别结果的过程中,捕捉语音信号中的上下文信息,生成对于待识别声学特征的识别文本输出和识别口音标签,基于所述上下文信息使用解码算法生成最终的文本转录结果,将所述文本转录结果结合识别文本输出和识别口音标签生成对应的语音识别结果。本申请能够提高应对多样性和复杂性口音的语音识别性能。
技术关键词
语音识别模型 语音识别方法 声学特征 多任务 解码器 文本 执行语音识别 编码器 解码算法 参数 处理器 分支 元学习算法 多头注意力机制 神经网络架构 语音识别装置 标签 信号
系统为您推荐了相关专利信息
1
一种障碍物运动轨迹预测方法及装置
运动轨迹预测方法 地图特征 车辆传感器组件 意图 坐标系
2
一种透明物体图像抠图及前景预测方法
图像 拉普拉斯金字塔 物体 解码器 训练集
3
渲染方法、装置、设备以及存储介质
深度神经网络训练 视点渲染 交叉注意力机制 渲染方法 两阶段
4
基于窗口和轴向注意力融合的医学图像分割方法和设备
医学图像分割模型 注意力 医学图像分割方法 输出特征 解码模块
5
一种音频信号处理方法、装置、计算机设备及存储介质
声码器系统 音频信号处理方法 音频信号处理装置 编码器参数 计算机可读指令
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号