一种多国别英语发音数据扩充及识别补偿模型构建方法

正文

推荐专利

申请号：CN202411473944

申请日期：2024-10-22

公开号：CN119360882A

公开日期：2025-01-24

类型：发明专利

摘要

本发明涉及一种多国别英语发音数据扩充及识别补偿模型构建方法。该方法首先收集多国别英语发音样本，并进行去噪、分割和格式转换等预处理操作。提取梅尔频率倒谱系数(MFCC)声学特征，并利用RNN和LSTM网络捕获时序特征。通过对抗网络生成不同国别的语音数据，并与真实数据合并构建多国别语音数据库。本方案还包括国别识别模块和语音识别模型的构建，通过LSTM或Transformer架构训练模型，并将国别识别结果作为输入以提高识别效果。本发明能够有效扩充多国别英语发音数据，降低数据收集成本，提升语音识别系统在多样化口音环境下的鲁棒性和准确性。通过技术手段，本方案为全球化背景下的语音识别应用提供了有效的数据支持和模型优化策略。

技术关键词

数据扩充方法梅尔频率倒谱系数英语时序特征模型构建方法发音声学特征构建语音识别模型离散余弦变换识别模块频谱特征语音活动检测随机噪声语音识别系统生成器网络滤波器

系统为您推荐了相关专利信息

异常节点的监测方法、装置、设备及存储介质

网络监测方法源节点数据分段

一种基于迁移学习的旋转机械故障诊断方法

深度残差网络工业噪声时序特征时序依赖关系故障分类器

疲劳检测模型构建方法和驾驶员疲劳检测方法、装置、设备、车辆、存储介质

趋势波动分析检测模型构建方法统计特征电信号矩阵

一种适应PSTN通话的增量式ASR算法

更新解码器 LSTM模型滤波器置信度阈值算法

基于睡眠剥夺联合跑台实验的小鼠脑体失能模型构建方法

模型构建方法心率模型小鼠谷胱甘肽过氧化物酶微型传感器

一种多国别英语发音数据扩充及识别补偿模型构建方法

站点导航

APP 下载