一种多国别英语发音数据扩充及识别补偿模型构建方法

AITNT
正文
推荐专利
一种多国别英语发音数据扩充及识别补偿模型构建方法
申请号:CN202411473944
申请日期:2024-10-22
公开号:CN119360882A
公开日期:2025-01-24
类型:发明专利
摘要
本发明涉及一种多国别英语发音数据扩充及识别补偿模型构建方法。该方法首先收集多国别英语发音样本,并进行去噪、分割和格式转换等预处理操作。提取梅尔频率倒谱系数(MFCC)声学特征,并利用RNN和LSTM网络捕获时序特征。通过对抗网络生成不同国别的语音数据,并与真实数据合并构建多国别语音数据库。本方案还包括国别识别模块和语音识别模型的构建,通过LSTM或Transformer架构训练模型,并将国别识别结果作为输入以提高识别效果。本发明能够有效扩充多国别英语发音数据,降低数据收集成本,提升语音识别系统在多样化口音环境下的鲁棒性和准确性。通过技术手段,本方案为全球化背景下的语音识别应用提供了有效的数据支持和模型优化策略。
技术关键词
数据扩充方法 梅尔频率倒谱系数 英语 时序特征 模型构建方法 发音 声学特征 构建语音识别模型 离散余弦变换 识别模块 频谱特征 语音活动检测 随机噪声 语音识别系统 生成器网络 滤波器
系统为您推荐了相关专利信息
1
异常节点的监测方法、装置、设备及存储介质
网络 监测方法 源节点 数据 分段
2
一种基于迁移学习的旋转机械故障诊断方法
深度残差网络 工业噪声 时序特征 时序依赖关系 故障分类器
3
疲劳检测模型构建方法和驾驶员疲劳检测方法、装置、设备、车辆、存储介质
趋势波动分析 检测模型构建方法 统计特征 电信号 矩阵
4
一种适应PSTN通话的增量式ASR算法
更新解码器 LSTM模型 滤波器 置信度阈值 算法
5
基于睡眠剥夺联合跑台实验的小鼠脑体失能模型构建方法
模型构建方法 心率 模型小鼠 谷胱甘肽过氧化物酶 微型传感器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号