摘要
本发明涉及一种面向构音障碍群体的语音识别方法及系统,方法包括:采集构音障碍语音数据,对构音障碍语音数据进行预处理,获取有效语音段;将有效语音段输入构音障碍语音识别模型,获取音素级或汉字级的识别结果;构音障碍语音识别模型利用第一训练集训练Conformer模型获得,第一训练集包括:伪造构音障碍音频数据;伪造构音障碍音频数据基于CycleGAN‑VC语音转换模型进行语音转换获得;在第一训练集训练模型过程中,调整Conformer模型的模型参数,并通过鲸鱼优化算法优化Conformer模型。本发明能够提高构音障碍语音识别的准确性和鲁棒性。
技术关键词
语音识别方法
语音识别模型
梅尔频率倒谱系数
训练集
鲸鱼优化算法
感知线性预测
数据
音频
频谱特征提取
语音识别系统
语音识别模块
滤波器
汉字
采样率
参数
存储单元
采样点
处理单元
系统为您推荐了相关专利信息
定位方法
在线学习机制
模糊匹配算法
模型超参数
格式化
监控预警方法
离子泵
图片
电流值
计算机可读指令
图像识别模型
图像分类模型
模糊边界
天气
注意力机制
长短期记忆神经网络
共享单车
需求预测模型
随机森林模型
需求预测方法