一种面向构音障碍群体的语音识别方法及系统

正文

推荐专利

申请号：CN202510808684

申请日期：2025-06-17

公开号：CN120656444A

公开日期：2025-09-16

类型：发明专利

摘要

本发明涉及一种面向构音障碍群体的语音识别方法及系统，方法包括：采集构音障碍语音数据，对构音障碍语音数据进行预处理，获取有效语音段；将有效语音段输入构音障碍语音识别模型，获取音素级或汉字级的识别结果；构音障碍语音识别模型利用第一训练集训练Conformer模型获得，第一训练集包括：伪造构音障碍音频数据；伪造构音障碍音频数据基于CycleGAN‑VC语音转换模型进行语音转换获得；在第一训练集训练模型过程中，调整Conformer模型的模型参数，并通过鲸鱼优化算法优化Conformer模型。本发明能够提高构音障碍语音识别的准确性和鲁棒性。

技术关键词

语音识别方法语音识别模型梅尔频率倒谱系数训练集鲸鱼优化算法感知线性预测数据音频频谱特征提取语音识别系统语音识别模块滤波器汉字采样率参数存储单元采样点处理单元

系统为您推荐了相关专利信息

一种结合AI智能的规则引擎定位方法

定位方法在线学习机制模糊匹配算法模型超参数格式化

一种离子泵监控预警方法、装置、电子设备及存储介质

监控预警方法离子泵图片电流值计算机可读指令

一种道路天气状况图像识别模型的构建方法

图像识别模型图像分类模型模糊边界天气注意力机制

地表短波辐射产品生产、长短期记忆网络训练方法和装置

分辨率长短期记忆网络地表反射率辐射计数值

一种共享单车的需求预测方法、系统、设备及介质

长短期记忆神经网络共享单车需求预测模型随机森林模型需求预测方法

一种面向构音障碍群体的语音识别方法及系统

站点导航

APP 下载