一种面向构音障碍群体的语音识别方法及系统

AITNT
正文
推荐专利
一种面向构音障碍群体的语音识别方法及系统
申请号:CN202510808684
申请日期:2025-06-17
公开号:CN120656444A
公开日期:2025-09-16
类型:发明专利
摘要
本发明涉及一种面向构音障碍群体的语音识别方法及系统,方法包括:采集构音障碍语音数据,对构音障碍语音数据进行预处理,获取有效语音段;将有效语音段输入构音障碍语音识别模型,获取音素级或汉字级的识别结果;构音障碍语音识别模型利用第一训练集训练Conformer模型获得,第一训练集包括:伪造构音障碍音频数据;伪造构音障碍音频数据基于CycleGAN‑VC语音转换模型进行语音转换获得;在第一训练集训练模型过程中,调整Conformer模型的模型参数,并通过鲸鱼优化算法优化Conformer模型。本发明能够提高构音障碍语音识别的准确性和鲁棒性。
技术关键词
语音识别方法 语音识别模型 梅尔频率倒谱系数 训练集 鲸鱼优化算法 感知线性预测 数据 音频 频谱特征提取 语音识别系统 语音识别模块 滤波器 汉字 采样率 参数 存储单元 采样点 处理单元
系统为您推荐了相关专利信息
1
一种结合AI智能的规则引擎定位方法
定位方法 在线学习机制 模糊匹配算法 模型超参数 格式化
2
一种离子泵监控预警方法、装置、电子设备及存储介质
监控预警方法 离子泵 图片 电流值 计算机可读指令
3
一种道路天气状况图像识别模型的构建方法
图像识别模型 图像分类模型 模糊边界 天气 注意力机制
4
地表短波辐射产品生产、长短期记忆网络训练方法和装置
分辨率 长短期记忆网络 地表反射率 辐射计 数值
5
一种共享单车的需求预测方法、系统、设备及介质
长短期记忆神经网络 共享单车 需求预测模型 随机森林模型 需求预测方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号