基于原型的构音障碍语音识别方法

AITNT
正文
推荐专利
基于原型的构音障碍语音识别方法
申请号:CN202410938705
申请日期:2024-07-14
公开号:CN118942445A
公开日期:2024-11-12
类型:发明专利
摘要
本发明属于语音识别技术领域,更具体地,涉及一种基于原型的构音障碍语音识别方法。该方法包括以下步骤:S1、微调用于特征提取的HuBERT,在构音障碍语音识别任务上对预训练的自监督学习模型HuBERT进行微调,在微调阶段使用CTC损失和监督对比学习损失来有效地指导模型的训练,微调后的HuBERT用作特征提取器;S2、构建每个单词的原型;S3、基于原型的分类。本发明提供了一种快速有效的方法来提高对未见过的构音障碍说话人的语音识别。本发明将CTC损失与SCL损失相结合,以训练DSR模型,通过学习更好的特征表示来提高性能。
技术关键词
语音识别方法 原型 监督学习模型 特征提取器 语音特征 样本 语音识别技术 索引 超参数 标签 阶段 数据
系统为您推荐了相关专利信息
1
一种基于多模态火灾救援检测方法和系统
视觉特征 语音特征 视觉图像信息 多模态特征融合 融合特征
2
基于气象大数据的空气制水量智能预测调节方法及系统
深度强化学习模型 气象监测数据 组合特征向量 参数 特征提取器
3
一种自监督神经符号融合的可解释AI推理方法及系统
深度学习框架 标签特征 符号 输出特征 电子显示设备
4
一种基于手机APP的老年人孤独感综合管理系统及方法
综合管理系统 老年人 数据服务器 客户端 综合管理方法
5
一种滚动轴承故障诊断方法及系统
融合特征提取 故障诊断模型 分类器 特征提取器 滚动轴承
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号