摘要
本发明提供了一种用于听障人士低水平发音的语音识别方法及相关设备,方法包括:采集DHH人士的语音作为真实DHH语音数据集;将真实DHH语音数据集对TTS预训练模型进行微调,得到适用于DHH人士的个性化TTS模型;通过适用于DHH人士的个性化TTS模型合成大量的DHH语音数据集;分别使用合成DHH语音数据集和真实DHH语音数据集对ASR预训练模型进行微调训练,得到适用于DHH人士的ASR模型;对说话的人进行语音采集;将采集的语音进行说话人身份识别,将识别为DHH人士发出的语音输入适用于DHH人士的ASR模型进行语音识别;将适用于DHH人士的ASR模型识别到的语音生成文本返回客户端显示。本发明的有益效果在于:能够提高听障人士的语音识别准确率。
技术关键词
语音识别方法
说话人身份识别
发音
文本
数据
语音识别准确率
日常生活场景
语音识别装置
计算机设备
客户端
判别模块
处理器
音频
存储器
互联网
策略
平台
系统为您推荐了相关专利信息
计算机视觉
水性漆
漆面缺陷
卷积模块
多模态数据融合
大数据分析系统
新一代信息
激光雷达数据
林业系统
林木胸径
资源分配策略
需求预测模型
资源分配方法
资源分配装置
训练样本数据
航空发动机转子
多状态
分析方法
出口边界条件
集油槽