一种基于合成语音的语音识别方法

正文

推荐专利

一种基于合成语音的语音识别方法

申请号：CN202510651189

申请日期：2025-05-20

公开号：CN120260538A

公开日期：2025-07-04

类型：发明专利

摘要

本发明公开了一种基于合成语音的语音识别方法，包括以下步骤：根据各领域的专有文本生成领域合成语音，将领域合成语音与真实语料混合，生成各领域的混合语音，得到混合语音数据集；构建语音识别模型：在端到端语音识别模型Paraformer解码器的输出层后插入适配器，适配器中嵌入有领域分类器，适配器利用领域分类器判断语音的所属领域并对解码器的输出特征进行动态调整；对适配器的输出特征和解码器的输出特征进行融合，将融合后的特征输入语音识别模型的后续模块，生成语音识别文本；利用标注后的混合语音数据集训练语音识别模型，将待识别的语音输入训练后的语音识别模型，得到待识别语音的语音识别文本。

技术关键词

语音识别方法输出特征适配器解码器判别特征构建语音识别模型联合损失函数语音识别文本分类器生成语音表达式门控阈值全局平均池化参数数据非线性动态

系统为您推荐了相关专利信息

一种基于生成对抗网络的等离激元组织切片免染色成像方法

染色成像方法组织切片生成对抗网络 GAN模型明场显微镜

一种提升音素发音时长准确性的语音合成方法、装置

音频编解码器发音文本时间序列信息语音编码

基于多模态大模型的高超声速飞行器模拟飞行试验系统

数据编码自然语言融合系统融合特征时序

一种面向复杂动态环境的图像多模态融合方法及系统

图像综合特征可见光图像图像多模态图像梯度信息模态特征

一种钢材缺陷检测模型训练和应用方法、设备及介质

钢材缺陷检测卷积模块模型训练方法输出特征融合特征

一种基于合成语音的语音识别方法

站点导航

APP 下载