一种基于合成语音的语音识别方法

AITNT
正文
推荐专利
一种基于合成语音的语音识别方法
申请号:CN202510651189
申请日期:2025-05-20
公开号:CN120260538A
公开日期:2025-07-04
类型:发明专利
摘要
本发明公开了一种基于合成语音的语音识别方法,包括以下步骤:根据各领域的专有文本生成领域合成语音,将领域合成语音与真实语料混合,生成各领域的混合语音,得到混合语音数据集;构建语音识别模型:在端到端语音识别模型Paraformer解码器的输出层后插入适配器,适配器中嵌入有领域分类器,适配器利用领域分类器判断语音的所属领域并对解码器的输出特征进行动态调整;对适配器的输出特征和解码器的输出特征进行融合,将融合后的特征输入语音识别模型的后续模块,生成语音识别文本;利用标注后的混合语音数据集训练语音识别模型,将待识别的语音输入训练后的语音识别模型,得到待识别语音的语音识别文本。
技术关键词
语音识别方法 输出特征 适配器 解码器 判别特征 构建语音识别模型 联合损失函数 语音识别文本 分类器 生成语音 表达式 门控阈值 全局平均池化 参数 数据 非线性 动态
系统为您推荐了相关专利信息
1
一种基于生成对抗网络的等离激元组织切片免染色成像方法
染色成像方法 组织切片 生成对抗网络 GAN模型 明场显微镜
2
一种提升音素发音时长准确性的语音合成方法、装置
音频编解码器 发音 文本 时间序列信息 语音编码
3
基于多模态大模型的高超声速飞行器模拟飞行试验系统
数据编码 自然语言 融合系统 融合特征 时序
4
一种面向复杂动态环境的图像多模态融合方法及系统
图像综合特征 可见光图像 图像多模态 图像梯度信息 模态特征
5
一种钢材缺陷检测模型训练和应用方法、设备及介质
钢材缺陷检测 卷积模块 模型训练方法 输出特征 融合特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号