摘要
本发明涉及语音识别领域,公开了一种汽车行业术语语音识别方法及装置、存储介质。所述方法包括:构建中文word‑phone发音词典和汽车专业术语BPE‑phone发音词典;使用中文语音数据对初始化的基础语音识别模型进行训练;从基础语音识别模型中进行参数权重的迁移,在迁移的模型上使用中文语音数据对目标语音识别模型进行训练。本发明实施例在仅需要少量高质量汽车专业术语语音数据集和大量无标注汽车专业术语语音数据的情况下,就可以高效训练得到效果较好的语音识别系统。最终得到的语音识别系统,不使用参数量过大的预训练模型,保证了语音识别的速度,降低了实际应用时对硬件的要求。
技术关键词
语音识别模型
发音词典
语音识别方法
分词词典
术语
语音识别系统
训练声学模型
编码器解码器
汽车
字符
语音识别装置
编码器结构
数据
列表
序列
基础
语音特征
系统为您推荐了相关专利信息
依存句法树
实体识别模型
实体依存关系
数据
三元组