摘要
本发明涉及语音识别领域,公开了一种汽车行业术语语音识别方法及装置、存储介质。所述方法包括:构建中文word‑phone发音词典和汽车专业术语BPE‑phone发音词典;使用中文语音数据对初始化的基础语音识别模型进行训练;从基础语音识别模型中进行参数权重的迁移,在迁移的模型上使用中文语音数据对目标语音识别模型进行训练。本发明实施例在仅需要少量高质量汽车专业术语语音数据集和大量无标注汽车专业术语语音数据的情况下,就可以高效训练得到效果较好的语音识别系统。最终得到的语音识别系统,不使用参数量过大的预训练模型,保证了语音识别的速度,降低了实际应用时对硬件的要求。
技术关键词
语音识别模型
发音词典
语音识别方法
分词词典
术语
语音识别系统
训练声学模型
编码器解码器
汽车
字符
语音识别装置
编码器结构
数据
列表
序列
基础
语音特征
系统为您推荐了相关专利信息
信息展示方法
图片
AI算法
语法结构
GMM模型
数据处理方法
多模态
接入终端
结构化查询语句
函数调用信息
音频分块
字幕生成方法
语音活动检测
离线语音识别模型
文本
文本
数据处理方法
语音识别模型
智能会话技术
会话数据处理
架构构建方法
有效性
验证机制
综合评价指标体系
语义规则