摘要
本发明涉及语音识别技术领域,公开了一种针对小语种的语音识别算法,包括:S1:构建多语种关键词平行语料库;S2:通过对多语种关键词平行语料库进行分析,获得各其他语种与目标小语种的关键词发音相似指数,并筛选出若干个第一参考语种;S3:构建综合平行语料库;S4:将综合平行语料库的语料信息划分为若干个语料分析单元;S5:筛选出目标语料分析单元;S6:根据综合平行语料库的语料信息数据筛选出各目标语料分析单元的目标迁移语种;S7:根据各目标语料分析单元的目标迁移语种进行跨语种迁移建模;实现了从海量语种中精准定位最优迁移源的目标;有效解决了目标小语种因数据稀缺而导致的模型训练困难问题。
技术关键词
平行语料库
语音识别算法
关键词
分析单元
发音
指数
波形
语音识别技术
数据
词语
音频
图像
特征点
轨迹
标记
系统为您推荐了相关专利信息
变压器油色谱分析
变压器故障诊断
油色谱数据
大语言模型
问答模型
肩关节
锻炼辅助系统
参数
随机森林模型
采集单元
声乐发声训练装置
口腔监测
压阻式柔性传感器
气流
卷积神经网络分类
社交网络数据挖掘
社交网络数据采集
互动特征
生成概念
标识符