摘要
本发明涉及一种基于泰老发音相似性的老挝语声学表征方法,属于自然语言处理技术领域。包括:对泰语、老挝语音频及文本数据进行统一预处理,构建泰语、老挝语词表;采用多语言自监督预训练模型,先用泰语训练集及泰语词表微调高层参数,冻结低层特征提取器,优化CTC损失,得到泰语微调后的模型;加载泰语微调后的模型,去除原泰语分类层,基于老挝语词表新建分类层并随机初始化,利用老挝语训练集进一步微调Transformer编码器及新分类层,优化CTC损失,得到适用于老挝语的声学表征模型;加载声学表征模型,在老挝语测试集上进行推理,计算CER,评估声学表征与识别性能。本发明显著提升了低资源语言老挝语的语音识别性能。
技术关键词
表征方法
发音
预训练模型
特征提取器
音频
多语言
数据一致性检查
编码器
检查点
训练集
文本
标签标准化
字符
表征系统
保存技术
热启动
自然语言
处理器
动态
系统为您推荐了相关专利信息
负荷预测模型
历史负荷数据
神经网络模型
转速预测方法
特征提取器
高光谱异常检测
异常检测方法
特征提取器
邻域
注意力
语音生成模型
语音特征提取
语音生成方法
语音编码器
文本编码器
红外图像配准方法
可见光图像
超分辨率
图像配准模型
特征提取网络