一种基于泰老发音相似性的老挝语声学表征方法

AITNT
正文
推荐专利
一种基于泰老发音相似性的老挝语声学表征方法
申请号:CN202510786351
申请日期:2025-06-12
公开号:CN120636372A
公开日期:2025-09-12
类型:发明专利
摘要
本发明涉及一种基于泰老发音相似性的老挝语声学表征方法,属于自然语言处理技术领域。包括:对泰语、老挝语音频及文本数据进行统一预处理,构建泰语、老挝语词表;采用多语言自监督预训练模型,先用泰语训练集及泰语词表微调高层参数,冻结低层特征提取器,优化CTC损失,得到泰语微调后的模型;加载泰语微调后的模型,去除原泰语分类层,基于老挝语词表新建分类层并随机初始化,利用老挝语训练集进一步微调Transformer编码器及新分类层,优化CTC损失,得到适用于老挝语的声学表征模型;加载声学表征模型,在老挝语测试集上进行推理,计算CER,评估声学表征与识别性能。本发明显著提升了低资源语言老挝语的语音识别性能。
技术关键词
表征方法 发音 预训练模型 特征提取器 音频 多语言 数据一致性检查 编码器 检查点 训练集 文本 标签标准化 字符 表征系统 保存技术 热启动 自然语言 处理器 动态
系统为您推荐了相关专利信息
1
基于负荷预测迁移学习的储能飞轮转速预测方法和装置
负荷预测模型 历史负荷数据 神经网络模型 转速预测方法 特征提取器
2
基于对偶光谱亲和约束的高光谱异常检测方法
高光谱异常检测 异常检测方法 特征提取器 邻域 注意力
3
一种基于RVC网络的闽南语戏曲变声方法及系统
音频 变声方法 拼音 变声系统 语义
4
语音生成方法和装置、计算机设备及存储介质
语音生成模型 语音特征提取 语音生成方法 语音编码器 文本编码器
5
一种基于超分辨率的可见光和红外图像配准方法
红外图像配准方法 可见光图像 超分辨率 图像配准模型 特征提取网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号