摘要
本发明涉及人工智能技术领域和金融科技领域,公开了一种多语言语音识别方法,通过获取预训练的基础语音识别模型;为每种语言对应配置适配器;配置多个语言特性专家模块;获取训练语音数据,选择相应的语言特性专家模块并输入语音样本;确定目标低资源语言,冻结其他适配器的参数,仅训练目标语言的适配器,基于语言标识选择对应的适配器并进行训练,直至完成所有批次数据的训练,生成目标语音识别模型。本发明通过配置语言依赖适配器和语言特性专家模块,使得不同语言的特性得到针对性处理,显著提升了模型的适应性和识别准确性。通过冻结非目标语言的适配器,减少了不必要的资源消耗,专注于目标低资源语言的优化,确保了训练过程的高效性。
技术关键词
语音识别模型
低资源语言
多语言语音识别
语音识别方法
识别语音信号
样本
语音识别程序
模块
语音特征
基础
深度学习模型
参数
梅尔频率倒谱系数
声学特征
训练数据处理
配置适配器
系统为您推荐了相关专利信息
语音识别方法
原型
监督学习模型
特征提取器
语音特征
语音意图识别方法
语音活动检测
语义意图
编码向量
信号
语音欺骗检测
语音识别模型
音频
注意力机制
分类器
数据智能管理方法
动态知识图谱
强化学习模型
差分隐私机制
智能调度系统
语音识别方法
语音识别模型
视频
周期
语音识别装置