多语言语音识别方法、装置、设备及介质

正文

推荐专利

多语言语音识别方法、装置、设备及介质

申请号：CN202411503571

申请日期：2024-10-25

公开号：CN119339714B

公开日期：2025-10-31

类型：发明专利

摘要

本发明涉及人工智能技术领域和金融科技领域，公开了一种多语言语音识别方法，通过获取预训练的基础语音识别模型；为每种语言对应配置适配器；配置多个语言特性专家模块；获取训练语音数据，选择相应的语言特性专家模块并输入语音样本；确定目标低资源语言，冻结其他适配器的参数，仅训练目标语言的适配器，基于语言标识选择对应的适配器并进行训练，直至完成所有批次数据的训练，生成目标语音识别模型。本发明通过配置语言依赖适配器和语言特性专家模块，使得不同语言的特性得到针对性处理，显著提升了模型的适应性和识别准确性。通过冻结非目标语言的适配器，减少了不必要的资源消耗，专注于目标低资源语言的优化，确保了训练过程的高效性。

技术关键词

语音识别模型低资源语言多语言语音识别语音识别方法识别语音信号样本语音识别程序模块语音特征基础深度学习模型参数梅尔频率倒谱系数声学特征训练数据处理配置适配器

系统为您推荐了相关专利信息

基于原型的构音障碍语音识别方法

语音识别方法原型监督学习模型特征提取器语音特征

语音意图识别方法、装置、设备及介质

语音意图识别方法语音活动检测语义意图编码向量信号

一种基于自监督学习的语音欺骗检测方法

语音欺骗检测语音识别模型音频注意力机制分类器

中医护理数据智能管理方法及系统

数据智能管理方法动态知识图谱强化学习模型差分隐私机制智能调度系统

一种语音识别方法及相关装置

语音识别方法语音识别模型视频周期语音识别装置

多语言语音识别方法、装置、设备及介质

站点导航

APP 下载