多语言语音识别方法、装置、设备及介质

AITNT
正文
推荐专利
多语言语音识别方法、装置、设备及介质
申请号:CN202411503571
申请日期:2024-10-25
公开号:CN119339714B
公开日期:2025-10-31
类型:发明专利
摘要
本发明涉及人工智能技术领域和金融科技领域,公开了一种多语言语音识别方法,通过获取预训练的基础语音识别模型;为每种语言对应配置适配器;配置多个语言特性专家模块;获取训练语音数据,选择相应的语言特性专家模块并输入语音样本;确定目标低资源语言,冻结其他适配器的参数,仅训练目标语言的适配器,基于语言标识选择对应的适配器并进行训练,直至完成所有批次数据的训练,生成目标语音识别模型。本发明通过配置语言依赖适配器和语言特性专家模块,使得不同语言的特性得到针对性处理,显著提升了模型的适应性和识别准确性。通过冻结非目标语言的适配器,减少了不必要的资源消耗,专注于目标低资源语言的优化,确保了训练过程的高效性。
技术关键词
语音识别模型 低资源语言 多语言语音识别 语音识别方法 识别语音信号 样本 语音识别程序 模块 语音特征 基础 深度学习模型 参数 梅尔频率倒谱系数 声学特征 训练数据处理 配置适配器
系统为您推荐了相关专利信息
1
基于原型的构音障碍语音识别方法
语音识别方法 原型 监督学习模型 特征提取器 语音特征
2
语音意图识别方法、装置、设备及介质
语音意图识别方法 语音活动检测 语义意图 编码向量 信号
3
一种基于自监督学习的语音欺骗检测方法
语音欺骗检测 语音识别模型 音频 注意力机制 分类器
4
中医护理数据智能管理方法及系统
数据智能管理方法 动态知识图谱 强化学习模型 差分隐私机制 智能调度系统
5
一种语音识别方法及相关装置
语音识别方法 语音识别模型 视频 周期 语音识别装置
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号