一种基于AdLoRA Plus的低资源语言自适应语音识别方法

正文

推荐专利

申请号：CN202510037717

申请日期：2025-01-10

公开号：CN119943052B

公开日期：2025-09-30

类型：发明专利

摘要

本申请属于语音识别技术领域。本申请提供一种基于AdLoRA Plus的低资源语言自适应语音识别方法。本公开实施例通过引入AdLoRA Plus微调技术，在低资源语言环境下显著提升了Whisper模型的语音识别精度。通过低秩适配器层和动态学习率调节，在有限的训练数据下实现了高效的参数更新。采用冻结基础参数的策略，仅对AdLoRA Plus适配器层进行训练，显著降低了计算开销和训练时间，同时保持预训练知识并防止过拟合。具备广泛的适应性和扩展性，确保在实际应用中表现出色。有效提升了语音识别精度、推理效率及训练效率，解决了现有技术在小语种和特定领域应用中的多项挑战，具有重要的实际应用价值。

技术关键词

语音识别方法带标签文本大语言模型语音识别精度音频特征多层感知机解码器编码器归一化模块场景资源特征提取模块音频波形数据交叉注意力机制短时傅里叶变换

系统为您推荐了相关专利信息

功率半导体器件的制备参数优化方法、装置、设备及介质

功率半导体器件参数优化方法强化学习算法大语言模型数据

搜索优化方法、装置、电子设备、存储介质以及程序产品

语义关键词搜索优化方法语义特征问答模型热点

一种基于仅解码器架构的文档向量搜索引擎的构建方法

解码器架构解码架构子模块企业大语言模型

数据处理方法、装置、电子设备及存储介质

文本指数时间段数据处理方法情感分类模型

一种视频生成方法、装置、设备及可读存储介质

视频生成方法神经网络模型音频视频生成设备视频生成技术

一种基于AdLoRA Plus的低资源语言自适应语音识别方法

站点导航

APP 下载