摘要
本申请属于语音识别技术领域。本申请提供一种基于AdLoRA Plus的低资源语言自适应语音识别方法。本公开实施例通过引入AdLoRA Plus微调技术,在低资源语言环境下显著提升了Whisper模型的语音识别精度。通过低秩适配器层和动态学习率调节,在有限的训练数据下实现了高效的参数更新。采用冻结基础参数的策略,仅对AdLoRA Plus适配器层进行训练,显著降低了计算开销和训练时间,同时保持预训练知识并防止过拟合。具备广泛的适应性和扩展性,确保在实际应用中表现出色。有效提升了语音识别精度、推理效率及训练效率,解决了现有技术在小语种和特定领域应用中的多项挑战,具有重要的实际应用价值。
技术关键词
语音识别方法
带标签
文本
大语言模型
语音识别精度
音频特征
多层感知机
解码器
编码器
归一化模块
场景
资源
特征提取模块
音频波形数据
交叉注意力机制
短时傅里叶变换
系统为您推荐了相关专利信息
功率半导体器件
参数优化方法
强化学习算法
大语言模型
数据
语义关键词
搜索优化方法
语义特征
问答模型
热点
视频生成方法
神经网络模型
音频
视频生成设备
视频生成技术