一种基于AdLoRA Plus的低资源语言自适应语音识别方法

AITNT
正文
推荐专利
一种基于AdLoRA Plus的低资源语言自适应语音识别方法
申请号:CN202510037717
申请日期:2025-01-10
公开号:CN119943052B
公开日期:2025-09-30
类型:发明专利
摘要
本申请属于语音识别技术领域。本申请提供一种基于AdLoRA Plus的低资源语言自适应语音识别方法。本公开实施例通过引入AdLoRA Plus微调技术,在低资源语言环境下显著提升了Whisper模型的语音识别精度。通过低秩适配器层和动态学习率调节,在有限的训练数据下实现了高效的参数更新。采用冻结基础参数的策略,仅对AdLoRA Plus适配器层进行训练,显著降低了计算开销和训练时间,同时保持预训练知识并防止过拟合。具备广泛的适应性和扩展性,确保在实际应用中表现出色。有效提升了语音识别精度、推理效率及训练效率,解决了现有技术在小语种和特定领域应用中的多项挑战,具有重要的实际应用价值。
技术关键词
语音识别方法 带标签 文本 大语言模型 语音识别精度 音频特征 多层感知机 解码器 编码器 归一化模块 场景 资源 特征提取模块 音频波形数据 交叉注意力机制 短时傅里叶变换
系统为您推荐了相关专利信息
1
功率半导体器件的制备参数优化方法、装置、设备及介质
功率半导体器件 参数优化方法 强化学习算法 大语言模型 数据
2
搜索优化方法、装置、电子设备、存储介质以及程序产品
语义关键词 搜索优化方法 语义特征 问答模型 热点
3
一种基于仅解码器架构的文档向量搜索引擎的构建方法
解码器架构 解码架构 子模块 企业 大语言模型
4
数据处理方法、装置、电子设备及存储介质
文本 指数 时间段 数据处理方法 情感分类模型
5
一种视频生成方法、装置、设备及可读存储介质
视频生成方法 神经网络模型 音频 视频生成设备 视频生成技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号