一种语音识别模型训练方法、装置及可读存储介质

正文

推荐专利

申请号：CN202510585574

申请日期：2025-05-07

公开号：CN120452426A

公开日期：2025-08-08

类型：发明专利

摘要

本申请提供一种语音识别模型训练方法、装置及可读存储介质，所述方法包括：数据准备：通过外部知识库进行多源信息融合修正以及特征提取处理，得到训练数据；模型构建，包括：改进的Whisper编码器、判别器网络、改进的Whisper解码器以及多模态编码器；模型训练：通过训练数据对构建的模型进行训练，得到训练模型；模型评估：通过多维度指标对训练模型进行评估，得到评估结果。本申请可以提高模型的鲁棒性和泛化能力，提高识别精度，提升模型的综合性能，提升模型在多模态任务中的性能。

技术关键词

编码器多源信息融合注意力数据语音识别模型多模态分布式训练跨模态解码器语音识别准确率语义训练装置指标模型超参数网络模型训练模块韵律特征多层次可读存储介质

系统为您推荐了相关专利信息

一种路网数据的道路宽度自动计算与质量校验方法

校验方法验证计算结果路网拓扑结构执行噪声边缘提取算法

一种融合神经元群模型和扩散模型的多通道SSVEP生成方法

多通道生成方法多头注意力机制信号样本

一种用于无人驾驶汽车的视觉辅助路径跟踪与转向控制系统

转向控制系统无人驾驶汽车最佳行驶路径动态障碍物神经网络模型

一种机械臂关节振动抑制方法、装置、电子设备及可读存储介质

机械臂关节振动抑制方法负载转动惯量电机转动惯量阻尼

一种基于大数据技术的电梯故障预测方法及系统

电梯故障预测方法大数据技术核主成分分析序列电梯运行状态

一种语音识别模型训练方法、装置及可读存储介质

站点导航

APP 下载