语音识别模型获取方法、装置、计算机设备、可读存储介质和程序产品

正文

推荐专利

申请号：CN202510270528

申请日期：2025-03-07

公开号：CN120148488A

公开日期：2025-06-13

类型：发明专利

摘要

本申请涉及一种语音识别模型获取方法、装置、计算机设备、计算机可读存储介质和计算机程序产品，涉及语音识别技术领域，能够提高在无标注的应用场景下的语音识别模型训练精度及模型的泛化能力。所述方法包括：获取无标注的语音训练数据；对语音训练数据进行数据清洗，得到清洗后的语音训练数据；获取预训练语音识别模型，并通过该模型，对清洗后的语音训练数据进行伪标签预测，得到带标签的第一语音训练数据；对带标签的第一语音训练数据中的伪标签进行文本纠错，及对带标签的第一语音训练数据中的语音训练数据进行语音修正，得到带标签的第二语音训练数据；根据带标签的第二语音训练数据，对预训练语音识别模型进行调整，得到目标语音识别模型。

技术关键词

语音识别模型带标签纠错文本计算机设备计算机程序产品可读存储介质语音识别技术数据获取模块处理器存储器场景精度

系统为您推荐了相关专利信息

一种准确语音唤醒控制方法及系统

语音唤醒控制方法智能家电云平台指令唤醒控制系统

一种基于连续称重和倾角数据的覆冰厚度计算方法及系统

厚度计算方法神经网络模型输电线路覆冰厚度对象构建深度学习网络

一种水电厂知识的全文检索增强方法、系统、设备及介质

语义向量查询关键词学习算法同义词样本

一种颜料高光谱图像分类方法、存储介质及计算机设备

注意力光谱特征提取融合特征计算机设备高光谱相机

通过充电机巢实现无人机自动充电的方法、设备及介质

识别码充电公头充电机构停机坪无人机精准降落

语音识别模型获取方法、装置、计算机设备、可读存储介质和程序产品

站点导航

APP 下载