一种面向语音识别系统的预处理去偏方法

正文

推荐专利

一种面向语音识别系统的预处理去偏方法

申请号：CN202510075782

申请日期：2025-01-17

公开号：CN119964557A

公开日期：2025-05-09

类型：发明专利

摘要

本发明属于人工智能技术领域，具体涉及一种面向语音识别系统的预处理去偏方法，包括：数据采样，通过欠采样和SMOTE分别对多类数据和少类数据进行采样处理；模型训练，将原始数据、采样后的数据分别对判别器和ASR进行训练；分类识别，用训练好的判别器和ASR先进行分类，再进行识别；偏见评估，通过构建均衡公平的语音评估数据集、提出面向语音识别系统的偏见评估方法和评估指标，从而实现全面的偏见评估；对比分析，通过对比分析使用不均衡数据训练的基准ASR模型与经过去偏处理后的模型在偏见评估中的表现，评估去偏方法的有效性。本发明针对语音识别系统的特点进行设计，在数据处理、评估方法上提供了更加完善和高效的解决方案，不仅能够准确处理语音数据中的偏见问题，还能有效提升模型对不同属性群体的识别精度，从而显著提高语音识别系统在实际应用中的公平性、准确性与可信度。

技术关键词

语音识别系统样本数据错误率文本梅尔频率倒谱系数贪心算法男性人工智能系统自动语音识别女性指标过采样技术邻居特征提取方法年龄机器学习算法人工智能技术度量

一种面向语音识别系统的预处理去偏方法

站点导航

APP 下载