一种基于无监督式的话者分离优化方法及系统

正文

推荐专利

申请号：CN202411371103

申请日期：2024-09-29

公开号：CN119107968B

公开日期：2025-04-08

类型：发明专利

摘要

本发明公开了一种基于无监督式的话者分离优化方法及系统，涉及话者分离技术领域，包括收集语音数据，并对语音数据进行预处理；通过无监督数据标注进行特征提取与分类；构建无监督增强学习策略优化算法，优化模型，并使用未处理语音数据进行模型测试和验证。本发明所述方法通过无监督数据标注进行特征提取与分类，实现了在没有人工标注的情况下自动识别和分类语音特征，降低标注成本，模型能够适应未知的说话人，达到了增强模型泛化能力和鲁棒性；通过构建无监督增强学习策略优化算法，模型能够更好地处理实际应用中的噪声和变化，提高了模型的准确率和适应性，使用未处理语音数据进行模型测试和验证，达到了验证模型泛化能力和实用性。

技术关键词

无监督语音活动检测特征提取技术数据预训练模型序列分类技术语音特征时序密度聚类算法生成语音场景模块处理器计算机设备错误率可读存储介质信号

一种基于无监督式的话者分离优化方法及系统

站点导航

APP 下载