摘要
本发明公开了一种基于无监督式的话者分离优化方法及系统,涉及话者分离技术领域,包括收集语音数据,并对语音数据进行预处理;通过无监督数据标注进行特征提取与分类;构建无监督增强学习策略优化算法,优化模型,并使用未处理语音数据进行模型测试和验证。本发明所述方法通过无监督数据标注进行特征提取与分类,实现了在没有人工标注的情况下自动识别和分类语音特征,降低标注成本,模型能够适应未知的说话人,达到了增强模型泛化能力和鲁棒性;通过构建无监督增强学习策略优化算法,模型能够更好地处理实际应用中的噪声和变化,提高了模型的准确率和适应性,使用未处理语音数据进行模型测试和验证,达到了验证模型泛化能力和实用性。
技术关键词
无监督
语音活动检测
特征提取技术
数据
预训练模型
序列
分类技术
语音特征
时序
密度聚类算法
生成语音
场景
模块
处理器
计算机设备
错误率
可读存储介质
信号