基于说话人感知的语音增强训练方法、装置、设备及介质

正文

推荐专利

申请号：CN202510344834

申请日期：2025-03-24

公开号：CN119851671B

公开日期：2025-05-16

类型：发明专利

摘要

本申请公开了基于说话人感知的语音增强训练方法、装置、设备及介质，涉及人工智能技术领域，包括：将第一带噪语音样本输入至初始语音增强联合训练系统，以便预训练语音增强模块对第一带噪语音样本进行去噪处理，输出第一增强语音样本，确定语音增强损失；通过预训练共享编码器提取第一增强语音样本的第一说话人敏感特征，通过预训练说话人识别模块对第一说话人敏感特征进行说话人ID分类，得到说话人ID分类预测结果，计算说话人识别损失；通过对抗训练鉴别器判断第一说话人敏感特征是否存在噪音，根据噪音判断结果调整对抗损失，以基于各损失更新系统参数，得到训练后的目标语音增强联合训练系统。协调语音增强与说话人识别两个任务之间冲突。

技术关键词

说话人识别语音训练系统样本编码器训练鉴别器多任务损失函数标签优化器模型训练模块存储计算机程序参数人工智能技术更新系统网络训练装置误差可读存储介质处理器

系统为您推荐了相关专利信息

词向量的确定方法、装置、设备、介质及程序产品

融合词向量文本计算机程序指令样本计算机程序产品

产品外观优化方法、装置、终端设备及存储介质

神经网络模型矩阵核心训练集遗传算法

一种智能喷氨控制方法及系统

喷氨控制方法神经网络自适应控制入口烟气温度氨喷射系统智能喷氨控制系统

基于智能决策引擎的风险控制方法及智能决策引擎

智能决策引擎算法模型配置页面风险控制方法数据

一种电网故障处置知识库管理系统

电网故障处置知识库管理系统语句知识图谱构建生成图谱

基于说话人感知的语音增强训练方法、装置、设备及介质

站点导航

APP 下载