基于说话人感知的语音增强训练方法、装置、设备及介质

AITNT
正文
推荐专利
基于说话人感知的语音增强训练方法、装置、设备及介质
申请号:CN202510344834
申请日期:2025-03-24
公开号:CN119851671B
公开日期:2025-05-16
类型:发明专利
摘要
本申请公开了基于说话人感知的语音增强训练方法、装置、设备及介质,涉及人工智能技术领域,包括:将第一带噪语音样本输入至初始语音增强联合训练系统,以便预训练语音增强模块对第一带噪语音样本进行去噪处理,输出第一增强语音样本,确定语音增强损失;通过预训练共享编码器提取第一增强语音样本的第一说话人敏感特征,通过预训练说话人识别模块对第一说话人敏感特征进行说话人ID分类,得到说话人ID分类预测结果,计算说话人识别损失;通过对抗训练鉴别器判断第一说话人敏感特征是否存在噪音,根据噪音判断结果调整对抗损失,以基于各损失更新系统参数,得到训练后的目标语音增强联合训练系统。协调语音增强与说话人识别两个任务之间冲突。
技术关键词
说话人识别 语音 训练系统 样本 编码器 训练鉴别器 多任务损失函数 标签 优化器 模型训练模块 存储计算机程序 参数 人工智能技术 更新系统 网络 训练装置 误差 可读存储介质 处理器
系统为您推荐了相关专利信息
1
词向量的确定方法、装置、设备、介质及程序产品
融合词向量 文本 计算机程序指令 样本 计算机程序产品
2
产品外观优化方法、装置、终端设备及存储介质
神经网络模型 矩阵 核心 训练集 遗传算法
3
一种智能喷氨控制方法及系统
喷氨控制方法 神经网络自适应控制 入口烟气温度 氨喷射系统 智能喷氨控制系统
4
基于智能决策引擎的风险控制方法及智能决策引擎
智能决策引擎 算法模型 配置页面 风险控制方法 数据
5
一种电网故障处置知识库管理系统
电网故障处置 知识库管理系统 语句 知识图谱构建 生成图谱
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号