说话人分离方法和装置、电子设备及存储介质

正文

推荐专利

申请号：CN202411391955

申请日期：2024-09-30

公开号：CN119207427A

公开日期：2024-12-27

类型：发明专利

摘要

本申请实施例提供了一种说话人分离方法和装置、电子设备及存储介质，属于人工智能及金融技术领域。该方法包括：获取包含至少两个样本说话对象的说话人分离样本；基于说话人分离样本对原始声纹特征提取模型、原始口音特征提取模型和原始说话人分离模型进行训练，得到目标声纹特征提取模型、目标口音特征提取模型和目标说话人分离模型，通过目标声纹特征提取模型、目标口音特征提取模型和目标说话人分离模型对目标语音数据进行说话人分离标注，得到目标说话人标注信息，基于目标说话人标注信息对目标语音数据进行语音分离。本申请实施例能够精确提取语音数据中不同说话人的声纹、语音特征，从而实现准确地说话人分离，提高了说话人分离的准确性。

技术关键词

特征提取模型样本声纹特征对象注意力电子设备模型训练模块可读存储介质数据获取模块语音特征处理器存储器计算机金融

系统为您推荐了相关专利信息

汽车车桥故障诊断方法及系统

编码向量汽车车桥故障诊断方法编码特征波形

一种基于深度神经网络的鱼类数量检测方法

数量检测方法深度神经网络图像条件生成对抗网络网箱

基于Vine Copula的大跨度屋盖结构风压相干性概率建模方法

概率建模方法风压非线性最小二乘法相干性大跨度屋盖结构

一种光谱仪的谱图重构方法及系统

重构光谱光谱仪神经网络预测模型重构方法振动特征

一种基于机器学习的电梯机械故障声纹识别方法及系统

骨传导传感器声纹识别方法决策树模型构建训练集信号预处理模块

说话人分离方法和装置、电子设备及存储介质

站点导航

APP 下载