摘要
本申请实施例提供了一种说话人分离方法和装置、电子设备及存储介质,属于人工智能及金融技术领域。该方法包括:获取包含至少两个样本说话对象的说话人分离样本;基于说话人分离样本对原始声纹特征提取模型、原始口音特征提取模型和原始说话人分离模型进行训练,得到目标声纹特征提取模型、目标口音特征提取模型和目标说话人分离模型,通过目标声纹特征提取模型、目标口音特征提取模型和目标说话人分离模型对目标语音数据进行说话人分离标注,得到目标说话人标注信息,基于目标说话人标注信息对目标语音数据进行语音分离。本申请实施例能够精确提取语音数据中不同说话人的声纹、语音特征,从而实现准确地说话人分离,提高了说话人分离的准确性。
技术关键词
特征提取模型
样本
声纹特征
对象
注意力
电子设备
模型训练模块
可读存储介质
数据获取模块
语音特征
处理器
存储器
计算机
金融
系统为您推荐了相关专利信息
数量检测方法
深度神经网络
图像
条件生成对抗网络
网箱
概率建模方法
风压
非线性最小二乘法
相干性
大跨度屋盖结构
重构光谱
光谱仪
神经网络预测模型
重构方法
振动特征
骨传导传感器
声纹识别方法
决策树模型
构建训练集
信号预处理模块