说话人分离方法和装置、电子设备及存储介质

AITNT
正文
推荐专利
说话人分离方法和装置、电子设备及存储介质
申请号:CN202411391955
申请日期:2024-09-30
公开号:CN119207427A
公开日期:2024-12-27
类型:发明专利
摘要
本申请实施例提供了一种说话人分离方法和装置、电子设备及存储介质,属于人工智能及金融技术领域。该方法包括:获取包含至少两个样本说话对象的说话人分离样本;基于说话人分离样本对原始声纹特征提取模型、原始口音特征提取模型和原始说话人分离模型进行训练,得到目标声纹特征提取模型、目标口音特征提取模型和目标说话人分离模型,通过目标声纹特征提取模型、目标口音特征提取模型和目标说话人分离模型对目标语音数据进行说话人分离标注,得到目标说话人标注信息,基于目标说话人标注信息对目标语音数据进行语音分离。本申请实施例能够精确提取语音数据中不同说话人的声纹、语音特征,从而实现准确地说话人分离,提高了说话人分离的准确性。
技术关键词
特征提取模型 样本 声纹特征 对象 注意力 电子设备 模型训练模块 可读存储介质 数据获取模块 语音特征 处理器 存储器 计算机 金融
系统为您推荐了相关专利信息
1
汽车车桥故障诊断方法及系统
编码向量 汽车车桥 故障诊断方法 编码特征 波形
2
一种基于深度神经网络的鱼类数量检测方法
数量检测方法 深度神经网络 图像 条件生成对抗网络 网箱
3
基于Vine Copula的大跨度屋盖结构风压相干性概率建模方法
概率建模方法 风压 非线性最小二乘法 相干性 大跨度屋盖结构
4
一种光谱仪的谱图重构方法及系统
重构光谱 光谱仪 神经网络预测模型 重构方法 振动特征
5
一种基于机器学习的电梯机械故障声纹识别方法及系统
骨传导传感器 声纹识别方法 决策树模型 构建训练集 信号预处理模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号