摘要
本公开的实施例涉及基于机器学习模型的说话人识别方法、装置、设备和存储介质。该方法包括:利用第一机器学习模型,从音频数据中提取语音特征;以及基于语音特征,为音频数据分配说话人标识。第一机器学习模型是利用至少第二机器学习模型来训练的,第二机器学习模型被配置为基于第一机器学习模型从样本音频数据中提取的样本语音特征,对样本音频数据的采集设备进行分类。第一机器学习模型的训练目标包括降低第二机器学习模型对采集设备分类的正确度。样本音频数据是基于第一音频数据和/或第二音频数据确定的。第一音频数据是通过关联于第一样本说话人的非共享设备采集的。第二音频数据是通过不关联于第二样本说话人的共享设备采集的。
技术关键词
机器学习模型
语音特征
共享设备
样本
说话人识别方法
采集设备
计算机可执行指令
数据
互动场景
音频识别装置
神经网络架构
标签
处理器
计算机程序产品
标识
电子设备
可读存储介质
身份