基于机器学习模型的说话人识别方法、装置、设备和介质

正文

推荐专利

申请号：CN202511254947

申请日期：2025-09-03

公开号：CN120808792A

公开日期：2025-10-17

类型：发明专利

摘要

本公开的实施例涉及基于机器学习模型的说话人识别方法、装置、设备和存储介质。该方法包括：利用第一机器学习模型，从音频数据中提取语音特征；以及基于语音特征，为音频数据分配说话人标识。第一机器学习模型是利用至少第二机器学习模型来训练的，第二机器学习模型被配置为基于第一机器学习模型从样本音频数据中提取的样本语音特征，对样本音频数据的采集设备进行分类。第一机器学习模型的训练目标包括降低第二机器学习模型对采集设备分类的正确度。样本音频数据是基于第一音频数据和/或第二音频数据确定的。第一音频数据是通过关联于第一样本说话人的非共享设备采集的。第二音频数据是通过不关联于第二样本说话人的共享设备采集的。

技术关键词

机器学习模型语音特征共享设备样本说话人识别方法采集设备计算机可执行指令数据互动场景音频识别装置神经网络架构标签处理器计算机程序产品标识电子设备可读存储介质身份

基于机器学习模型的说话人识别方法、装置、设备和介质

站点导航

APP 下载