一种语音数据标注方法、设备及存储介质

正文

推荐专利

一种语音数据标注方法、设备及存储介质

申请号：CN202411441724

申请日期：2024-10-15

公开号：CN119339727A

公开日期：2025-01-21

类型：发明专利

摘要

本申请公开一种语音数据标注方法、设备及存储介质，涉及语音处理技术领域，所述方法包括：获取车载业务语音数据，基于所述车载业务语音数据构造训练数据；基于多个预训练声纹模型对所述训练数据进行声纹识别，获得每个预训练声纹模型对应的训练数据的声纹匹配得分；对所述训练数据的声纹匹配得分进行聚类，得到每个预训练声纹模型对应的声纹聚类结果；基于各个预训练声纹模型对应的声纹聚类结果确定对应于同一说话人的语音数据，并进行说话人标注。本申请提供的语音数据标注方法，减少了人工标注的出错概率，降低了人工标注的时间成本和经济成本，实现了高效、低成本地获取高准确度的语音标注数据。

技术关键词

语音数据标注方法声纹模型业务语音数据样本无监督聚类声纹识别方法车辆智能设备处理器可读存储介质存储器低成本计算机标签标识

系统为您推荐了相关专利信息

主粮作物种植面积的评估方法和装置

作物种植面积亚米级遥感影像分辨率遥感影像格网样本

一种网络探针的PCDN流量动态识别与抑制方法

网络探针决策树模型 DNS解析构建决策树通信数据处理技术

图像配准方法、装置和计算机设备

多模态医学图像样本高斯混合模型弱监督信息图像配准方法

基于机器视觉的塑料制品表面缺陷检测方法

塑料制品表面缺陷检测方法频域特征复数特征矩阵

客户进线转人工的过滤方法、装置、电子设备及存储介质

文本过滤方法客户消息神经网络模型

一种语音数据标注方法、设备及存储介质

站点导航

APP 下载