摘要
本申请公开一种语音数据标注方法、设备及存储介质,涉及语音处理技术领域,所述方法包括:获取车载业务语音数据,基于所述车载业务语音数据构造训练数据;基于多个预训练声纹模型对所述训练数据进行声纹识别,获得每个预训练声纹模型对应的训练数据的声纹匹配得分;对所述训练数据的声纹匹配得分进行聚类,得到每个预训练声纹模型对应的声纹聚类结果;基于各个预训练声纹模型对应的声纹聚类结果确定对应于同一说话人的语音数据,并进行说话人标注。本申请提供的语音数据标注方法,减少了人工标注的出错概率,降低了人工标注的时间成本和经济成本,实现了高效、低成本地获取高准确度的语音标注数据。
技术关键词
语音数据标注方法
声纹模型
业务语音数据
样本
无监督聚类
声纹识别方法
车辆
智能设备
处理器
可读存储介质
存储器
低成本
计算机
标签
标识
系统为您推荐了相关专利信息
作物种植面积
亚米级遥感影像
分辨率遥感影像
格网
样本
网络探针
决策树模型
DNS解析
构建决策树
通信数据处理技术
多模态医学图像
样本
高斯混合模型
弱监督信息
图像配准方法
塑料制品表面
缺陷检测方法
频域特征
复数特征
矩阵