一种语音数据标注方法、设备及存储介质

AITNT
正文
推荐专利
一种语音数据标注方法、设备及存储介质
申请号:CN202411441724
申请日期:2024-10-15
公开号:CN119339727A
公开日期:2025-01-21
类型:发明专利
摘要
本申请公开一种语音数据标注方法、设备及存储介质,涉及语音处理技术领域,所述方法包括:获取车载业务语音数据,基于所述车载业务语音数据构造训练数据;基于多个预训练声纹模型对所述训练数据进行声纹识别,获得每个预训练声纹模型对应的训练数据的声纹匹配得分;对所述训练数据的声纹匹配得分进行聚类,得到每个预训练声纹模型对应的声纹聚类结果;基于各个预训练声纹模型对应的声纹聚类结果确定对应于同一说话人的语音数据,并进行说话人标注。本申请提供的语音数据标注方法,减少了人工标注的出错概率,降低了人工标注的时间成本和经济成本,实现了高效、低成本地获取高准确度的语音标注数据。
技术关键词
语音数据标注方法 声纹模型 业务语音数据 样本 无监督聚类 声纹识别方法 车辆 智能设备 处理器 可读存储介质 存储器 低成本 计算机 标签 标识
系统为您推荐了相关专利信息
1
主粮作物种植面积的评估方法和装置
作物种植面积 亚米级遥感影像 分辨率遥感影像 格网 样本
2
一种网络探针的PCDN流量动态识别与抑制方法
网络探针 决策树模型 DNS解析 构建决策树 通信数据处理技术
3
图像配准方法、装置和计算机设备
多模态医学图像 样本 高斯混合模型 弱监督信息 图像配准方法
4
基于机器视觉的塑料制品表面缺陷检测方法
塑料制品表面 缺陷检测方法 频域特征 复数特征 矩阵
5
客户进线转人工的过滤方法、装置、电子设备及存储介质
文本 过滤方法 客户 消息 神经网络模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号