摘要
本发明公开了一种基于无监督数据生成精标数据的方法及系统,涉及文本处理以及语音识别技术领域,包括:获取短句,对短句进行质量筛选,得到高音频质量的短句;对高音频质量的短句进行说话人分类筛选,得到筛选后的单人说话短句,对单人说话短句施加随机噪声得到噪声短句;对单人说话短句和噪声短句使用语音识别工具进行识别,得到短句的对应文本以及噪声短句的对应文本;分别将单人说话短句和短句的对应文本,以及噪声短句和噪声短句的对应文本使用force‑alignment技术进行强制对齐,并获取对齐的置信度,得到筛选依据1和筛选依据2;接收音频,基于筛选依据1和筛选依据2对音频进行筛选,得到置信度高的音频。
技术关键词
无监督
音频
单人
文本
语音识别技术
识别工具
数据
随机噪声
信噪比估计方法
语音识别模块
处理器
可读存储介质
对齐模块
存储器
终端设备
计算机
语句
分段
系统为您推荐了相关专利信息
香氛控制系统
音频驱动模块
香氛容器
信号特征
音乐
名单管理
实体
数据采集策略
数据采集模块
机器学习模型
芯片装置
音频播放方法
频率
终端设备
音频播放装置
交互式玩具
计算机
传声器
生成音频信号
扬声器阵列
监督学习算法
多模态数据融合
个性化特征
样本
跨模态