摘要
本申请提供了一种针对副语言的数据增强方法、装置、计算机设备和存储介质。首先获取原始副语言语音集与原始语言语音集,接着将原始副语言语音集中的副语言训练语音输入语音重建模型得到重建语音,随后依据重建语音与副语言训练语音的相似度,将不满足设定要求的副语言训练语音从原始副语言语音集中排除,以确保数据质量。最后把处理后的原始副语言语音集与原始语言语音集组合成训练语音集。通过组合两种不同类型的语音集,极大地丰富了训练数据的特征维度,不仅包含语言内容,还融入了情感、态度等副语言信息,为模型训练提供了更全面的数据,整个流程自动化程度高,显著减少人工投入,极大缩短了数据准备周期,能够高效地扩充训练数据规模。
技术关键词
语音
计算机可读指令
解码模型
情感类别
计算机设备
数据获取模块
处理器
强度
文本
存储器
编码
规模
周期