一种针对副语言的数据增强方法、装置、计算机设备和存储介质

正文

推荐专利

申请号：CN202510776132

申请日期：2025-06-11

公开号：CN120340512A

公开日期：2025-07-18

类型：发明专利

摘要

本申请提供了一种针对副语言的数据增强方法、装置、计算机设备和存储介质。首先获取原始副语言语音集与原始语言语音集，接着将原始副语言语音集中的副语言训练语音输入语音重建模型得到重建语音，随后依据重建语音与副语言训练语音的相似度，将不满足设定要求的副语言训练语音从原始副语言语音集中排除，以确保数据质量。最后把处理后的原始副语言语音集与原始语言语音集组合成训练语音集。通过组合两种不同类型的语音集，极大地丰富了训练数据的特征维度，不仅包含语言内容，还融入了情感、态度等副语言信息，为模型训练提供了更全面的数据，整个流程自动化程度高，显著减少人工投入，极大缩短了数据准备周期，能够高效地扩充训练数据规模。

技术关键词

语音计算机可读指令解码模型情感类别计算机设备数据获取模块处理器强度文本存储器编码规模周期

一种针对副语言的数据增强方法、装置、计算机设备和存储介质

站点导航

APP 下载