基于LLM-TTS的数据扩增方法、系统、设备及存储介质

正文

推荐专利

申请号：CN202510104378

申请日期：2025-01-22

公开号：CN120048256A

公开日期：2025-05-27

类型：发明专利

摘要

本申请涉及语言识别技术领域，尤其涉及一种基于LLM‑TTS的数据扩增方法、系统、设备及存储介质，包括收集可用的语音数据集并对其进行预处理；基于预处理后的语音数据集对预设的LLM‑based TTS模型进行训练；利用训练好的LLM‑based TTS模型进行数据扩增；对扩增数据进行筛选；使用筛选过的扩增数据训练ASR自动语音识别模型。本申请通过有效生成和筛选扩增数据，确保在数据稀缺的环境下，语音识别系统能够更好地适应方言和小语种的特点，从而解决了现有技术中语音识别系统在稀缺语种和方言下识别性能低下的问题。

技术关键词

数据扩增方法自动语音识别错误率语音识别系统模型训练模块韵律特征语言识别技术音频扩增系统解码生成语音数据采集模块注意力机制程序策略处理器可读存储介质存储器

系统为您推荐了相关专利信息

一种基于强化学习的自动驾驶行为决策方法及系统

强化学习模型决策方法策略车辆网络

机器学习建模平台、方法、电子设备及介质

机器学习建模平台训练集数据模型训练模块数据管理模块分布式计算框架

一种基于低资源场景的人声检测语音识别方法、系统及存储介质

人声语音识别方法语音识别系统语音声学模型语音识别模块

一种融合多特征的可解释知识追踪方法

知识追踪方法融合多特征学生朴素贝叶斯模型错误率

转子系统异常检测数据驱动方法、系统、存储介质及设备

数据驱动方法转子系统燃气轮机自动编码器图像

基于LLM-TTS的数据扩增方法、系统、设备及存储介质

站点导航

APP 下载