基于LLM-TTS的数据扩增方法、系统、设备及存储介质

AITNT
正文
推荐专利
基于LLM-TTS的数据扩增方法、系统、设备及存储介质
申请号:CN202510104378
申请日期:2025-01-22
公开号:CN120048256A
公开日期:2025-05-27
类型:发明专利
摘要
本申请涉及语言识别技术领域,尤其涉及一种基于LLM‑TTS的数据扩增方法、系统、设备及存储介质,包括收集可用的语音数据集并对其进行预处理;基于预处理后的语音数据集对预设的LLM‑based TTS模型进行训练;利用训练好的LLM‑based TTS模型进行数据扩增;对扩增数据进行筛选;使用筛选过的扩增数据训练ASR自动语音识别模型。本申请通过有效生成和筛选扩增数据,确保在数据稀缺的环境下,语音识别系统能够更好地适应方言和小语种的特点,从而解决了现有技术中语音识别系统在稀缺语种和方言下识别性能低下的问题。
技术关键词
数据扩增方法 自动语音识别 错误率 语音识别系统 模型训练模块 韵律特征 语言识别技术 音频 扩增系统 解码 生成语音 数据采集模块 注意力机制 程序 策略 处理器 可读存储介质 存储器
系统为您推荐了相关专利信息
1
一种基于强化学习的自动驾驶行为决策方法及系统
强化学习模型 决策方法 策略 车辆 网络
2
机器学习建模平台、方法、电子设备及介质
机器学习建模平台 训练集数据 模型训练模块 数据管理模块 分布式计算框架
3
一种基于低资源场景的人声检测语音识别方法、系统及存储介质
人声 语音识别方法 语音识别系统 语音声学模型 语音识别模块
4
一种融合多特征的可解释知识追踪方法
知识追踪方法 融合多特征 学生 朴素贝叶斯模型 错误率
5
转子系统异常检测数据驱动方法、系统、存储介质及设备
数据驱动方法 转子系统 燃气轮机 自动编码器 图像
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号