语音数据集的生成方法及装置

正文

推荐专利

语音数据集的生成方法及装置

申请号：CN202511340288

申请日期：2025-09-18

公开号：CN120877702B

公开日期：2025-12-23

类型：发明专利

摘要

本申请公开了一种语音数据集的生成方法及装置。其中，该方法包括：获取标准通用语言的语音数据集，并采用大语言模型将标准通用语言的语音数据集转化为目标语种文本；采用检索增强生成的方式生成目标语种语句文本；根据目标语种文本和目标语种语句文本生成目标语种语音，并根据目标语种语音构建目标语音数据集，其中，目标语种语音的语音特征与和标准通用语言语音数据集的语音特征一致。本申请解决了相关技术中由于目标语种语音数据库的语音数据量较少，导致翻译模型翻译目标语种的准确性较低。

技术关键词

语音特征文本语音生成模型大语言模型生成方法语句主题数据错误率存储程序指令翻译模型计算机程序产品存储器生成装置处理器计算机设备字符音频

系统为您推荐了相关专利信息

估计用于机器人系统和应用的立体图像的深度信息

立体图像生成深度图执行机器学习模型虚拟现实内容处理器

深度图生成方法及设备

稀疏深度图 RGB彩色图像生成方法生成设备机器人系统

模型训练方法、装置、计算机设备及存储介质

分区数据模型训练方法参数计算机设备

控制车辆的方法、训练多模态模型的方法、装置及车辆

多模态样本嵌入特征融合特征速率

一种多模态数据融合的情感分析系统及方法

多模态数据融合情感分析方法图像情感分析系统表情特征

语音数据集的生成方法及装置

站点导航

APP 下载