语音合成模型训练方法和装置、电子设备及存储介质

正文

推荐专利

申请号：CN202411749857

申请日期：2024-11-28

公开号：CN119580691A

公开日期：2025-03-07

类型：发明专利

摘要

本申请实施例提供了一种语音合成模型训练方法和装置、电子设备及存储介质，属于语音合成技术领域，适用于金融科技领域。该方法包括：获取音视频样本数据；对音视频样本数据进行语音提取，得到语音数据；对语音数据进行音频文本识别，得到语音文本；对语音数据进行音频属性识别，得到音频属性；基于多种音频属性，对音视频样本数据进行音频属性描述，得到多个单属性描述文本，其中，单属性描述文本用于描述音视频样本数据的其中一种音频属性；基于语音文本，对单属性描述文本进行实例化处理，得到语音合成样本数据；基于语音合成样本数据，对预设的语音合成模型进行模型训练。本申请实施例能够提高语音合成模型训练的准确率。

技术关键词

人脸性别模型训练方法人脸属性样本数据文本识别对音视频音频识别模块年龄电子设备模型训练装置语音识别模块模型训练模块可读存储介质图像

系统为您推荐了相关专利信息

基于零样本学习的声呐图像识别方法及系统

声呐图像识别方法编码器结构图像识别系统图像特征提取

面向IPU芯片的多模态数据处理与融合技术

语音情绪分类模型标签多模态数据融合情感特征

一种毫米波安检仪健康管理方法及系统

安检仪健康管理方法注意力机制强化学习算法子系统

用于干线物流的货运卡车协同编队运输系统

货运卡车车辆运动状态环境感知信息运输系统车载主机单元

一种高度自动化的售电公司投标竞价系统及其方法

竞价系统合规性预测模型训练访问控制单元数据分析单元

语音合成模型训练方法和装置、电子设备及存储介质

站点导航

APP 下载