一种语音合成方法、装置、终端设备及存储介质

正文

推荐专利

申请号：CN202411937534

申请日期：2024-12-26

公开号：CN119993120B

公开日期：2025-10-03

类型：发明专利

摘要

本发公开了一种语音合成方法、装置、设备及存储介质，所述方法包括获取待处理的语音及文本数据并将其输入至目标语音合成模型中，以此获取对应声学特征和对应内容的目标合成语音数据；其中，目标语音合成模型的生成是在进行模型训练过程中，通过获取并根据教师语音合成模型和学生语音合成模型输出分布之间的相对熵，来调整学生语音合成模型的模型参数，并在相对熵达到第一预设阈值时，所对应的学生语音合成模型作为目标语音合成模型。通过实施本发明，能够确保目标语音合成模型的表达能力和生成质量的同时，还满足了用户的实时性需求。

技术关键词

训练文本数据声学特征学生语音特征教师文本编码器解码数据获取模块语义特征终端设备处理器声波存储器参数信号计算机

系统为您推荐了相关专利信息

一种非匹配数据场景下建筑物轮廓提取方法、设备及介质

建筑物基座屋顶检测网络模型语义分割网络建筑物轮廓

一种多模态农产品数据隐私保护的异常检测方法及装置

数据隐私保护异常检测方法多模态融合特征动态噪声

基于大模型技术的智能会议质检方法

质检方法响应度参数声学特征合规性一致性检测

基于最优阈值的曲线结构图像分割半监督训练方法及装置

标签半监督训练方法数据学生图像分割

肿瘤分类模型训练和使用方法、装置、设备、介质和产品

分类网络样本特征提取网络肿瘤分类模型训练方法

一种语音合成方法、装置、终端设备及存储介质

站点导航

APP 下载