语音合成方法、语音合成模型训练方法及相关装置

正文

推荐专利

申请号：CN202510848810

申请日期：2025-06-24

公开号：CN120356452B

公开日期：2025-09-19

类型：发明专利

摘要

本申请公开了一种语音合成方法、语音合成模型训练方法及相关装置，该方法包括：获取待合成的目标文本和目标语音；提取目标语音中说话人的声音特征；基于说话人的声音特征和目标文本，生成目标合成语音，目标合成语音为参考目标语音的声音特点、且发音内容与目标文本一致的语音；其中，声音特征是利用Q‑former提取得到；和/或，目标合成语音是利用目标语音合成模型生成的，目标语音合成模型是按照用户对第一样本合成语音的偏好程度，对初始语音合成模型进行强化学习得到，第一样本合成语音为利用初始语音合成模型生成。通过上述方式，本申请能够提高目标合成语音的质量。

技术关键词

样本注意力音频特征子模块声纹验证系统模型训练方法文本语音识别系统发音模型训练装置网络参数可读存储介质处理器编码存储器程序指令

系统为您推荐了相关专利信息

一种小样本目标检测数据增强方法

训练神经网络图像样本推土机复制粘贴数据

一种基于模块化服务的自动换装智能机器人系统

智能机器人系统基站回程工作模块自动换装方法

基于深度学习的函数入口特征识别方法、装置及设备

特征识别方法网络参数信息入口数据样本

一种基于混合模型的指向性图像分割方法及系统

图像分割方法融合特征视觉特征多模态特征跨模态

一种心理风险评估预警模型构建方法

预警模型构建方法风险评估模型数据话题对象

语音合成方法、语音合成模型训练方法及相关装置

站点导航

APP 下载