一种训练方法、语音合成方法、装置、设备及介质

正文

推荐专利

申请号：CN202411446013

申请日期：2024-10-15

公开号：CN119479613A

公开日期：2025-02-18

类型：发明专利

摘要

本发明涉及人工智能技术领域，尤其涉及一种训练方法、语音合成方法、装置、设备及介质。获取训练样本组包括待合成语音的文本嵌入信息、参考语音的参考情感特征和参考音色特征、语种嵌入信息与目标语音，将文本嵌入信息、参考情感特征、参考音色特征与语种嵌入信息输入至初始语音合成模型中，输出预测语音，根据预测语音与目标语音，计算目标损失，根据目标损失，对初始语音合成模型进行训练，得到训练好的语音合成模型。将参考语音的情感特征与音色特征，输入至初始语音合成模型中，即将情感特征与音色特征嵌入到模型中，使训练好的语音合成模型结合对应说话人的情感与音色，输出更加自然、生动，更具表现力的合成语音。

技术关键词

编码特征语音音色特征情感特征频谱特征文本流解码器对齐模块编码器训练装置融合特征计算机设备输出模块字符支路可读存储介质人工智能技术处理器声码器

系统为您推荐了相关专利信息

基于3D卷积神经网络（3D CNN）的rPPG信号提取方法

时空融合特征编码器特征信号提取方法编码器模块远程光电容积描记

电网波形畸变下的电能计量方法

电网波形畸变电能计量方法电流电能计量准确性指数

一种基于多模态交互的场馆景区智能讲解导览问答系统

景区智能讲解多模态交互问答系统智能眼镜场馆

一种基于多模态数据融合的数字乡村智能管理系统

多模态数据融合智能管理系统异构传感器网络智能交互终端三维可视化引擎

基于土壤干旱遥感数据的碳通量监测方法及系统

分布特征植被像素编码向量遥感图像提取

一种训练方法、语音合成方法、装置、设备及介质

站点导航

APP 下载