摘要
本申请实施例提供了一种语音生成方法、装置、计算机设备、计算机可读存储介质、计算机程序产品,属于音频处理领域。该语音生成方法包括:获取内容文本和情感描述文本;根据所述情感描述文本,确定情感权重数组;根据所述情感权重数组和多个基础情感向量,确定目标情感向量;及将所述目标情感向量和所述内容文本作为模型输入,通过预先训练好的音频合成模型生成第一目标语音,所述第一目标语音包括所述内容文本中的文本内容和所述情感描述文本中的情感特征。本申请实施例的技术方案可以利用情感描述文本实现对第一目标语音的情感控制,提高了语音生成稳定性,以及语音生成过程中的情感可控性和准确性。
技术关键词
语音生成模型
文本
语音生成方法
发音
情感特征
特征提取器
音频
基础
大语言模型
样本
计算机程序产品
可读存储介质
计算机设备
分类器
处理器通信
生成装置
指令
系统为您推荐了相关专利信息
动态构建方法
矩阵
随机噪声
需求反馈数据
生成对抗网络模型