摘要
本公开涉及一种语音合成方法、装置、电子设备、存储介质及产品,涉及语音合成技术领域,包括:对目标用户对应的文本信息和情感信息进行处理,得到标记序列;通过目标语音合成模型对标记序列进行处理,得到目标语音频谱,目标语音合成模型基于多个语音训练样本训练基础语音合成模型得到,语音训练样本包括样本文本信息、样本情感信息和样本语音;根据目标语音频谱,得到目标合成语音。可生成融合了情感的目标合成语音,从而使生成的目标合成语音不仅能够表达用户的语义,还能够表达用户的情感。
技术关键词
语音
情感识别模型
手语
样本
手势特征
面部特征
情感类别
文本
基础
标记
序列
计算机程序指令
风格
电子设备
处理器
计算机程序产品
视频
场景
图像
年龄
系统为您推荐了相关专利信息
神经网络模型
计算机程序指令
识别方法
异构
元素
自动诊断系统
特征值
更新知识图谱
故障诊断模块
齿轮箱支撑结构
文本
图像特征提取模型
编码器
信息抽取方法
语义实体
光学遥感图像
识别方法
动态权重分配
注意力机制
识别模块
客观评价指标
车牌识别模型
测评方法
人脸识别模型
样本