摘要
本申请提供了一种语音合成方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:对第一文本进行特征提取,得到第一文本特征,并对第二文本进行特征提取,得到第二文本特征,第二文本用于描述第一语音簇的语音风格;基于第二文本特征对第一文本特征进行注意力调整,得到第三文本特征,并基于第一文本特征对第二文本特征进行注意力调整,得到第四文本特征;基于第三文本特征和第四文本特征,确定第一文本和第二文本的第一相似度;在所述第一语音簇中确定与第一相似度最高的第二文本相匹配的第一语音,并基于第一语音合成第一文本的第二语音。通过本申请,能够使得针对第一文本合成的语音,更加符合第一文本所表示的风格。
技术关键词
语音
文本
样本
语义特征
计算机可执行指令
查询特征
注意力机制
风格
计算机程序产品
聚类
声纹特征
键特征
可读存储介质
电子设备
特征提取模块
矩阵
处理器
系统为您推荐了相关专利信息
地理信息系统软件
支持向量机模型
灰度共生矩阵
径向基核函数
图像
电气自动化设备
进化算法
电力调度系统
数据
样本
情感识别方法
模态特征
融合特征
注意力机制
深度学习模型