语音合成方法、装置、电子设备、计算机可读存储介质及计算机程序产品

正文

推荐专利

申请号：CN202510376873

申请日期：2025-03-24

公开号：CN120690170A

公开日期：2025-09-23

类型：发明专利

摘要

本申请提供了一种语音合成方法、装置、电子设备、计算机可读存储介质及计算机程序产品；方法包括：对第一文本进行特征提取，得到第一文本特征，并对第二文本进行特征提取，得到第二文本特征，第二文本用于描述第一语音簇的语音风格；基于第二文本特征对第一文本特征进行注意力调整，得到第三文本特征，并基于第一文本特征对第二文本特征进行注意力调整，得到第四文本特征；基于第三文本特征和第四文本特征，确定第一文本和第二文本的第一相似度；在所述第一语音簇中确定与第一相似度最高的第二文本相匹配的第一语音，并基于第一语音合成第一文本的第二语音。通过本申请，能够使得针对第一文本合成的语音，更加符合第一文本所表示的风格。

技术关键词

语音文本样本语义特征计算机可执行指令查询特征注意力机制风格计算机程序产品聚类声纹特征键特征可读存储介质电子设备特征提取模块矩阵处理器

系统为您推荐了相关专利信息

一种基于无人机图像的海草床分布提取方法

地理信息系统软件支持向量机模型灰度共生矩阵径向基核函数图像

一种多模态特征融合方法、系统、设备、介质及程序产品

语义特征嵌入特征矩阵净化特征融合特征

电气自动化设备调度方法、装置、设备、存储介质和程序产品

电气自动化设备进化算法电力调度系统数据样本

一种多源多模态数据融合的跨模态情感识别方法及设备

情感识别方法模态特征融合特征注意力机制深度学习模型

甲状腺文本信息分级方法、装置、设备及存储介质

文本决策特征分级信息分类技术分级设备

语音合成方法、装置、电子设备、计算机可读存储介质及计算机程序产品

站点导航

APP 下载