一种拟人化的语音合成方法、装置及可读存储介质

正文

推荐专利

申请号：CN202410773107

申请日期：2024-06-17

公开号：CN118366430B

公开日期：2024-09-17

类型：发明专利

摘要

本发明公开了一种拟人化的语音合成方法、装置及可读存储介质，包括：首先，对待处理文本进行特征编码，获取包含语义和语境信息的文本编码特征。接着，通过语音风格预测得到对应的语音风格信息，并提取其风格特征隐变量。将文本编码特征与风格特征隐变量融合，形成融合语音特征。然后，将这些特征输入预设的特征解码器，获得语音解码特征向量。进一步地，结合目标说话用户的身份标识进行特征转化，得到音频信号特征。最后，利用声码器处理这些音频信号特征，生成具有拟人化特色的目标合成语音。如此设计，能够显著提高语音合成的自然度和个性化表现，为用户提供更加逼真的语音交互体验。

技术关键词

编码特征语音特征信号特征风格解码器瓶颈特征变量文本编码器声码器音频可读存储介质自动语音识别身份样本对齐工具语义

系统为您推荐了相关专利信息

图像生成方法及其装置

图像生成模型图像主体图像特征向量风格多层感知器

车辆控制方法、存储介质、程序产品、控制器及车辆

驾驶风格识别车辆控制方法加速度数据车辆周边

一种多尺寸融合的双目相机及电子设备

双目相机高分辨率深度图多尺寸图像拼接融合特征

一种索引序列生成方法、装置、电子设备及存储介质

基因表达数据索引序列生成方法条目解码器

二维码的美化方法、系统、设备及存储介质

二维码美化方法单元块黑色美化设备

一种拟人化的语音合成方法、装置及可读存储介质

站点导航

APP 下载