语音合成方法、装置、存储介质及电子设备

正文

推荐专利

语音合成方法、装置、存储介质及电子设备

申请号：CN202510425665

申请日期：2025-04-07

公开号：CN120164452A

公开日期：2025-06-17

类型：发明专利

摘要

本申请公开了一种语音合成方法、装置、存储介质及电子设备，涉及人工智能技术领域。其中方法包括：获取待处理文本以及所述待处理文本对应的嵌入向量；将所述待处理文本和所述待处理文本对应的嵌入向量一同输入至预设文本编码器中进行编码，得到所述待处理文本对应的文本向量；根据所述待处理文本对应的文本向量，利用预设时长预测大模型预测所述待处理文本中每个字符发音的持续时长；基于所述待处理文本中每个字符发音的持续时长以及所述待处理文本对应的文本向量，进行语音合成，得到所述待处理文本对应的语音信息。本申请能够提高文本发音的时长预测精度，保证合成语音的自然度。

技术关键词

样本发音字符文本编码器语音音频特征解码器多尺度音色特征音量调节系数电子设备上采样人工智能技术处理器标识注意力机制序列

系统为您推荐了相关专利信息

一种冬季项目运动员的选材方法及系统

运动员选材方法项目全基因组芯片标记

一种智能化排队叫号系统

排队叫号系统体态特征年龄样本信息采集单元

一种用于3D显示的柱透镜光栅两视点图像融合方法

像素图像融合方法线性回归算法样本数据处理工具

跨模态数据对齐模型训练方法、装置、设备及介质

跨模态数据模型训练方法图像样本双曲正切函数

一种变负载燃料电池电压衰减预测方法

衰减预测方法燃料电池电堆电压参数强化学习环境特征值

语音合成方法、装置、存储介质及电子设备

站点导航

APP 下载