语音生成中的数据处理方法、装置及电子设备

正文

推荐专利

申请号：CN202411825028

申请日期：2024-12-11

公开号：CN119785756B

公开日期：2025-11-28

类型：发明专利

摘要

本申请提供了一种语音合成的方法、装置、电子设备及计算机可读存储介质，其中，方法包括：确定待生成语音的文本对应的音素序列，其中，所述音素序列中标注有待加入的非语言事件所在的位置；根据所述音素序列，对各音素和所述非语言事件分别进行所占帧数的预测和韵律预测，得到帧级别的、加入了韵律信息的第一音素特征数据；确定待生成语音中待加入的、帧级别的非语言特征数据；根据所述非语言特征数据，将所述第一音素特征数据处理为加入了所述非语言事件的语音信号。因此，本申请实施例提供的语音生成中的数据处理方法能够生成包含多样化、真实自然的非语言事件的语音。

技术关键词

非语言特征韵律预测模型生成语音样本序列方差信息音频数据处理方法数据处理程序特征提取模型文本电子设备可读存储介质数据处理装置粗略处理器信号

系统为您推荐了相关专利信息

一种多元时间序列异常检测扩散模型动态分割方法及系统

动态分割方法多元时间序列数据高性能分割算法网络

混合式筛选食管癌关键基因集及构建其预后模型的方法

基因机器学习方法生物信息方法随机森林支持向量机

基于多模态特征融合的药物靶标相互作用预测方法及系统

多模态特征融合协同注意力序列特征融合特征交叉注意力机制

一种基于柱上断路器设备的智能控制方法及系统

柱上断路器智能控制方法卡尔曼滤波融合电流指数

一种跨样本模态动态轮转的情感识别方法及其系统

模态特征残差注意力机制多模态嵌入特征情感识别方法

语音生成中的数据处理方法、装置及电子设备

站点导航

APP 下载