语音生成方法、装置、电子设备和存储介质

正文

推荐专利

语音生成方法、装置、电子设备和存储介质

申请号：CN202510945983

申请日期：2025-07-09

公开号：CN120783727A

公开日期：2025-10-14

类型：发明专利

摘要

本发明提供一种语音生成方法、装置、电子设备和存储介质，涉及计算机技术领域，包括：获取真实语音和内容文本；内容文本包括对真实语音进行转写得到的第一文本和用于生成与真实语音具有相同语音风格的待生成语音的第二文本；将真实语音和内容文本输入语音生成模型，得到待生成语音；语音生成模型包括时长预测模块和语音生成模块；时长预测模块用于基于内容文本的音素序列，以及第一文本的音素序列中各个音素的持续时长，确定第二文本的音素序列中各个音素的预测持续时长，得到内容文本的扩展音素序列；语音生成模块用于基于扩展音素序列和真实语音，生成待生成语音。本发明提供的方法和装置，提高了生成语音的稳定性和速度。

技术关键词

语音生成方法语音生成模型文本生成语音序列解码单元特征提取单元扩展单元模块非暂态计算机可读存储介质注意力样本电子设备风格处理器生成装置数据存储器解码器

系统为您推荐了相关专利信息

一种基于大语言模型学习和增强的水利领域规则抽取方法

规则抽取方法大语言模型水利语句分支

融合伪3D人工标注与2D目标跟踪的图像数据标注方法

质心偏移量数据标注方法物体索引图像

Linux实时开发平台

Linux系统硬件平台编码向量因子序列

一种虚拟形象生成的方法、装置、设备、介质和程序产品

生成虚拟形象构建用户画像处理器可读存储介质人工智能技术

应用查重方法、页面显示方法及计算设备

查重方法页面显示方法大语言模型文本项目

语音生成方法、装置、电子设备和存储介质

站点导航

APP 下载