一种语音生成方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202411463370

申请日期：2024-10-18

公开号：CN119446115A

公开日期：2025-02-14

类型：发明专利

摘要

本申请实施例属于语音处理技术领域，涉及一种语音生成方法、装置、计算机设备及存储介质，该方法包括：接收用户终端发送的语音生成请求，其中，所述语音生成请求包括参考语音以及语音文本；将所述参考语音输入至语音表征器进行语音表征操作，得到语音表征数据；将所述语音文本输入至文本表征器进行文本表征操作，得到文本表征数据；将所述语音表征数据以及所述文本表征数据输入至自回归语言模型进行预测操作，得到语音标记数据；将所述语音标记数据输入至扩散变换器模型进行语音增强操作，得到增强语音数据；将所述增强语音数据输入至声学语音合成器进行语音合成操作，得到目标合成语音。本申请可以生成高质量、个性化的语音输出。

技术关键词

语音生成方法语音合成器计算机可读指令文本声学特征语音特征数据计算机设备信号分析变换器生成装置标记可读存储介质模块终端注意力机制处理器关系

系统为您推荐了相关专利信息

一种基于数据画像的运维工单智能化匹配派工方法及装置

数据画像派工方法历史工单数据聚类标签

基于OCR自动绘制审批流程的系统及方法

配置需求信息像素点噪声强度 CRF模型字符识别

一种基于多级分类与相似度匹配的志愿服务工单智能处理方法及系统

分页机制案例库重试机制文本实体识别语义向量空间

工程图自动标注方法、设备及介质

标注规则工程图自动标注方法神经网络模型后处理算法图像

预训练语言模型后门检测方法、装置及电子设备

预训练语言模型输出特征嵌入特征训练特征文本

一种语音生成方法、装置、计算机设备及存储介质

站点导航

APP 下载