一种基于深度学习的语音生成方法

正文

推荐专利

一种基于深度学习的语音生成方法

申请号：CN202510017135

申请日期：2025-01-06

公开号：CN119889279A

公开日期：2025-04-25

类型：发明专利

摘要

本发明涉及语音克隆技术领域，尤其是提供了一种基于深度学习的语音生成方法。该方法包括制作数据集；搭建文本语义模型，利用数据集作为训练数据，对文本语义模型进行训练，获得训练后的文本语义模型；搭建语音推理模型，将训练后的文本语义模型输入至语音推理模型中的音频生成器进行处理，输出音频信号，并将音频信号传递给综合鉴别器进行判断评分；将训练好的文本语义模型和语音推理模型部署在语音生成系统中，以进行语音生成，该方法打破了传统配音模式的局限，提高了新闻节目制作的效率和灵活性，确保了新闻传播的及时性和准确性。

技术关键词

语音生成方法语义声学噪声抑制音频特征生成音频信号自动语音识别注意力机制文本编码器语音克隆技术梅尔频率倒谱系数可读存储介质生成系统模块声谱残差神经网络

系统为您推荐了相关专利信息

一种翻译方法、翻译模型的训练方法及设备

文本翻译模型样本翻译方法重构

基于知识蒸馏的文本语义推理方法及系统

语义推理方法特征值文本推理系统匹配模块

一种基于AI语义理解的零代码多端应用自动构建方法

自动构建方法语义理解技术空间金字塔池化视觉特征特征提取器

液冷服务器控制方法及系统

状态监测数据液冷服务器日志物理状态监测时序特征

基于改进PointNet++的工程机械满斗率预测方法、装置及可读介质

工程机械挖斗语义分割模型池化特征率预测方法注意力

一种基于深度学习的语音生成方法

站点导航

APP 下载