一种基于深度学习的语音生成方法

AITNT
正文
推荐专利
一种基于深度学习的语音生成方法
申请号:CN202510017135
申请日期:2025-01-06
公开号:CN119889279A
公开日期:2025-04-25
类型:发明专利
摘要
本发明涉及语音克隆技术领域,尤其是提供了一种基于深度学习的语音生成方法。该方法包括制作数据集;搭建文本语义模型,利用数据集作为训练数据,对文本语义模型进行训练,获得训练后的文本语义模型;搭建语音推理模型,将训练后的文本语义模型输入至语音推理模型中的音频生成器进行处理,输出音频信号,并将音频信号传递给综合鉴别器进行判断评分;将训练好的文本语义模型和语音推理模型部署在语音生成系统中,以进行语音生成,该方法打破了传统配音模式的局限,提高了新闻节目制作的效率和灵活性,确保了新闻传播的及时性和准确性。
技术关键词
语音生成方法 语义 声学噪声抑制 音频特征 生成音频信号 自动语音识别 注意力机制 文本编码器 语音克隆技术 梅尔频率倒谱系数 可读存储介质 生成系统 模块 声谱 残差神经网络
系统为您推荐了相关专利信息
1
一种翻译方法、翻译模型的训练方法及设备
文本 翻译模型 样本 翻译方法 重构
2
基于知识蒸馏的文本语义推理方法及系统
语义推理方法 特征值 文本 推理系统 匹配模块
3
一种基于AI语义理解的零代码多端应用自动构建方法
自动构建方法 语义理解技术 空间金字塔池化 视觉特征 特征提取器
4
液冷服务器控制方法及系统
状态监测数据 液冷服务器 日志 物理状态监测 时序特征
5
基于改进PointNet++的工程机械满斗率预测方法、装置及可读介质
工程机械挖斗 语义分割模型 池化特征 率预测方法 注意力
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号