语音转换模型训练方法、语音转换方法、电子设备及存储介质

AITNT
正文
推荐专利
语音转换模型训练方法、语音转换方法、电子设备及存储介质
申请号:CN202410976926
申请日期:2024-07-18
公开号:CN118918909A
公开日期:2024-11-08
类型:发明专利
摘要
本申请公开一种包括人声编码器、内容编码器和波形生成器的语音转换模型的训练方法,包括预训练内容编码器;预训练人声编码器;以及对抗训练语音转换模型的波形生成器和对应的判别器,对抗训练包括迭代执行下述步骤,直至达到预设的迭代终止条件:将训练音频分别输入内容编码器和人声编码器以输出内容特征和人声特征;将内容特征和人声特征输入波形生成器,生成训练生成音频,由判别器在训练音频和训练生成音频中判别真实音频和/或生成音频;由第一损失值更新波形生成器的参数;由第二损失值更新判别器的参数。本申请方案将通常应用于声码器的对抗训练用于训练声学模型,而省掉了声码器,提升了语音转换的生成效率,减低了训练成本。
技术关键词
人声 编码器 波形 音素后验概率 语音转换方法 音频特征 模型训练方法 激励残差网络 训练声学模型 注意力 参数 音色特征 序列 电子设备 解码器 处理器 存储器
系统为您推荐了相关专利信息
1
基于对抗域生成网络的跨域拉曼光谱识别方法和装置
嵌入特征 样本 识别方法 语义 网络
2
一种多节点并发传输信号叠加分集方法
分集方法 Turbo解码器 Turbo编码器 多节点 矩阵
3
基于有监督深度学习的水下无线光通信编解码方法及系统
水下无线光通信 监督深度学习 编解码方法 解码模型 发射单元
4
一种基于对比学习与私有信息的多视图数据类别识别方法
数据类别识别方法 语义特征 标签 邻居 自然语言分析
5
一种基于目标特征增强和语义融合感知的小样本目标检测方法
语义 原型 通道注意力机制 感兴趣 样本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号