语音转换模型训练方法、装置、计算机设备及存储介质

正文

推荐专利

申请号：CN202411667344

申请日期：2024-11-19

公开号：CN119400151A

公开日期：2025-02-07

类型：发明专利

摘要

本申请实施例提供了一种语音转换模型训练方法、装置、计算机设备及存储介质，属于人工智能技术领域。包括：获取样本语音以及样本语音的样本音色特征和样本文本特征，获取参考语音的参考语音特征和参考音色特征；将样本语音输入到训练后的编码子模型中，输出样本语音的样本语音特征；将样本语音特征、样本文本特征和样本音色特征正向输入到可逆生成子模型中，输出目标文本特征，并确定目标文本特征和样本文本特征之间的第一损失值；将目标文本特征和参考音色特征逆向输入到可逆生成子模型中，输出目标语音特征，并确定目标语音特征和参考语音特征之间的第二损失值；根据第一损失值和第二损失值对可逆生成子模型迭代，得到训练后的可逆生成子模型。

技术关键词

语音特征音色特征样本模型训练方法文本编码计算机设备输入模块解码模型训练装置可读存储介质人工智能技术处理器存储器指令参数网络

系统为您推荐了相关专利信息

基于多目相机的动作捕捉方法、装置和存储介质

动作捕捉方法多目相机动作捕捉装置动作识别模型关节点

基于ATR-FTIR光谱对骨骼肌损伤时间的推断方法

FTIR光谱推断方法大鼠骨骼肌组织 PCA算法

一种基于子图信息瓶颈的服务网络功能节点识别方法

节点识别方法特征编码模型节点特征瓶颈矩阵

一种基于深度学习技术的农业病虫害类方言语音智能识别方法

语音智能识别方法农业病虫害卷积神经网络模型深度学习技术样本

一种基于3D建模软件的智能推荐视图方法、装置及设备

支持向量机模型强化学习模型训练样本数据场景决策树模型

语音转换模型训练方法、装置、计算机设备及存储介质

站点导航

APP 下载