歌声转换系统的训练方法、生成音频的方法及相关装置

AITNT
正文
推荐专利
歌声转换系统的训练方法、生成音频的方法及相关装置
申请号:CN202510235997
申请日期:2025-02-28
公开号:CN119993117B
公开日期:2025-11-14
类型:发明专利
摘要
本发明实施例提供了一种歌声转换系统的训练方法、基于歌声转换系统生成音频的方法及相关装置,用于提升合成后歌声的音色与待转换歌声音色之间的相似度。本发明实施例方法包括:获取第一目标音色的多条参考音频,将多条参考音频输入至音色编码器,得到音色编码向量;将待转换歌声的音素后验概率和基频输入至文本编码器,得到待转换歌声内容的先验分布参数;根据先验分布参数进行采样,得到待转换歌声内容的文本采样值向量;将文本采样值向量和音色编码向量输入至音色感知注意力机制模块,以确定新音色编码向量;将新音色编码向量作为歌声转换系统中所增加的新输入,计算歌声转换系统的重构损失,根据重构损失对歌声转换系统进行训练。
技术关键词
编码向量 文本编码器 音素后验概率 多头注意力机制 音频 解码器 传播算法 重构 线性 上采样 语音 编码器模块 参数 计算机装置 计算机程序产品 处理器
系统为您推荐了相关专利信息
1
一种融合虚拟现实和心理疏导的心理健康教育辅导系统
教育辅导系统 模块 虚拟现实体验 隐私数据保护 触觉反馈设备
2
基于多模态融合与大语言模型的数字结构化访谈处理方法
融合特征 生成提示词 矩阵 多模态 梅尔频率倒谱系数
3
一种适用于蓝牙设备的翻译接收器
蓝牙设备 USB芯片 智能终端 蓝牙芯片 接收器
4
一种跨协议的实时音频通信方法、系统、介质及服务器
音频通信方法 服务器集群 协议 房间 语音
5
任务动作生成方法、装置、设备及介质
动作生成方法 训练样本数据 动作生成程序 策略 网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号