摘要
本发明提供一种声音转换模型训练方法、声音转换方法及装置,涉及数据处理技术领域,包括:获取多个不同发声人的发声人音频样本;其中,每个发声人音频样本对应一个基频标签;根据各个发声人音频样本对应的自动语音识别样本特征和发声人样本特征向量,对预设声音转换模型进行训练,得到第一声音转换模型;基于目标发声人的各个发声人音频伪造样本对应的伪造自动语音识别特征和发声人样本特征向量,对第一声音转换模型进行训练,得到第二声音转换模型;其中,发声人音频伪造样本是根据目标发声人真实的发声人音频样本得到的;第二声音转换模型用于基于发声人音频对应的自动语音识别特征和发声人特征向量,输出发声人音频对应的基频信息。
技术关键词
自动语音识别
发声
声音转换方法
模型训练方法
音频
样本
声音转换装置
标签
非暂态计算机可读存储介质
种子
频段
模型训练装置
数据处理技术
处理器
重构
声码器
生成方法
模块
存储器
电子设备
系统为您推荐了相关专利信息
特征提取模型
样本
真实性检测方法
标签
预测特征
响应优化方法
语音识别文本
自动语音识别方法
大语言模型
语义