摘要
本发明属于语音信号处理与人工智能技术领域,具体涉及一种基于双层迁移生成对抗网络的小样本语音音色转换方法。该方法通过将语音数据的关键特征,结合长短期记忆网络与生成对抗网络的优势,实现音色转换。LSTM网络通过门控机制捕捉语音信号的长期时序依赖关系,提取音色相关的频谱包络特性;辅助声学参数在合成阶段直接保留源语音的韵律和自然度特征,确保生成语音的语调连贯性与声源真实性。通过双层迁移架构与模块迁移策略,模型在小样本条件下提升训练稳定性与生成质量。不断更新网络权重,最终生成的语音在音色相似度与自然度上均优于传统方法,为司法语音同一性鉴定、虚拟角色音色克隆等场景提供可靠的技术支持。
技术关键词
音色转换方法
音色特征
样本
生成语音
梅尔倒谱系数
生成对抗网络模型
训练集
长短期记忆网络
记忆单元
参数
语音特征数据
策略优化模型
时序依赖关系
语音信号处理
线性插值法
系统为您推荐了相关专利信息
大语言模型
信息识别方法
样本
信息识别装置
非易失性计算机可读存储介质
故障预测数据
医疗器械
保养方法
指标
故障预测模型