一种基于双层迁移生成对抗网络的小样本语音音色转换方法

正文

推荐专利

申请号：CN202510369968

申请日期：2025-03-27

公开号：CN120199237A

公开日期：2025-06-24

类型：发明专利

摘要

本发明属于语音信号处理与人工智能技术领域，具体涉及一种基于双层迁移生成对抗网络的小样本语音音色转换方法。该方法通过将语音数据的关键特征，结合长短期记忆网络与生成对抗网络的优势，实现音色转换。LSTM网络通过门控机制捕捉语音信号的长期时序依赖关系，提取音色相关的频谱包络特性；辅助声学参数在合成阶段直接保留源语音的韵律和自然度特征，确保生成语音的语调连贯性与声源真实性。通过双层迁移架构与模块迁移策略，模型在小样本条件下提升训练稳定性与生成质量。不断更新网络权重，最终生成的语音在音色相似度与自然度上均优于传统方法，为司法语音同一性鉴定、虚拟角色音色克隆等场景提供可靠的技术支持。

技术关键词

音色转换方法音色特征样本生成语音梅尔倒谱系数生成对抗网络模型训练集长短期记忆网络记忆单元参数语音特征数据策略优化模型时序依赖关系语音信号处理线性插值法

系统为您推荐了相关专利信息

一种道路识别方法、装置、计算机设备及存储介质

道路识别方法神经网络模型样本数据道路特征

一种安全攸关智能软件对抗样本生成及鲁棒性测试系统

鲁棒性评估智能模型样本生成方法模块软件

基于大语言模型的漏洞信息识别方法及装置

大语言模型信息识别方法样本信息识别装置非易失性计算机可读存储介质

一种医疗器械预测性维护保养方法及装置

故障预测数据医疗器械保养方法指标故障预测模型

基于深度图神经网络的贷款通过率预估系统及方法

预估系统深度图节点特征实体神经网络模型

一种基于双层迁移生成对抗网络的小样本语音音色转换方法

站点导航

APP 下载