一种基于风格向量调控的高保真语音风格迁移方法

AITNT
正文
推荐专利
一种基于风格向量调控的高保真语音风格迁移方法
申请号:CN202511298157
申请日期:2025-09-11
公开号:CN120998176A
公开日期:2025-11-21
类型:发明专利
摘要
本发明涉及语音信号处理技术领域,具体涉及一种基于风格向量调控的高保真语音风格迁移方法,包括:获取待处理的原始语音信号,对语音信号进行数据预处理,得到待输入语音特征表示;构建并训练神经网络,得到训练好的端到端神经网络模型,作为风格迁移神经网络模型;所述风格迁移神经网络模型包括内容编码器、风格编码器、风格调控模块和解码器;将待输入语音特征表示输入到风格迁移神经网络模型中,得到高保真语音波形。本发明通过结合端到端神经网络和风格向量的精细化调控机制,实现高保真、稳定且可控的语音风格迁移。
技术关键词
语音风格迁移方法 神经网络模型 语音特征 编码器 解耦机制 损失函数设计 辅助分类器 解码器 训练神经网络 语音信号处理技术 调控单元 短时傅里叶变换 注意力机制 波形 自然语言 模板
系统为您推荐了相关专利信息
1
一种基于HY-1C卫星COCTS数据的深度学习云检测方法
云检测方法 数据 亮度 模型预测值 解码器
2
一种应急救援伤员伤情评估方法及系统
多模态深度神经网络 分类规则 数据分析模型 非暂态计算机可读存储介质 实时数据
3
一种分层多上下文空间自适应图像压缩方法
图像压缩方法 编码器 采样模块 解码器 动态门控
4
一种婴幼儿爬行的关节角度预测方法、系统、设备及介质
关节角度预测方法 数据 坐标系 矩阵 三维动作捕捉系统
5
基于VI识别的智能环保宣传交互系统及方法
节点 交互方法 色彩特征向量 语义 图谱
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号