语音风格迁移方法、装置、设备及介质

正文

推荐专利

语音风格迁移方法、装置、设备及介质

申请号：CN202510417726

申请日期：2025-04-03

公开号：CN120220653A

公开日期：2025-06-27

类型：发明专利

摘要

本发明涉及语音处理技术领域，可应用于金融科技及医疗健康等业务场景中，公开了一种语音风格迁移方法，包括：提取源语音和参考语音的特征，分离内容特征和风格特征；基于时间参数对初始源特征进行线性插值，生成中间特征；将中间特征输入流匹配模型，生成参考特征和重构特征；计算循环一致性损失，并基于该损失优化流匹配模型参数；将优化后的模型用于风格迁移，生成迁移语音波形。本发明通过循环一致性损失约束风格迁移过程，确保语音的语义和风格一致性，结合时间插值处理提升转换平滑度，并利用流匹配模型实现跨说话人风格迁移，提高未见说话人的风格适应能力，模型优化降低对标注数据的依赖，提升生成语音的稳定性和自然度。

技术关键词

语音风格迁移方法重构输入流融合特征匹配模型参数波形分析模块多模态语音特征提取滑动平均滤波短时傅里叶变换多头注意力机制输入多尺度计算机设备验证特征插值模块

系统为您推荐了相关专利信息

基于AL-SAE模型的大坝变形异常检测方法、装置及设备

大坝异常检测方法生成对抗网络深度学习模型样本

一种基于多模态深度学习的智能辅助方法及系统

多模态深度学习智能辅助方法医学影像数据分词文本数据提取

一种基于多源信息特征级融合的舰船分类方法

分类方法雷达卷积模型 Softmax分类器样本

基于人工智能的任务处理方法、装置、计算机设备及介质

多模态特征性能监控融合特征注意力计算机可读指令

一种基于事件相机的端到端实时小目标无人机检测方法

无人机检测方法事件相机视觉特征事件特征检测头

语音风格迁移方法、装置、设备及介质

站点导航

APP 下载