跨语言语音迁移合成方法、装置、设备及介质

正文

推荐专利

申请号：CN202510862156

申请日期：2025-06-25

公开号：CN120526749A

公开日期：2025-08-22

类型：发明专利

摘要

本发明涉及语音处理技术领域，可应用于金融科技及医疗健康等业务场景中，公开了一种跨语言语音迁移合成方法、装置、设备及介质，包括：通过共享特征提取与语言特异性分离获得目标语言音素序列与声调标记，生成增强训练数据，采用分层自适应微调策略训练声学模型，融合推理用音素序列和声调标记生成表示序列，最终合成目标语言语音信号。本发明通过构建共享与分离并行的跨语言建模结构，有效提升了低资源语言中音素与声调建模的准确性，结合多阶段自适应微调与训练数据增强策略，使目标语言声学模型具备更强泛化能力和迁移效率，最终实现语音自然度与音色保真度的同步提升。

技术关键词

序列特征提取模块语音声学特征参数生成器网络标记数据训练特征适配器声码器中间层预训练模型文本训练声学模型阶段位置编码信息策略

系统为您推荐了相关专利信息

一种基于语言大模型的文本审查方法及系统

文本数据结构特征提取语义特征提取特征提取模块

一种基于粒子群算法的超高温重载调心滚子轴承优化设计方法及系统

调心滚子轴承粒子群算法优化设计方法工况参数静力学模型

一种多自由度激光熔凝过程监测反馈系统

监测反馈方法多自由度运动控制激光发射模块温度监测模块监测反馈系统

基于CT成像中脂肪和肌肉区域自动分割的数据处理方法

CT成像数据处理方法脂肪掩膜直方图均衡化图像

一种基于数据增强与深度学习的污水化学需氧量软测量方法

软测量方法搜索优化算法生成对抗网络滤波器状态空间模型

跨语言语音迁移合成方法、装置、设备及介质

站点导航

APP 下载