一种环境感知的可控背景去除和保留的语音合成系统

正文

推荐专利

申请号：CN202510121489

申请日期：2025-01-24

公开号：CN119943028B

公开日期：2025-11-11

类型：发明专利

摘要

本发明公开了一种环境感知的可控背景去除和保留的语音合成系统，涉及语音领域，本发明提出了一个能够根据带噪提示语音感知声学环境，从而进行可控背景去除和保留的语音合成系统，以文本、提示语音和任务相关的控制信号作为输入，包含时长预测器、声学模型和双重提示语音编码器，在训练策略上，基于流匹配算法，进一步提出了可控的掩码语音预测训练策略，通过提供带噪的提示语音实现可控的背景去除和保留。本发明提高了系统处理带噪、混响和干扰说话人的提示语音的鲁棒性和可控性，能够在生成语音时有效地控制提示语音中含有的背景的去除与保留，实现更高的生成语音质量和更相似的声学背景。

技术关键词

语音编码器 ODE求解器策略声学模型建模生成语音信号噪声语音序列文本多任务分类器鲁棒性参数偏差算法索引波形

系统为您推荐了相关专利信息

一种基于大模型微调的知识问答方法、装置及存储介质

知识问答方法参数大语言模型两阶段问答场景

一种基于对抗剪枝和知识蒸馏的后门防御方法

后门教师学生知识蒸馏技术门槛

手语识别模型训练方法、识别方法、装置、设备及介质

坐标生成训练样本识别模型训练方法关键点视频

基于概率区间划分的机器人全局路径规划方法及系统

障碍物节点终点全局路径规划 RRT算法

机器人的避障方法、机器人及存储介质

环境感知装置机器人物体规划运动

一种环境感知的可控背景去除和保留的语音合成系统

站点导航

APP 下载