实时语音的变音方法、终端设备和存储介质

正文

推荐专利

实时语音的变音方法、终端设备和存储介质

申请号：CN202510645848

申请日期：2025-05-20

公开号：CN120183419B

公开日期：2025-08-01

类型：发明专利

摘要

本发明适用于音频处理领域，公开了一种实时语音的变音方法、终端设备和存储介质。实时语音的变音方法包括：根据实时对话音频，生成原始语音数据，并根据原始语音数据，确定条件特征、多样性特征、填充数据掩码；根据条件特征、多样性特征、填充数据掩码，确定第一张量信息，并根据原始语音数据，确定说话人嵌入向量；根据第一张量信息、说话人嵌入向量、填充数据掩码，确定第二张量信息；根据第二张量信息、说话人嵌入向量和原始语音数据的音高频率，生成目标音色音频。本发明显著提升了变声过程对原始音色特征的重构精度，使生成语音在音色相似度、语调自然度等感知维度达到类真人水平，提高了实时语音的变音真实性。

技术关键词

实时语音音频数据流式解码器一维卷积神经网络频谱特征语音特征终端设备融合特征音色特征可读存储介质相位对齐波形生成语音处理器频率算法上采样存储器

系统为您推荐了相关专利信息

空调器的控制方法、装置和电子设备

可靠性参数空间转换矩阵设备状态数据神经网络模型空调器部件

基于事件要素图的跨境民族文化事件检索方法及装置

事件检索方法事件触发词文本编码器事件相关度计算方法嵌入方法

一种储层属性反演方法、装置、设备及存储介质

属性反演方法检波器储层反演加速度输入神经网络模型

一种膜层低损伤的IC芯片石英基板镀膜工艺

石英基板镀膜工艺溅射镀膜机蒸发镀膜机镀膜设备

一种联锁人机界面操作显示系统的检测系统及检测方法

人机界面图像识别模块数据采集模块语音识别模块模拟鼠标

实时语音的变音方法、终端设备和存储介质

站点导航

APP 下载