基于神经网络模型的语音克隆方法、装置、设备及介质

正文

推荐专利

申请号：CN202510889250

申请日期：2025-06-27

公开号：CN120564752A

公开日期：2025-08-29

类型：发明专利

摘要

本发明公开了一种基于神经网络模型的语音克隆方法、装置、设备及介质。所述方法包括：将克隆参考语音进行音频信息提取，获取语音信号与背景噪声；将所述语音信号通过预设特征提取方式提取对应的语音特征，将所述背景噪声进行噪声提取，获取背景音特征；将所述语音特征以及所述背景音特征进行加权融合，获取目标融合特征；根据所述目标融合特征与预设待合成文本通过训练好的目标神经网络模型进行语音克隆，生成目标克隆语音。本发明可应用于金融保险与医疗健康等业务中的语音克隆中，可解决现有技术中无法进行高效地进行语音克隆的问题。

技术关键词

神经网络模型语音特征特征提取方式融合特征背景噪声语音文字识别声学特征噪声提取克隆方法文本特征向量音频声纹特征信号语音识别模型数据计算机设备深度神经网络生成语音

系统为您推荐了相关专利信息

一种基于跨模态对齐机制的可控视频配乐生成方法

配乐生成方法音乐特征跨模态运动向量面积特征

一种稳定高效的电子元器件引脚自动折弯方法

电子元器件引脚折弯方法闭环控制回弹折弯机

一种移动式车路协同路侧设备交通感知调节方法及系统

路侧设备移动式粒子群优化算法多源特征感知调节系统

一种基于大数据的定制长期升学规划系统

数据分析模块规划系统 kmeans算法大数据信息模块

一种涡轮盘防错加工方法、装置、电子设备及存储介质

补偿值混合神经网络模型偏差涡轮盘动态

基于神经网络模型的语音克隆方法、装置、设备及介质

站点导航

APP 下载