跨语言AI声纹克隆方法、系统及其存储介质

正文

推荐专利

申请号：CN202511280629

申请日期：2025-09-09

公开号：CN120766655B

公开日期：2025-11-11

类型：发明专利

摘要

本发明涉及语音识别技术领域，具体公开跨语言AI声纹克隆方法、系统及其存储介质，该方法包括：语音收集端对原始麦克风语音进行门控，合格样本进入预处理，门控、受限频谱、统一条件信号贯通上下游，显著提升噪声/回声下的稳健性；语音处理端以AI自适应滤波去噪，并按受限参数得到表征数据；特征提取识别端从频谱提取声纹嵌入并行识别语言，将声纹‑语言‑质量关联存储；声纹克隆端在模板库做余弦检索获相似队列，经质量与语种一致性重排后加权聚合得目标模板，小样本适配提升跨语种泛化与可扩展性；最后获取目标语言，结合目标模板生成克隆语音。

技术关键词

声纹特征克隆方法队列分辨率模板复杂度信噪比麦克风设备频率克隆系统回声滤波算法生成用户音频短时傅里叶变换偏差语音识别技术存储单元

系统为您推荐了相关专利信息

一种地质结构三维重建方法及装置

深度神经网络模型地质结构三维重建方法三维重建模型网格

一种基于自动荧光定量PCR算法的TaqMan探针法检测多种病原性真菌的方法

TaqMan探针检测试剂盒真菌样本引物探针组合

基于多模态的反射率遥感时序重建方法、装置、介质及设备

多光谱遥感影像多模态时序特征掩膜反射率

边缘环境下时空优化的实时视频流超分辨率加速方法、设备及存储介质

超分辨率实时视频流分区背包优化复杂度

一种小麦基本苗的精确识别与计数方法及系统

计数方法植株特征拍摄设备图像获取单元多模态特征

跨语言AI声纹克隆方法、系统及其存储介质

站点导航

APP 下载