摘要
本发明涉及语音识别技术领域,具体公开跨语言AI声纹克隆方法、系统及其存储介质,该方法包括:语音收集端对原始麦克风语音进行门控,合格样本进入预处理,门控、受限频谱、统一条件信号贯通上下游,显著提升噪声/回声下的稳健性;语音处理端以AI自适应滤波去噪,并按受限参数得到表征数据;特征提取识别端从频谱提取声纹嵌入并行识别语言,将声纹‑语言‑质量关联存储;声纹克隆端在模板库做余弦检索获相似队列,经质量与语种一致性重排后加权聚合得目标模板,小样本适配提升跨语种泛化与可扩展性;最后获取目标语言,结合目标模板生成克隆语音。
技术关键词
声纹特征
克隆方法
队列
分辨率
模板
复杂度
信噪比
麦克风设备
频率
克隆系统
回声
滤波算法
生成用户
音频
短时傅里叶变换
偏差
语音识别技术
存储单元
系统为您推荐了相关专利信息
深度神经网络模型
地质结构
三维重建方法
三维重建模型
网格
TaqMan探针
检测试剂盒
真菌
样本
引物探针组合
计数方法
植株特征
拍摄设备
图像获取单元
多模态特征