跨语言AI声纹克隆方法、系统及其存储介质

AITNT
正文
推荐专利
跨语言AI声纹克隆方法、系统及其存储介质
申请号:CN202511280629
申请日期:2025-09-09
公开号:CN120766655B
公开日期:2025-11-11
类型:发明专利
摘要
本发明涉及语音识别技术领域,具体公开跨语言AI声纹克隆方法、系统及其存储介质,该方法包括:语音收集端对原始麦克风语音进行门控,合格样本进入预处理,门控、受限频谱、统一条件信号贯通上下游,显著提升噪声/回声下的稳健性;语音处理端以AI自适应滤波去噪,并按受限参数得到表征数据;特征提取识别端从频谱提取声纹嵌入并行识别语言,将声纹‑语言‑质量关联存储;声纹克隆端在模板库做余弦检索获相似队列,经质量与语种一致性重排后加权聚合得目标模板,小样本适配提升跨语种泛化与可扩展性;最后获取目标语言,结合目标模板生成克隆语音。
技术关键词
声纹特征 克隆方法 队列 分辨率 模板 复杂度 信噪比 麦克风设备 频率 克隆系统 回声 滤波算法 生成用户 音频 短时傅里叶变换 偏差 语音识别技术 存储单元
系统为您推荐了相关专利信息
1
一种地质结构三维重建方法及装置
深度神经网络模型 地质结构 三维重建方法 三维重建模型 网格
2
一种基于自动荧光定量PCR算法的TaqMan探针法检测多种病原性真菌的方法
TaqMan探针 检测试剂盒 真菌 样本 引物探针组合
3
基于多模态的反射率遥感时序重建方法、装置、介质及设备
多光谱遥感影像 多模态 时序特征 掩膜 反射率
4
边缘环境下时空优化的实时视频流超分辨率加速方法、设备及存储介质
超分辨率 实时视频流 分区 背包优化 复杂度
5
一种小麦基本苗的精确识别与计数方法及系统
计数方法 植株特征 拍摄设备 图像获取单元 多模态特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号