基于深度声纹特征匹配的个性化歌声克隆系统与匹配方法

正文

推荐专利

申请号：CN202510509386

申请日期：2025-04-22

公开号：CN120375805A

公开日期：2025-07-25

类型：发明专利

摘要

本发明涉及歌声合成技术领域，公开了基于深度声纹特征匹配的个性化歌声克隆系统与匹配方法，该系统包括：用户个性建模模块、风格建模模块、语义旋律联合感知模块、歌声合成模块和情感一致性匹配模块，该方法通过提取用户的声纹、情感和发声控制特征，生成个性和风格向量，并结合歌词语义和旋律结构，利用扩散模型生成歌声声谱图，最后通过情感一致性判别优化模型。通过提取用户的声纹特征、情感表达特征和发声控制特征，并与风格控制向量和语义旋律信息融合，本发明能够生成符合个性化需求且风格一致的歌声，解决了现有技术中歌声合成模型在个性化和风格一致性表达上的不足，提供了更精确的个性化歌声生成能力。

技术关键词

声纹特征克隆系统风格语义声谱发声匹配模块神经网络推理预训练语言模型语言声音神经网络模型声学特征拼接单元网络单元注意力机制多尺度文本节点

系统为您推荐了相关专利信息

一种基于计算机视觉的印刷缺陷检测方法及系统

印刷缺陷检测方法融合特征卷积特征印刷缺陷检测系统注意力

一种基于多维度知识迁移的故障诊断方法

神经网络模型语义分支样本故障诊断方法

一种用于航空影像中多种类农作物植株计数的多尺度语义增强型点监督算法

监督算法语义特征影像航空注意力机制

用于结构动响应预测的可解释神经网络模型及预测方法

可解释神经网络神经网络模型参数载荷梯度下降法

风电设备小目标检测方法、装置及电子设备

特征融合网络融合特征风电设备注意力语义特征

基于深度声纹特征匹配的个性化歌声克隆系统与匹配方法

站点导航

APP 下载