基于深度声纹特征匹配的个性化歌声克隆系统与匹配方法

AITNT
正文
推荐专利
基于深度声纹特征匹配的个性化歌声克隆系统与匹配方法
申请号:CN202510509386
申请日期:2025-04-22
公开号:CN120375805A
公开日期:2025-07-25
类型:发明专利
摘要
本发明涉及歌声合成技术领域,公开了基于深度声纹特征匹配的个性化歌声克隆系统与匹配方法,该系统包括:用户个性建模模块、风格建模模块、语义旋律联合感知模块、歌声合成模块和情感一致性匹配模块,该方法通过提取用户的声纹、情感和发声控制特征,生成个性和风格向量,并结合歌词语义和旋律结构,利用扩散模型生成歌声声谱图,最后通过情感一致性判别优化模型。通过提取用户的声纹特征、情感表达特征和发声控制特征,并与风格控制向量和语义旋律信息融合,本发明能够生成符合个性化需求且风格一致的歌声,解决了现有技术中歌声合成模型在个性化和风格一致性表达上的不足,提供了更精确的个性化歌声生成能力。
技术关键词
声纹特征 克隆系统 风格 语义 声谱 发声 匹配模块 神经网络推理 预训练语言模型 语言声音 神经网络模型 声学特征 拼接单元 网络单元 注意力机制 多尺度 文本 节点
系统为您推荐了相关专利信息
1
一种基于计算机视觉的印刷缺陷检测方法及系统
印刷缺陷检测方法 融合特征 卷积特征 印刷缺陷检测系统 注意力
2
一种基于多维度知识迁移的故障诊断方法
神经网络模型 语义 分支 样本 故障诊断方法
3
一种用于航空影像中多种类农作物植株计数的多尺度语义增强型点监督算法
监督算法 语义特征 影像 航空 注意力机制
4
用于结构动响应预测的可解释神经网络模型及预测方法
可解释神经网络 神经网络模型 参数 载荷 梯度下降法
5
风电设备小目标检测方法、装置及电子设备
特征融合网络 融合特征 风电设备 注意力 语义特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号