摘要
本发明涉及歌声合成技术领域,公开了基于深度声纹特征匹配的个性化歌声克隆系统与匹配方法,该系统包括:用户个性建模模块、风格建模模块、语义旋律联合感知模块、歌声合成模块和情感一致性匹配模块,该方法通过提取用户的声纹、情感和发声控制特征,生成个性和风格向量,并结合歌词语义和旋律结构,利用扩散模型生成歌声声谱图,最后通过情感一致性判别优化模型。通过提取用户的声纹特征、情感表达特征和发声控制特征,并与风格控制向量和语义旋律信息融合,本发明能够生成符合个性化需求且风格一致的歌声,解决了现有技术中歌声合成模型在个性化和风格一致性表达上的不足,提供了更精确的个性化歌声生成能力。
技术关键词
声纹特征
克隆系统
风格
语义
声谱
发声
匹配模块
神经网络推理
预训练语言模型
语言声音
神经网络模型
声学特征
拼接单元
网络单元
注意力机制
多尺度
文本
节点
系统为您推荐了相关专利信息
印刷缺陷检测方法
融合特征
卷积特征
印刷缺陷检测系统
注意力
可解释神经网络
神经网络模型
参数
载荷
梯度下降法
特征融合网络
融合特征
风电设备
注意力
语义特征