摘要
本说明书实施例提供多模态特征融合的高品质智能声线编辑方法及装置,其中所述方法包括:根据针对原始音频的音色转换请求,确定所述原始音频对应的原始音色频谱,以及所述音色转换请求对应的目标音色频谱;基于所述音色转换请求确定所述原始音频对应的待调整频段,基于所述待调整频段利用所述目标音色频谱对所述原始音色频谱进行替换,获得音色控制频谱;在所述原始音频对应的初始音频特征中融合所述音色控制频谱,获得目标音频特征,并基于所述目标音频特征生成所述目标音色频谱对应的目标音频。使生成的目标音频能够在提高音频情感表现力效果的前提下,实现更高效、更准确以及更自然的音色转换。
技术关键词
音频特征
多模态特征融合
编辑方法
频段
计算机可执行指令
高品质
声码器
编辑装置
客户端
对象
处理器
服务端
计算机程序产品
注意力机制
模块
包络
模式
可读存储介质
系统为您推荐了相关专利信息
道路交通状况
交通拥堵指数
预测评估方法
预测评估模型
气象站
对齐方法
跨模态
矩阵分解算法
嵌入特征
语义向量
力学性能无损检测方法
BP神经网络模型
采样点
增量磁导率
巴克豪森噪声信号