摘要
本发明涉及人工智能技术领域,尤其涉及一种基于噪声可控的歌声合成方法、装置、设备及介质。上述方法应用于医疗领域,将随机噪声值添加至预先定义的二维图像的对应像素中,得到随机噪声图,将情感编码特征与节奏编码特征添加至随机噪声图中,与随机噪声图中对应像素中的随机噪声值进行融合,对融合噪声图进行噪声预测,并对预测噪声图进行去噪处理,得到去噪后的噪声图,将去噪后的噪声图确定为待合成歌声对应的待合成梅尔频谱,通过将预定义的情感编码特征与预定义的节奏编码特征融合至噪声图中,实现对歌声合成中的情感与节奏的控制,从而提高歌声合成的效果。在医疗领域中,可以合成可控的效果较好的多样化音乐,有助于患者康复。
技术关键词
编码特征
随机噪声
噪声预测
情感特征
特征值
节奏特征
像素
信号
噪声数据
声码器
可读存储介质
终端设备
人工智能技术
处理器
坐标
模块
定义
图像
系统为您推荐了相关专利信息
信道状态信息
信号
特征值
概率分布函数
阵列天线
噪声先验
滚动轴承故障诊断方法
噪声预测
特征提取网络
特征融合网络
调节能力评估方法
LSTM神经网络
负荷预测模型
历史负荷数据
时间序列预测技术
模型轮廓
贴图
模型合并方法
模型特征值
投影特征
等效计算方法
响应预测方法
主节点
整体叶盘结构
矩阵