摘要
本申请公开了一种音频生成方法、装置、电子设备及存储介质,属于电子设备技术领域,该方法包括获取参考对象和与参考对象相关的笑声特征数据,参考对象包括参考文本和参考音频,参考文本为用于进行笑声合成的文本,参考音频为用于指示生成预设风格的音频;通过频谱生成模型,根据参考对象和笑声特征数据,确定笑声语音频谱数据;将笑声语音频谱数据转换为笑声合成音频,其中,笑声合成音频为预设风格的音频,笑声合成音频包括参考文本的文本内容和与文本内容表征的情感相关的笑声。
技术关键词
数据处理模型
样本
对象
音频生成方法
语音
情感识别模型
文本编码器
频谱特征
风格
解码器
重构
电子设备
可读存储介质
处理器
生成装置
程序
指令