摘要
本发明涉及计算机领域,提供一种音频生成方法、装置、设备及介质,方法包括:获取待生成音频信息和音频生成任务信息,待生成音频信息用于表征生成所需音频的信息,音频任务信息用于表征待生成音频的任务生成类型;将待生成音频信息和音频生成任务信息输入至音频生成模型中,得到音频生成模型输出的音频生成结果;其中,音频生成模型是基于不同任务生成类型对应的音频训练信息和音频训练信息对应的音频样本训练同一速度向量场得到的;音频生成模型用于基于音频生成任务信息,利用速度向量场生成对应音频。本发明通过音频生成模型基于任务生成类型切换速度向量场快速生成音频,保证音频生成质量并适配不同音频生成需求。
技术关键词
音频生成方法
随机噪声
样本
高维向量空间
速度
文本特征向量
处理器
生成装置
参数
存储器
电子设备
介质
语义
解码
语音
模块