摘要
本申请提供了一种调音方法、装置、电子设备及介质,所述方法获取目标音频的全局语义特征和目标音频中每个段落的段落信号特征;基于目标音频的所述全局语义特征和每个段落的段落信号特征,生成针对目标音频的目标提示文本;所述目标提示文本包括对所述目标音频的整体风格描述和每个段落的段落特征描述;将所述目标提示文本输入至音效参数生成模型,处理所述目标提示文本中的整体风格描述和段落特征描述,确定针对每个段落的段落音效参数,从而生成针对所述目标音频的目标音效参数,从而根据音乐语义和音乐结构精细化调整音效,产出贴合音乐风格的音效方案。
技术关键词
调音方法
音效
信号特征
语义特征
音频
大语言模型
文本
参数
风格
频谱特征
多模态
空间声场
机器可读指令
人声
音乐
电子设备
调音装置
数据
处理器
可读存储介质