摘要
本申请涉及一种音效调节方法、音效调节多模态大模型的训练方法、计算机设备和存储介质。方法包括:响应于终端发送的针对目标音乐的音效调节请求,获取目标音乐的原始音频;将目标音乐的原始音频输入经训练的音效调节多模态大模型的目标编码器模块,以获得目标音乐的音频特征,将音频特征输入投影模块,将音频特征转换为以获得目标音乐的音乐描述语义特征;音乐描述语义特征为目标音乐的描述文本的语义特征;以及将目标音乐的音乐描述语义特征输入大语言模型模块,以得到目标音乐的音效调节参数。采用本方法不需要用户手动选择音效调节方式,并且调节的参数可以根据目标音乐确定得到,因此可以提高音效调节的效果。
技术关键词
多模态
语义特征
音频特征
编码器模块
音乐播放场景
音效调节方法
投影模块
文本
样本
大语言模型
参数
终端
关键词
计算机设备
计算机程序产品
处理器
系统为您推荐了相关专利信息
材料特性参数
多工位协同
材料特性识别
力控制模块
多光谱成像系统
采集分析方法
音频特征
移动终端
抑郁
机器学习模型
偏心检测方法
多模态特征
融合特征
一维卷积神经网络
深度学习模型
皮瓣移植术
监测贴片
数据处理单元
血氧传感器
丙烯酸酯压敏胶
代码摘要生成方法
多模态特征融合
语句
注意力机制
摘要生成系统