摘要
本发明公开了一种基于多模型协作的图生音乐的方法及系统,该方法以人类的语言和文字为核心基础,通过文生文大模型、文生音乐大模型、图生文大模型等多种大模型的协同工作,实现输入图片直接生成音乐的功能。本发明旨在降低音乐创作的门槛,使得普通用户也能轻松创作音乐,推动UGC(User Generated Content)时代的到来。此外,本发明还包括相应的APP、电脑网页和微信小程序,为用户提供便捷的多途径使用方式。
技术关键词
音乐
解析算法
协作算法
多模型
图片
序列
频域滤波器
长短期记忆网络
输入输出接口
展现系统
深度学习技术
图像
变换器
情感特征
编辑
注意力机制
数据格式
输入模块
输出模块
系统为您推荐了相关专利信息
检索算法
音乐特征提取
数据
推荐方法
计算机可执行指令