摘要
本申请属于人工智能技术领域。本申请提供一种连续情感引导的图像到音乐生成方法。本公开实施例提出了一个端到端框架,直接从自然图像生成纯音乐,无需依赖图像标题或歌词。考虑到任务本身的模糊性和主观性,引入情感作为指导跨模态转换过程的媒介。提出了一个即插即用模型,利用对比学习,将图像转化为音乐作品。它减少了具有相似情感的图像和音乐之间的距离,以及同一模态内相似感情的图像或音乐之间的距离,这对于处理连续值标签是有效的。经过本方法生成的音乐与图像情感关联度高,且流畅质量高,实用性强。
技术关键词
音乐生成方法
图像嵌入
样本
图像投影器
音乐特征
表达式
跨模态
生成图像特征
重构
编码器
网络
人工智能技术
超参数
解码器
锚点
数据
系统为您推荐了相关专利信息
控制策略
管理系统控制方法
强化学习模型
热管理系统
冷却风扇
模型构建方法
机组
优化调度模型
多时间尺度
风光
微震事件
轮廓系数
智能识别方法
DBSCAN算法
矩阵
卸载策略
注意力机制
优化网络参数
卸载方法
低轨卫星通信技术