一种连续情感引导的图像到音乐生成方法

正文

推荐专利

一种连续情感引导的图像到音乐生成方法

申请号：CN202510008486

申请日期：2025-01-03

公开号：CN119943010A

公开日期：2025-05-06

类型：发明专利

摘要

本申请属于人工智能技术领域。本申请提供一种连续情感引导的图像到音乐生成方法。本公开实施例提出了一个端到端框架，直接从自然图像生成纯音乐，无需依赖图像标题或歌词。考虑到任务本身的模糊性和主观性，引入情感作为指导跨模态转换过程的媒介。提出了一个即插即用模型，利用对比学习，将图像转化为音乐作品。它减少了具有相似情感的图像和音乐之间的距离，以及同一模态内相似感情的图像或音乐之间的距离，这对于处理连续值标签是有效的。经过本方法生成的音乐与图像情感关联度高，且流畅质量高，实用性强。

技术关键词

音乐生成方法图像嵌入样本图像投影器音乐特征表达式跨模态生成图像特征重构编码器网络人工智能技术超参数解码器锚点数据

系统为您推荐了相关专利信息

车辆的热管理系统控制方法、装置、车辆、介质及程序产品

控制策略管理系统控制方法强化学习模型热管理系统冷却风扇

一种考虑源荷不确定性的市场出清模型构建方法

模型构建方法机组优化调度模型多时间尺度风光

基于音标和语义的语音生成方法及语音生成模型训练方法

语音生成模型语音生成方法文本数据语义特征

一种考虑微震轮廓系数与谱图聚类的主震群智能识别方法

微震事件轮廓系数智能识别方法 DBSCAN算法矩阵

一种基于注意力机制的低轨卫星边缘计算卸载方法

卸载策略注意力机制优化网络参数卸载方法低轨卫星通信技术

一种连续情感引导的图像到音乐生成方法

站点导航

APP 下载