一种连续情感引导的图像到音乐生成方法

AITNT
正文
推荐专利
一种连续情感引导的图像到音乐生成方法
申请号:CN202510008486
申请日期:2025-01-03
公开号:CN119943010A
公开日期:2025-05-06
类型:发明专利
摘要
本申请属于人工智能技术领域。本申请提供一种连续情感引导的图像到音乐生成方法。本公开实施例提出了一个端到端框架,直接从自然图像生成纯音乐,无需依赖图像标题或歌词。考虑到任务本身的模糊性和主观性,引入情感作为指导跨模态转换过程的媒介。提出了一个即插即用模型,利用对比学习,将图像转化为音乐作品。它减少了具有相似情感的图像和音乐之间的距离,以及同一模态内相似感情的图像或音乐之间的距离,这对于处理连续值标签是有效的。经过本方法生成的音乐与图像情感关联度高,且流畅质量高,实用性强。
技术关键词
音乐生成方法 图像嵌入 样本 图像投影器 音乐特征 表达式 跨模态 生成图像特征 重构 编码器 网络 人工智能技术 超参数 解码器 锚点 数据
系统为您推荐了相关专利信息
1
车辆的热管理系统控制方法、装置、车辆、介质及程序产品
控制策略 管理系统控制方法 强化学习模型 热管理系统 冷却风扇
2
一种考虑源荷不确定性的市场出清模型构建方法
模型构建方法 机组 优化调度模型 多时间尺度 风光
3
基于音标和语义的语音生成方法及语音生成模型训练方法
语音生成模型 语音生成方法 文本 数据 语义特征
4
一种考虑微震轮廓系数与谱图聚类的主震群智能识别方法
微震事件 轮廓系数 智能识别方法 DBSCAN算法 矩阵
5
一种基于注意力机制的低轨卫星边缘计算卸载方法
卸载策略 注意力机制 优化网络参数 卸载方法 低轨卫星通信技术
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号