摘要
本发明属于情感音乐生成技术领域,具体涉及一种基于情感识别的跨模态音乐自动生成系统及方法,其方法步骤为:通过信号采集单元同步采集用户面部表情、语音音调及ECG生理信号;通过多模态情感识别模型对采集到的信息进行处理,以获取VAD三维连续情感向量,将VAD三维连续情感向量输入音乐生成模块,通过音乐生成模块中的情感自编码器与音乐自编码器构建共享跨模态潜在空间;采用对比学习损失函数约束情感‑音乐在潜在空间中的一致性;基于Mus‑Decoder生成MIDI格式的音乐文件。本系统能够充分的结合面部表情、语音音调和ECG生理信号多模态的方式,生成与用户当前情绪相匹配的音乐,达到情感语义一致。
技术关键词
音乐自动生成方法
跨模态
多模态情感识别
音乐自动生成系统
记忆系统
注意力机制
信号采集单元
变换器
前馈神经网络
编码器
音乐生成技术
模块
面部
生理
语音
元素
视觉
系统为您推荐了相关专利信息
电商交易系统
大数据技术
深度残差神经网络
生成设备
定价模块
数据模型生成方法
强化学习技术
模态特征
可解释人工智能
记忆
机器人系统
子模块
传感器采集设备
多模态数据采集
计算机程序产品