一种基于情感识别的跨模态音乐自动生成系统及方法

正文

推荐专利

申请号：CN202510842977

申请日期：2025-06-23

公开号：CN120431891A

公开日期：2025-08-05

类型：发明专利

摘要

本发明属于情感音乐生成技术领域，具体涉及一种基于情感识别的跨模态音乐自动生成系统及方法，其方法步骤为：通过信号采集单元同步采集用户面部表情、语音音调及ECG生理信号；通过多模态情感识别模型对采集到的信息进行处理，以获取VAD三维连续情感向量，将VAD三维连续情感向量输入音乐生成模块，通过音乐生成模块中的情感自编码器与音乐自编码器构建共享跨模态潜在空间；采用对比学习损失函数约束情感‑音乐在潜在空间中的一致性；基于Mus‑Decoder生成MIDI格式的音乐文件。本系统能够充分的结合面部表情、语音音调和ECG生理信号多模态的方式，生成与用户当前情绪相匹配的音乐，达到情感语义一致。

技术关键词

音乐自动生成方法跨模态多模态情感识别音乐自动生成系统记忆系统注意力机制信号采集单元变换器前馈神经网络编码器音乐生成技术模块面部生理语音元素视觉

系统为您推荐了相关专利信息

基于大数据技术的电商交易系统

电商交易系统大数据技术深度残差神经网络生成设备定价模块

一种基于大模型的科创大数据模型生成方法及系统

数据模型生成方法强化学习技术模态特征可解释人工智能记忆

一种用于医学报告结构化信息提取与隐私保护的处理方法

图像表格医学报告 JSON结构

基于音频文本跨模态多损失融合网络的电力设备异常检测方法

注意力编码器跨模态网络计算机程序指令文本

一种基于多模态大模型的训考机器人系统、设备及计算机程序产品

机器人系统子模块传感器采集设备多模态数据采集计算机程序产品

一种基于情感识别的跨模态音乐自动生成系统及方法

站点导航

APP 下载