VEM-Token声乐情绪多模态token化歌声和伴奏深度学习方法

正文

推荐专利

申请号：CN202510609148

申请日期：2025-05-13

公开号：CN120126506B

公开日期：2025-07-18

类型：发明专利

摘要

VEM‑Token声乐情绪多模态token化歌声和伴奏深度学习方法，是区别于现有的人工智能将信息分割成文字化的token词元后，再进行识别的方法。本发明将声乐文件进行频谱化，检测节拍，按照声乐节拍将频谱化的声乐文件分割成VEM‑Token序列，按照歌词、歌声、伴奏、歌者情绪、伴奏情绪、视频、图像等多模态，建立VEM坐标系、VEM函数和VEM库，进行VEM‑Token识别，分离出歌声流和伴奏流，依据声乐专家，对声乐样本进行多模态的情绪评分，采用监督学习和深度学习算法获得VEM参数，学习获得声乐样本的多模态情绪。对于与其它声乐作品，能够识别声乐多模态情绪、输出歌词谱、VEM‑Token歌声谱、VEM‑Token伴奏谱和VEM‑Token乐谱。接入包括常用大模型等AI系统，开发成能听歌会识谱的声乐智能体Agent。

技术关键词

声乐卷积循环神经网络标记序列坐标系贝叶斯模型深度学习方法自然语言自定义函数样本动态包络线乐器五线谱多模态情绪刻度多声道离散小波变换

系统为您推荐了相关专利信息

基于多向声呐的水下三维重建与声纳位姿联合优化方法

联合优化方法坐标系运动捕捉系统声呐回波

一种智慧楼宇配电分布式控制方法及系统

分布式控制方法智慧楼宇节点冗余周期误差

一种基于深度学习的早期众工艺角时序预测方法、电子设备及存储介质

时序预测方法序列特征双向长短期记忆网络时序预测模型综合工具

基于环卫任务分布的环卫机器人调度方法、装置及设备

环卫机器人卷积网络模型预测控制模型垃圾数据

基于多模态数据分析压力管道健康状态评估系统及方法

定点监测装置多模态数据分析健康状态评估方法压力管道健康状态评估系统

VEM-Token声乐情绪多模态token化歌声和伴奏深度学习方法

站点导航

APP 下载