摘要
VEM‑Token节拍捕捉和对齐模型建构的方法,是基于VEM‑Token声乐情绪多模态模型方法,采用音乐节拍来切分声乐文件为VEM‑Token词元的深化创新。本方法核心是建立声乐文件的节拍模型、节拍捕捉模型和节拍对齐模型,前者将样本声乐文件通过多重滤波器分离歌声、伴奏声和情绪波动,在频谱格式文件中捕捉节拍的起点和终点,后者通过起点微调模型和终点微调模型,使得用户模仿文件与样本文件完成节拍对齐。采用包括节拍基础模型、谐波冲击、联合学习、谐波频率分层、动态时间规整等模型来捕捉节拍,采用基础模型、起点微调和终点微调、全程对齐校验、节拍编辑器、自由发挥节拍、重复对齐、通信接口协议等模型的构建,使得本方法适合接入Agent音乐智能体和AI音乐应用。
技术关键词
终点
声乐
指针
序列
双向通信协议
通信接口协议
样本
多重滤波器
音乐系统
动态时间规整
谐波
卷积循环神经网络
频率
乐器
时间差
隐马尔可夫模型
多模态
热力图
标记
系统为您推荐了相关专利信息
交通设施
车辆运动轨迹
交通特征
语义向量
交通智能疏导方法
球员
交叉注意力机制
视频字幕生成方法
视觉特征
矩阵
归算方法
卫星测高数据
线性回归模型
序列
海洋测绘技术
电池
寿命预测方法
斜率数据
长短期记忆神经网络
阶段