摘要
本发明公开了一种面向音符粒度的自动视唱音准评分方法及终端,对视唱音频进行音符分割后,根据音符分割结果提取视唱音符序列,通过将视唱音符序列和曲谱音符序列进行音高扩充和对齐,并计算序列相似度,能够提高相似度计算的鲁棒性;通过多维声学特征的提取,能够提高分析全面性;进而根据计算得到的多个序列相似度计算音频总体相似度,通过将多维声学特征进行训练计算得到音频音准分,根据音频音准分和音频总体相似度的比例数值,调整序列相似度,以得到每个音符分割结果的得分。演唱是与已经对齐的曲谱做比较,所以本方法的评分方法同样适用于演唱场景。以此方式,将音准评分细化到音符粒度,提高音准评分准确性,并减少人工评分成本。
技术关键词
评分方法
序列
音频
声学特征
动态时间规整算法
网络
特征提取模块
处理器
终端
直方图
图像
存储器
鲁棒性
训练集
数值
切片
数据
场景
标识
系统为您推荐了相关专利信息
曲面幕墙
幕墙板块
隔热幕墙
特征值
Revit软件
文本识别模型
字符
语音活动检测系统
混合语音识别
标点预测方法