摘要
本发明公开了一种钢琴音符识别方法及终端,对音频数据流依次进行强音检测和背景音检测,得到属于前景音的音频帧,将属于前景音的音频帧输入卷积神经网络中的特征提取模块进行特征提取,得到浅层特征,并将浅层特征分别输入卷积神经网络中的钢琴音检测模块和钢琴音高识别模块,得到钢琴音检测结果以及钢琴音高识别结果,有效滤除了音频数据流中的背景音,避免了背景音对后续识别的干扰,提高了识别算法的鲁棒性,且卷积神经网络不使用多个分级网络级联的方式,采用共用层次(即特征提取模块)+分支(即钢琴音检测模块和钢琴音高识别模块)的单神经网络的架构,复杂度较低,从而提高了识别精度,且降低了算法复杂度。
技术关键词
钢琴
音符识别方法
音频
频域特征
特征提取模块
识别模块
子帧
识别终端
复杂度
非线性
识别算法
序列
处理器
存储器
鲁棒性
噪声
级联
分支
系统为您推荐了相关专利信息
蓝藻水华预警
光学图像数据
监测设备
控制中心
低空飞行器
视频图像素材
关键帧
深度学习模型
匹配模块
特征提取模块
车灯灯罩
图像采集模块
特征提取模块
深度学习算法
输出模块
半监督学习
测向方法
协方差矩阵
后处理模块
阵列