关键词:
琵琶
声学品质评价
音符识别
BP神经网络
摘要:
乐器声学品质评价研究有助于民族乐器的传承、发展和推广,对于乐器质量的改良起到至关重要的作用,并推动乐器制造业以及相关文化产业的发展。音符识别技术在乐器调音、计算机自动识谱、音乐数据库检索和电子音乐合成中有着非常重要的应用价值。在乐器声学品质主观评价研究中,由于个人的音乐素养、生理状态、评价环境等因素影响,导致评价结果因人、因环境而异,不能客观全面的反映乐器声学品质;以及在音符识别研究中存在估计音高与标准频率很难一一对应、可识别音高的范围窄、识别过程不鲁棒和识别率低等问题。本文针对以上问题,以琵琶为例,开展了基于人工神经网络的声学品质评价及其音符识别研究。针对乐器声学品质评价,本文以乐器主观评价标准为基础,以获取琵琶声学品质主观评价结果为标准,建立了含有144个琵琶乐音信号的实验样本音频库;提取相关系数(CC)、常数Q变换(CQT)系数和Mel频率倒谱系数(MFCC)等乐音信号的特征;将单一特征MFCC与CQT以及其他四种组合特征参数作为神经网络的训练输入,主观评价结果作为监督网络学习的目标标签,最终形成琵琶声学品质评价优化模型。针对音符识别,以标准音为基础,建立了 25种音符的3600个琵琶音符信号实验样本音频库,与声学品质评价相类似,提取CQT和MFCC音符信号特征,将单一特征和组合特征作为Softmax回归BP神经网络多分类识别器的输入;标准音的分类编码作为监督网络学习的目标标签,最终形成琵琶音符识别优化模型。实验结果表明:组合特征(MFCC+CQT+CC)最大程度的表征了琵琶声学品质,可达到与主观评价相一致的评价效果,该评价方法是非常新颖且具有可行性。利用Softmax回归的BP神经网络多分类识别器实现音符识别时,组合特征(MFCC+CQT)识别效果最佳,可实现从低音到高音的25种音符的高精度识别,平均识别准确率达95.6%;与其他识别算法相比,该识别算法具有受限条件少、识别音符种类多以及识别率高的优点。