音乐流派分类的研究发源于国外,其中最具有代表意义的音乐流派分类方法是由Georg Tzanetakis等人于2002年提出。主要的算法可以分为三个步骤:特征提取、特征选择和分类过程。[ ]在对10种音乐流派的分类中获得了61%的准确率。43213
与国外相比,国内在音乐流派分类方面的研究起步较晚。杨翠丽教授等人提出的音乐流派分布特征结合高层音乐节奏特征的RhythmNNVote机制,在七个流派的数据集的实验中,获得了71%的正确率。[ ]甄超教授等人选择了频谱中心值、截止衰减频率等78维的特征向量,配合音乐的语义特征,在八种音乐流派的分类中获得81%的正确率。[ ]
国际音频检索评测大赛(Music Information Retrieval Evaluation exchange, MIREX)是国际最权威音频检索评测大赛。[ ]其中一项任务是音乐流派分类。图1.1是2015年该项目各参赛小组成绩。图1.2为各参赛小组每个流派分类正确率论文网。
各流派分类正确率
可以看出音乐流派分类的正确的在75%左右,具体每个流派的分类正确率也不尽相同。MIREX已经持续举办多年,音乐流派分类项目的成绩虽然在逐渐提升,但进展缓慢。
参考文献
[ ] 王睿。 数字音乐时代的音乐产业现状分析[J]。 商场现代化, 2007(10Z):253-254。
[ ] 蔡巍, 刘玉照。 基于内容检索多媒体数据库的构建[J]。 中国图书馆学报, 2000, 26(3):54-58。
[ ] Tzanetakis G, Cook P。 Musical genre classification of audio signals[J]。IEEE Transactions on Audio,
Speech, And Language Processing, 2002, 10(5):293-302。
[ ] 杨翠丽, 郭昭辉, 武港山。 基于改进投票机制的音乐流派分类方法研究[J]。 计算机工程, 2008, 34(9):213-215。
[ ] 甄超, 郑涛, 许洁萍。 基于音乐语义信息的音乐流派分类研究[C]// 全国信息检索学术会议。 2009。
[ ] MIREX2015 Results。 [Online]。 Available: www。music-ir。org/mirex/wiki /MIREX_HOME?
[ ] 冯涛, 韩纪庆。 基于听觉特性的音频水印能量估计及自适应嵌入算法研究[J]。 声学学报:中文版, 2006, 31(1):48-54。
[ ] 王志丹。 多媒体数据压缩技术[J]。 科技资讯, 2013(33):31-31。
[ ] 陈国明, 赵力, 邹采荣。 一种基于短时谱估计和人耳掩蔽效应的语音增强算法[J]。 电子与信息学报, 2007, 29(4):863-866。
[ ] 宋知用。 MATLAB在语音信号分析与合成中的应用[M]。 北京航空航天大学出版社, 2013。
[ ] Cortes C, Vapnik V。 Support vector machines[J]。 Machine Learning, 1995, 2(1):1-28。
[ ] 邓乃扬 田英杰。 数据挖掘中的新方法--支持向量机[M]。 科学出版社发行处出版社, 2005。
[ ] 瓦普尼克。 统计学习理论[M]。 电子工业出版社, 2004。
[ ] Vapnik V。 Estimation of Dependences Based on Empirical Data: Springer Series in Statistics (Springer Series in Statistics)[J]。 1982。
[ ] 李航。 统计学习方法[M]。 清华大学出版社, 2012。
[ ] 瓦普尼克。 统计学习理论的本质[M]。 清华大学出版社, 2000。
[ ] 克里斯蒂亚尼尼。 支持向量机导论[M]。 电子工业出版社, 2004。
[ ] 何灵敏。 支持向量机集成及在遥感分类中的应用[D]。 浙江大学, 2006。
[ ] Platt J。 Using sparseness and analytic QP to speed training of support vector machines[J]。 Neural Information Processing Systems, 1999:557--563。
[ ] Joachims T。 Estimating the Generalization Performance of an SVM Efficiently[J]。 2000。
[ ] Zhang X, Ke H。 ALL/AML cancer classification by gene expression data using SVM and CSVM approach[J]。 2000, 11:237-239。