摘要随着网络技术和多媒体技术的迅速发展,网络上的数字音频也海量增加,基于标签的搜索已经不能满足用户的需求,有必要研究更加智能化的搜索方式。本文主要研究了基于内容的音频检索方式,以乐器演奏或人声哼唱的音乐数据作为分析对象,通过加汉明窗的离散傅里叶变换提取音乐的音高、音长信息,研究了人耳与计算机对音乐相似度辨识的不同之处,对几种主流的匹配算法进行了比较,根据人声哼唱的特征,优化了动态时间规整(DTW)算法,并设计了新的匹配算法,并实现了检索系统,获得和观察了实验数据,得出了新算法在匹配准确率和效率上较之原有算法都有所提升的结论。61632
毕业论文关键词 音乐识别 特征提取 基于内容
毕业设计说明书(论文)外文摘要
Title Design and Development of a Content-Based Music Retrieval System
Abstract With the rapid development of network and multi-media technology, large amounts of media information, music information in particular, could be attained online. On account of the rapid acceleration of audio data, searching these information fast and accurately based on content but not label has become one of the main problem of search engine in next generation. In this paper we focus on extracting pitch parameters and durations, comparison and improvement among several content-based audio retrieval algorithms, and have developed a system to verify the conclusion.
Keywords music recognition feature extraction content-based
1 绪论 1
1.2 研究意义 2
1.3 本文的行文结构 2
2 音乐旋律的要素和人耳感知音乐的机理 3
2.1 声音的三要素:音调、响度、音色 3
2.2 音乐的旋律特征 4
2.3人耳感知音乐的机理 6
3 音频信号的特征提取 8
3.1 音频文件转换为时域波形图的表现形式 8
3.2 基音提取 8
4 音乐序列的相似度匹配算法比较 12
4.1 对序列的进一步加工处理 12
4.2 多种匹配算法的比较及优化 13
5 检索系统的设计与实现 17
5.1 Midi和PcmWave波形文件的存储格式 17
5.2 系统设计及实现效果图 22
5.3 实验结果及其分析 25
6 总结和展望 32
结论 34
致谢 35
参考文献 36
1 绪论
1.1 研究意义与背景
随着多媒体技术的发展,越来越多的音乐以数字媒介的形式流传和存储在数据库和网络中。从众多数字媒介中方便快捷的搜寻音乐也越来越成为研究人员的关注方向。由于互联网上的音乐很多都没有标注信息,而有标注信息的音乐,它们所带有的标签信息往往会不准确:例如,对于“风格”这个标签,往往由标注者的主观性判断决定;而对于“音质”这个标签,则很难用语言文字表述清楚。如何对海量的无标注信息或标注信息不准确的数字音频进行有效检索,渐渐成为下一代搜索引擎关注的技术热点之一。因此,为了能够快速、准确、高效查询音乐信息,除了希望能够通过传统的基于文本的方式检索曲名等信息以获得所需乐曲外,还需要能够对音乐本身的特征进行检索。也就是基于音乐本身特征的检索方式,在检索者不知道曲名、作曲者或演唱者名字的情况下也能快速的检索到乐曲。
本课题针对包括各种类型的乐器以及人声的哼、唱在内的不同音色的音乐与数据库中已经划分好的乐句进行匹配,也可以对音频文件中不同时间点的响度进行数据分析,判断过零率的高低,做加窗傅里叶变换以生成频率基音序列,并转换成Midi格式的数字音乐文件。 由于低复杂度的匹配算法能够保证在数据量非常大的情况下,也可以在理想的时间内得到匹配结果,因此该软件可推广应用于搜索引擎中基于内容的音乐检索,并在KTV智能评分等娱乐项目、语音机器人等专业领域里有其独特的实用性。 DTW算法音乐检索系统设计与实现:http://www.751com.cn/jisuanji/lunwen_67480.html