毕业论文

打赏
当前位置: 毕业论文 > 电子通信 >

基于旋律的音乐检索系统设计与实现(7)

时间:2017-01-17 18:48来源:毕业论文
(1)如果在MIDI文件里标明了哪个轨道是主轨道,则选择主旋律轨道,忽略其它轨道。该方法虽然准确,但主要问题在于,并不是每个MIDI文件都标明了主旋律


   (1)如果在MIDI文件里标明了哪个轨道是主轨道,则选择主旋律轨道,忽略其它轨道。该方法虽然准确,但主要问题在于,并不是每个MIDI文件都标明了主旋律轨道。
(2)保留所有轨道,对所有轨道进行处理。该方法虽然不会遗漏主轨道旋律,但由于包含的旋律过多,匹配的速度大大下降。而且其它轨道的旋律会影响对主旋律的匹配,导致匹配的准确性下降。
在实际中,系统采用的方法是:首先去掉音符数量较少的轨道,因为这样的轨道不可能表达主旋律。然后将剩余的轨道数据合并到一起,当出现同一个!!寸刻有多个音符的时候,只选择那个音强最强的音符。
3.5 主旋律的特征提取
(1)细化轮廓特征
许多文献对音乐的记忆特性进行了研究,旋律的变化比精确的旋律更易于记忆。旋律的变化是指相邻音符的音高和音长变化。人们很难准确的把握每个音符的音高和持续时间,但是对音高和音长的变化却能准确的哼唱出来。然而许多研究中将相邻音符音高和音长的变化分为U, D, R三种情况,误差很大。因此系统中对旋律轮廓进行了细分,使用5级轮廓表达音乐的旋律,即:上升、跳升、下降、跳降和重复,并以“u;U;d;D; R”表示。通过对MIDI音乐进行统计,相邻音符的音阶差大多在[-2,2]之间,音长比大约在[[0.8,1.2]之间。在实际中发现,使用3级轮廓图的系统将会返回较多的结果,需要较长的哼唱时间,而使用5级轮廓图既能够清楚的区分旋律的变化又避免了返回过多的检索结果,取得了比较理想的效果。可能表达主旋律。然后将剩余的轨道数据合并到一起,当出现同一个时刻有多个音符的时候,只选择那个音强最强的音符。
其中M为音阶差,N为音长的比值。
(2)音长计算方式
    采用“音符起点一音符起点”是指从一个音符的起始时刻到下一个音符的起始时刻之间的间隔。实验中发现:人们在哼唱的时候,对于每个音符的开始时间把握的很好。而且,当节奏比较慢或者某些音符比较长时,哼唱者并没有耐心去唱完整个音符,经常会提前结束。因此,系统将“音符起点一音符起点”作为每个音符的长度,大大提高了检索的准确程度。
3.6 特征文件的生成
    考虑到处理速度的原因,MIDI数据库文件并不是在每次哼唱的时候进行处理的,而是预先处理成特征文件,当匹配检索时再加以调用。因为如果每次哼唱的时候都处理一遍MIDI数据库文件,会花费很多的时间,而且会重复处理同一首歌;而如果预先生成特征文件,每次匹配的时候只要将哼唱歌曲的特征和特征文件中的特征进行匹配即可。当有新的MIDI歌曲加入数据库时,只要对这些新的MIDI进行处理并加入到原来的特征文件即可。
3.7 本章小结
本章首先讨论了MIDI文件格式作为数据库音频储存格式的优点,然后进一步对MIDI音频文件格式作了详细的分析,最后介绍了从MIDI中提取旋律特征的具体方法和如何生成特征文件。
4 输入音频旋律的特征提取
4.1 音频信号的初步处理
4.1.1 信号的预加重
对于哼唱输入的音乐信号,由于其平均功率谱受到声门激励和口鼻辐射的影响,高频端大约在800Hz以上按6dB/倍频程跌落,以至于音乐信号的频谱中,频率越高相应的成分越小。因此要对音乐信号进行预加重处理来提升高频部分。在实际中,预加重处理是通过具有6dB/倍频程的提升高频特性的预加重数字滤波器来实现的。它是一阶的数字滤波器,如公式3.4所示:
                                                                            (4.1) 基于旋律的音乐检索系统设计与实现(7):http://www.751com.cn/tongxin/lunwen_2379.html
------分隔线----------------------------
推荐内容