專利名稱:分析數字音樂音頻信號的方法
技術領域:
本發明涉及音樂音頻信號的自動分析,更具體地,涉及數字音頻音樂信號的自動分析。
特別地,根據權利要求1和17的前序部分,本發明分別涉及用于分析音樂音頻信號,以提取表示音頻音樂信號的信息內容的一組特征的音樂音頻表示方法和設備。
下面解釋在隨后的說明中所用的一些術語。這些術語中的某些是本領域通常使用的,還有些術語是為表達本發明的實施例所創造的。
如這里所使用的,以下的術語適用于表示 音高(pitch) -感知到的聲音的基本頻率。音高與單個(可能是孤立的)聲音相關聯,且音高是即刻的(即,音高的感知大致與聲音本身一樣長,在音樂信號中通常持續 200 500ms)。在下表1中,將鋼琴的整個音域(register)中的音高與其在假定標準調音情況下的相應的基本頻率(赫茲)相關聯,即,音高A3與440Hz的基本頻率相對應。
權利要求
1.一種音樂音頻分析方法,用于分析數字音樂音頻信號O)以提取所述數字音樂音頻信號(2)包含的和弦族簡檔(CFP)集,所述音樂音頻分析方法包括以下步驟a)對音樂音頻信號( 應用第一算法(4),以提取表示所述音樂音頻信號O)的音調上下文的第一數據(5);以及b)對所述第一數據( 應用第二算法(6),以提供表示所述第一數據( 包含的音調中心(Tc)的第二數據(7)。
2.根據權利要求1所述的音樂音頻分析方法,其特征在于,所述第一算法包括以下步驟al)識別(10)所述音樂音頻信號O)中的音符開始的序列,以定義多個峰(pl,p2, p3,...,pi)的時間位置;a2)將所述音樂音頻信號( 劃分成具有持續時間(T)且分別包含所述多個峰(pl, p2,p3,· · ·,pi)之一的多個音頻片段(s-on-1,s-on-2,s-on-3,· · ·,s-on-i);a3)對處于預定的子持續時間⑴內的各音頻片段(s-on-1,s-on-2, s-on-3,..., s-on-i)進行頻率分析,以獲得多個譜片段(sp-1,sp-2, sp-3, sp_i),其中,所述子持續時間(t)的長度小于所述持續時間(T)的長度。
3.根據權利要求2所述的音樂音頻分析方法,其特征在于,所述第一算法還包括以下步驟a4)利用計算網絡(12)處理所述多個譜片段(sp-1,sp-2, sp-3, . . .,sp-i)以提供所述第一數據(5),所述第一數據( 包含用于描述和弦類型/音高集合對的多個向量(vl, v2, v3, ... , vi),其中,所述多個向量(vl,v2, v3, ... , vi)分別與各音頻片段(s-on-l, s-on-2, s-on-3,…,s-on-i)相對應。
4.根據權利要求3所述的音樂音頻分析方法,其特征在于,利用訓練過的機器學習算法來實現所述計算網絡(12)。
5.根據權利要求4所述的音樂音頻分析方法,其特征在于,分兩個步驟來訓練所述訓練過的機器學習算法(12)-第一步驟,使用少量的手工標記訓練數據(1 進行有監督的訓練;以及-第二步驟,使用大的無標記訓練數據集(14)進行無監督的訓練。
6.根據權利要求5所述的音樂音頻分析方法,其特征在于,進行所述第二步驟,以優化在所述第一步驟后獲得的訓練過的機器學習算法(12)的權重(ω)集。
7.根據權利要求3所述的音樂音頻分析方法,其特征在于,所述第一算法在進行所述頻率分析的步驟之后還包括以下步驟a5)利用滑動平均對所述多個譜片段(sp-1, sp-2, sp-3, · · ·,sp-i)進行濾波,以強調所述多個譜片段(sp-1, sp-2, sp-3, . . . , sp-i)各自的峰(pl,,p2,,p3,...,pi,)。
8.根據權利要求3所述的音樂音頻分析方法,其特征在于,分別針對在兩個連續的檢測到的片段之間的多個片段進行所述步驟a4)。
9.根據權利要求2至8中的任一項所述的音樂音頻分析方法,其特征在于,僅在所述子持續時間(t)內進行所述頻率分析,所述子持續時間(t)在250 350毫秒的范圍內。
10.根據權利要求1 9中的任一項所述的音樂音頻分析方法,其特征在于,所述第二算法包括以下步驟bl)提供具有第一預定持續時間(Tl)、包含構成所述第一數據(5)的第一組(gl)多個向量的第一窗(《1);b2)詳細描述所述窗(wl)中包含的所述第一組(gl)多個向量,從而估計表示所述第一窗(《1)包含的本地音調中心的第一音調上下文(Tcl);b3)提供具有第二預定持續時間(1 的第二窗(^),所述第二窗(W)是所述第一窗 (wl)偏移了預定的偏移時間(Ts)且相對于所述第一窗(wl)有重疊的偏移窗,所述第二窗 (w2)包含第二組(g2)多個向量;b4)計算所述第二窗(W)包含的所述第二組(g》多個向量,從而估計表示所述第二窗 (w2)包含的本地音調中心的第二音調上下文(Tc2);b5)詳細描述所述第一窗(wl)的音調上下文(Tcl)和所述第二窗(W)的音調上下文 (Tc2),以生成所述第二數據(7),所述第二數據(7)表示所述第一數據( 的音調中心的演變。
11.根據權利要求10所述的音樂音頻分析方法,其特征在于,所述第二算法還包括以下步驟b6)重復步驟b3) b5)以限定其它的窗(wi),其中,所述其它的窗(wi)分別包含用于估計包含在所述第一數據(5)中的音調上下文(Tc)的向量組(gi)。
12.根據權利要求10所述的音樂音頻分析方法,其特征在于,將所述第一預定持續時間(Tl)設置在25 35秒的范圍內,更優選地,設置為約30秒。
13.根據權利要求10所述的音樂音頻分析方法,其特征在于,將所述預定的偏移時間 (Ts)設置在10 20秒的范圍內,更優選地,設置為約15秒;所述第二預定持續時間0 在所述第一預定持續時間(Tl)和預定的偏移時間(Ts) 的差與所述第一預定持續時間(Tl)之間的范圍內變化。
14.根據權利要求10所述的音樂音頻分析方法,其特征在于,利用多層感知器來實現步驟b5)。
15.根據權利要求1 14中的任一項所述的音樂音頻分析方法,其特征在于,所述音樂音頻分析方法還包括步驟c)對作為所述第二數據(7)的函數的所述第一數據( 應用第三算法(8),以提供表示所述音樂音頻信號O)的特征的特征集(CFP)。
16.根據權利要求15所述的音樂音頻分析方法,其特征在于,所述第三算法(8)包括以下步驟將所述第一數據( 轉置為基準音高,以使得所述第一數據( 不變。
17.一種計算機程序產品,包含用于分析音樂音頻信號以至少提取表示音樂音頻信號的內容的特征集的程序,所述計算機程序產品包含以下步驟a)對音樂音頻信號( 應用第一算法(4),以提取表示所述音樂音頻信號O)的音調的第一數據(5);以及b)對所述第一數據( 應用第二算法(6),以提供表示所述第一數據( 包含的音調中心的第二數據(7)。
18.一種用于分析音樂音頻信號以至少提取表示音樂音頻信號的內容的特征集的設備,所述設備包括-用于接收數字音樂音頻信號O)的輸入端;-用于處理所述數字音樂音頻信號O)的處理器單元(18);以及-存儲了與相似的或不相似的音樂事件有關的表示的數據庫(19), 其中,所述處理器單元(18)被配置為根據權利要求1 16中的任一項所述的音樂音頻分析方法,來提取表示數字音樂音頻信號O)的內容的特征集。
全文摘要
本發明涉及一種音樂音頻表示方法,用于分析音樂音頻信號(2)以提取音樂音頻信號(2)包含的和弦族簡檔(CFP)集,所述方法包含以下步驟a)對音樂音頻信號(2)應用第一算法(4),以提取表示音樂音頻信號(2)的音調的第一數據(5);以及b)對所述第一數據(5)應用第二算法(6),以提供表示所述第一數據(5)包含的音調中心的第二數據(7)。
文檔編號G10H1/38GK102187386SQ200880131589
公開日2011年9月14日 申請日期2008年10月15日 優先權日2008年10月15日
發明者L·費恩斯特倫, R·萊昂納蒂, N·斯卡林杰拉 申請人:繆西卡股份公司