專利名稱:對音頻信號編碼和解碼的方法和設備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號的編碼和解碼,更具體地講,涉及一種用于對音頻信號進行編碼和解碼以將在對音頻數(shù)據(jù)編碼或解碼時使用的碼本的大小最小化的方法和設備。
背景技術(shù):
隨著數(shù)字信號處理技術(shù)的發(fā)展,音頻信號主要作為數(shù)字數(shù)據(jù)被存儲和重放。數(shù)字音頻存儲器和/或重放裝置對模擬音頻信號進行采樣和量化,將模擬音頻信號變換為作為數(shù)字信號的脈沖編碼調(diào)制(PCM)音頻數(shù)據(jù),并將PCM音頻數(shù)據(jù)存儲在諸如壓縮盤(CD)、數(shù)字多功能盤(DVD)等的信息存儲介質(zhì)中,從而當用戶期望聽所述PCM音頻數(shù)據(jù)時,他/她可從所述信息存儲介質(zhì)重放數(shù)據(jù)。與密紋(LP)唱片、磁帶等上使用的模擬音頻信號存儲器和/ 或再現(xiàn)方法相比,數(shù)字音頻信號存儲器和/或再現(xiàn)方法極大地提高了聲音質(zhì)量并顯著地減小了由長存儲周期引起的聲音失真。然而,大量數(shù)字音頻數(shù)據(jù)有時造成存儲和發(fā)送問題。為了解決這些問題,使用用于減小數(shù)字音頻數(shù)據(jù)量的各種壓縮技術(shù)。由國際標準組織(ISO)起草的運動圖像專家組音頻標準和由Dolby開發(fā)的AC-2/AC-3技術(shù)采用使用心理聲學模型減小數(shù)據(jù)量的方法,這使得不論信號的特性如何數(shù)據(jù)量都能被有效地減小。通常,在變換和量化的音頻信號的編碼期間,對于熵編碼和解碼,已使用基于上下文的編碼和解碼。為此,需要基于上下文的編碼和解碼的碼本,從而需要大量存儲器。
發(fā)明內(nèi)容
本發(fā)明提供了一種對音頻信號編碼和解碼的方法和設備,在該方法和設備中,在將碼本大小最小化的同時可提高編碼和解碼的效率。根據(jù)本發(fā)明的一方面,提供了一種對音頻信號編碼的方法。該方法包括將輸入的音頻信號變換成頻域中的音頻信號;對頻域變換的音頻信號進行量化;當使用位平面編碼執(zhí)行編碼時,使用代表高位平面可具有的各碼元的上下文對量化的音頻信號執(zhí)行編碼。根據(jù)本發(fā)明的另一方面,提供了一種對音頻信號解碼的方法。該方法包括當對使用位平面編碼被編碼的音頻信號進行解碼時,使用被確定為代表高位平面可具有的各碼元的上下文對音頻信號進行解碼;對解碼的音頻信號進行逆量化;和對逆量化的音頻信號進行逆變換。根據(jù)本發(fā)明的另一方面,提供了一種對音頻信號編碼的設備。該設備包括變換單元,將輸入的音頻信號變換成頻域中的音頻信號;量化單元,對頻域變換的音頻信號進行量化;和編碼單元,當使用位平面編碼執(zhí)行編碼時,使用代表高位平面可具有的各碼元的上下文對量化的音頻信號執(zhí)行編碼。根據(jù)本發(fā)明的另一方面,提供了一種對音頻信號解碼的設備。該設備包括解碼單元,使用被確定為代表高位平面可具有的各碼元的上下文對使用位平面編碼被編碼的音頻信號進行解碼;逆量化單元,對解碼的音頻信號進行逆量化;和逆變換單元,對逆量化的音頻信號進行逆變換。
通過下面結(jié)合附圖對本發(fā)明示例性實施例進行的詳細描述,本發(fā)明的上述和其它特點和優(yōu)點將會變得更加清楚,其中圖1是示出根據(jù)本發(fā)明實施例的對音頻信號編碼的方法的流程圖;圖2示出根據(jù)本發(fā)明實施例的形成被編碼為分等級結(jié)構(gòu)的比特流的幀的結(jié)構(gòu);圖3示出根據(jù)本發(fā)明實施例的圖2所示的附加信息的詳細結(jié)構(gòu);圖4是根據(jù)本發(fā)明實施例的詳細示出圖1所示的對量化的音頻信號編碼的操作的流程圖;圖5是根據(jù)本發(fā)明實施例的用于解釋圖4所示的將多個量化的樣本映射到位平面上的操作的參考示圖;圖6是根據(jù)本發(fā)明實施例的示出上下文以解釋圖4所示的確定上下文的操作的參考示圖;圖7示出根據(jù)本發(fā)明實施例的用于對音頻信號進行Huffman編碼的偽碼;圖8是示出根據(jù)本發(fā)明實施例的對音頻信號解碼的方法的流程圖;圖9是根據(jù)本發(fā)明實施例的詳細示出圖8所示的使用上下文對音頻信號解碼的操作的流程圖;圖10是根據(jù)本發(fā)明實施例的對音頻信號編碼的設備的框圖;圖11是根據(jù)本發(fā)明實施例的圖10所示的編碼單元的詳細框圖;和圖12是根據(jù)本發(fā)明實施例的對音頻信號解碼的設備的框圖。
具體實施例方式下面將參照附圖來詳細描述本發(fā)明的示例性實施例。圖1是示出根據(jù)本發(fā)明實施例的對音頻信號編碼的方法的流程圖。參照圖1,在操作10,將輸入的音頻信號變換為頻域中的音頻信號。輸入作為時域中的音頻信號的脈沖編碼調(diào)制(PCM)音頻數(shù)據(jù),然后參考關(guān)于心理聲學模型的信息將其變換為頻域中的音頻信號。人可感知到的音頻信號的特性在時域中差異不大。相反,考慮到心理聲學模型,頻域中人可感知到的音頻信號的特性與人感知不到的音頻信號的特性之間的差異很大。因而,通過為每個頻帶分配不同數(shù)量的比特可以提高壓縮效率。在本發(fā)明的當前實施例中,使用修改的離散余弦變換(MDCT)將音頻信號變換到頻域。在操作12,對已經(jīng)變換為頻域中的音頻信號的音頻信號進行量化。基于相應的分級矢量(scale vector)信息對每個帶中的音頻信號進行標量量化以將每個帶中的量化噪聲強度減小到小于掩蔽閾值,并輸出量化的樣本,以使人感知不到音頻信號中的量化噪聲。在操作14,使用位平面編碼對量化的音頻信號編碼,在位平面編碼中,使用代表高位平面的各碼元的上下文。根據(jù)本發(fā)明,使用位平面編碼對屬于每層的量化的樣本編碼。圖2示出根據(jù)本發(fā)明實施例的構(gòu)成被編碼為分等級結(jié)構(gòu)的比特流的幀的結(jié)構(gòu)。參照圖2,通過將量化的樣本和附加信息映射到分等級結(jié)構(gòu)來對根據(jù)本發(fā)明的比特流的幀編碼。換句話說,所述幀具有包括低層比特流和高層比特流的分等級結(jié)構(gòu)。對每層所需的附加信息逐層編碼。存儲頭信息的頭區(qū)位于比特流的起始部分,層0的信息被打包,并且附加信息和編碼的音頻數(shù)據(jù)被存儲為層1至層N中的每層的信息。例如,附加信息2和編碼的量化的樣本2被存儲為層2的信息。這里,N是大于或等于1的整數(shù)。圖3示出根據(jù)本發(fā)明實施例的圖2所示的附加信息的詳細結(jié)構(gòu)。參照圖3,任意層的附加信息和編碼的量化的樣本被存儲為信息。在當前實施例中,附加信息包含Huffman 編碼模型信息、量化因子信息、聲道附加信息和其它附加信息。Huffman編碼模型信息表示用于對包含在相應層中的量化的樣本進行編碼或解碼的Huffman編碼模型的索引信息。量化因子信息將對包含在相應層中的音頻數(shù)據(jù)進行量化或逆量化的量化步長大小通知給相應層。聲道附加信息表示諸如middle/side (M/S)立體聲的關(guān)于聲道的信息。其它附加信息是指示是否使用M/S立體聲的標志信息。圖4是根據(jù)本發(fā)明實施例的詳細示出圖1所示的操作14的流程圖。在操作30,將量化的音頻信號的多個量化的樣本映射到位平面上。通過將所述多個量化的樣本映射到位平面上來將其表示為二進制數(shù)據(jù),并且以碼元為單位在對應于量化的樣本的層中允許的比特范圍內(nèi)按照從由最重要的比特(MSB)形成的碼元到由最不重要的比特(LSB)形成的碼元的順序,對所述二進制數(shù)據(jù)進行編碼。通過在位平面上首先對重要信息進行編碼然后對相對不重要的信息進行編碼來固定對應于每層的比特率和頻帶,從而減小被稱為“birdy effect”的失真。圖5是根據(jù)本發(fā)明實施例的用于解釋圖4所示的操作30的參考示圖。如圖5所示,當量化的樣本9、2、4和0被映射到位平面上時,以二進制形式,S卩,分別以1001b、0010b、 0100b和OOOOb表示它們。也就是說,在當前實施例中,位平面上作為編碼單元的編碼塊的大小為4X4。每個量化的樣本的相同順序的比特的集合被稱為碼元。由多個MSB msb形成的碼元為“1000b”,由下一多比特msb-1形成的碼元為“0010b”,由下一多比特msb-2形成的碼元為“0100b”,由多個LSB msb-3形成的碼元為“ 1000b”。再參照圖4,在操作32,確定代表位于將被編碼的當前位平面之上的高位平面的各碼元的上下文。這里,所述上下文是指編碼所需的高位平面的碼元。在操作32,代表高位平面的各碼元中具有包括三個或更多個“1”的二進制數(shù)據(jù)的碼元的上下文被確定為用于編碼的高位平面的代表碼元。例如,當高位平面的代表碼元的4 位二進制數(shù)據(jù)是“0111”、“1011”、“1101”、“1110”和“1111”之一時,可以看出,所述碼元中 “1”的數(shù)量大于或等于3。在這種情況下,代表高位平面的各碼元中具有包括三個或更多個 “1”的二進制數(shù)據(jù)的碼元的碼元被確定為上下文?;蛘?,代表高位平面的碼元中具有包括兩個“1”的二進制數(shù)據(jù)的碼元的上下文可被確定為用于編碼的高位平面的代表碼元。例如,當高位平面的代表碼元的4位二進制數(shù)據(jù)是“0011”、“0101”、“0110”、“1001”、“1010”和“1100”之一時,可以看出,所述碼元中“1” 的數(shù)量等于2。在這種情況下,代表高位平面的各碼元中具有包括兩個“1”的二進制數(shù)據(jù)的碼元的碼元被確定為上下文?;蛘?,代表高位平面的碼元中具有包括1個“1”的二進制數(shù)據(jù)的碼元的上下文可被確定為用于編碼的高位平面的代表碼元。例如,當高位平面的代表碼元的4位二進制數(shù)據(jù)是“0001”、“0010”、“0100”和“1000”之一時,可以看出,所述碼元中“1”的數(shù)量等于1。 在這種情況下,代表高位平面的各碼元中具有包括1個“1”的二進制數(shù)據(jù)的碼元的碼元被確定為上下文。圖6是示出上下文以解釋圖4所示的操作32的的參考示圖。在圖6的“步驟1” 中,“0111”、“1011”、“1101”、“1110”和“1111”之一被確定為代表具有包括三個或更多個 “1”的二進制數(shù)據(jù)的碼元的上下文。在圖6的“步驟2”中,“0011”、“0101”、“0110”、“1001”、 “1010”和“1100”之一被確定為代表具有包括兩個“1”的二進制數(shù)據(jù)的碼元的上下文, “0111”、“1011”、“1101”、“1110”和“1111”之一被確定為代表具有包括三個或更多個“1” 的二進制數(shù)據(jù)的碼元的上下文。根據(jù)現(xiàn)有技術(shù),必須對高位平面的每個碼元產(chǎn)生碼本。換句話說,當碼元包括4比特時,該碼元必須被劃分為16種類型。然而,根據(jù)本發(fā)明,一旦在圖6的“步驟2”以后確定了代表高位平面的碼元的上下文,那么由于碼元僅被劃分為7種類型,所以可減小所需碼本的大小。圖7示出用于對音頻信號進行Huffman編碼的偽碼。參照圖7,將使用“upper_ vector_mapping() ”來確定代表高位平面的多個碼元的上下文的代碼作為示例。再參照圖4,在操作34,使用確定的上下文對當前位平面的碼元進行編碼。具體地講,使用確定的上下文對當前位平面的碼元執(zhí)行Huffman編碼。用于Huffman編碼的Huffman模型信息,即,碼本索引如下表 權(quán)利要求
1.一種對音頻信號編碼的方法,該方法包括 將輸入的音頻信號變換成頻域中的音頻信號; 對頻域變換的音頻信號進行量化;和當使用位平面編碼執(zhí)行編碼時,使用代表高位平面可具有的各碼元的上下文對量化的音頻信號執(zhí)行編碼。
2.如權(quán)利要求1所述的方法,其中,使用上下文執(zhí)行編碼的步驟包括 將量化的音頻信號的多個量化的樣本映射到位平面上; 確定代表高位平面的各碼元的上下文;和使用確定的上下文對當前位平面的碼元執(zhí)行編碼。
3.如權(quán)利要求2所述的方法,其中,確定上下文的步驟包括有包括三個或更多個“ 1 ”的二進制數(shù)據(jù)的碼元的上下文。
4.如權(quán)利要求2所述的方法,其中,確定上下文的步驟包括有包括兩個“ 1,,的二進制數(shù)據(jù)的碼元的上下文。
5.如權(quán)利要求2所述的方法,其中,確定上下文的步驟包括有包括1個“ 1 ”的二進制數(shù)據(jù)的碼元的上下文。
6.如權(quán)利要求2所述的方法,其中,對當前位平面的碼元執(zhí)行編碼的步驟包括使用確定的上下文對當前位平面的碼元執(zhí)行Huffman編碼。
7.如權(quán)利要求2所述的方法,其中,對當前位平面的碼元執(zhí)行編碼的步驟包括使用確定的上下文對當前位平面的碼元執(zhí)行算術(shù)編碼。
8.—種記錄有用于實現(xiàn)權(quán)利要求1至7中的任何一個要求保護的方法的程序的計算機可讀記錄介質(zhì)。
9.一種對音頻信號解碼的方法,該方法包括當對使用位平面編碼被編碼的音頻信號解碼時,使用被確定為代表高位平面可具有的各碼元的上下文對音頻信號進行解碼; 對解碼的音頻信號進行逆量化;和對逆量化的音頻信號進行逆變換。
10.如權(quán)利要求9所述的方法,其中,對音頻信號解碼的步驟包括 使用確定的上下文對當前位平面的碼元解碼;和從解碼的碼元排列在其中的位平面中提取量化的樣本。
11.如權(quán)利要求9所述的方法,其中,對音頻信號解碼的步驟包括使用確定的上下文對音頻信號執(zhí)行Huffman解碼。
12.如權(quán)利要求9所述的方法,其中,對音頻信號解碼的步驟包括使用確定的上下文對音頻信號執(zhí)行算術(shù)解碼。
13.—種記錄有用于實現(xiàn)權(quán)利要求9至12中的任何一個要求保護的方法的程序的計算機可讀記錄介質(zhì)。
14.一種對音頻信號編碼的設備,該設備包括變換單元,將輸入的音頻信號變換成頻域中的音頻信號; 量化單元,對頻域變換的音頻信號進行量化;和編碼單元,當使用位平面編碼執(zhí)行編碼時,使用代表高位平面可具有的各碼元的上下 確定代表所述各碼元中具 確定代表所述各碼元中具 確定代表所述各碼元中具文對量化的音頻信號執(zhí)行編碼。
15.如權(quán)利要求14所述的設備,其中,編碼單元包括映射單元,將量化的音頻信號的多個量化的樣本映射到位平面上;上下文確定單元,確定代表高位平面的各碼元的上下文;和熵編碼單元,使用確定的上下文對當前位平面的碼元執(zhí)行編碼。
16.如權(quán)利要求15所述的設備,其中,上下文確定單元確定代表所述各碼元中具有包括三個或更多個“ 1 ”的二進制數(shù)據(jù)的碼元的上下文。
17.如權(quán)利要求15所述的設備,其中,上下文確定單元確定代表所述各碼元中具有包括兩個“1”的二進制數(shù)據(jù)的碼元的上下文。
18.如權(quán)利要求15所述的設備,其中,上下文確定單元確定代表所述各碼元中具有包括1個“ 1”的二進制數(shù)據(jù)的碼元的上下文。
19.如權(quán)利要求15所述的設備,其中,熵編碼單元使用確定的上下文對當前位平面的碼元執(zhí)行Huffman編碼。
20.如權(quán)利要求15所述的設備,其中,熵編碼單元使用確定的上下文對當前位平面的碼元執(zhí)行算術(shù)編碼。
21.一種對音頻信號解碼的設備,該設備包括解碼單元,使用被確定為代表高位平面可具有的各碼元的上下文對使用位平面編碼被編碼的音頻信號進行解碼;逆量化單元,對解碼的音頻信號進行逆量化;和逆變換單元,對逆量化的音頻信號進行逆變換。
22.如權(quán)利要求21所述的設備,其中,解碼單元使用確定的上下文對當前位平面的碼元解碼,從解碼的碼元排列在其中的位平面中提取量化的樣本。
23.如權(quán)利要求21所述的設備,其中,解碼單元使用確定的上下文對音頻信號執(zhí)行 Huffman 解碼。
24.如權(quán)利要求21所述的設備,其中,解碼單元使用確定的上下文對音頻信號執(zhí)行算術(shù)解碼。
全文摘要
提供了一種對音頻信號編碼和解碼的方法和設備。所述對音頻信號編碼的方法包括將輸入的音頻信號變換成頻域中的音頻信號;對頻域變換的音頻信號進行量化;當使用位平面編碼執(zhí)行編碼時,使用代表高位平面可具有的各碼元的上下文對量化的音頻信號執(zhí)行編碼。
文檔編號G10L19/02GK102306494SQ20111025990
公開日2012年1月4日 申請日期2006年12月7日 優(yōu)先權(quán)日2005年12月7日
發(fā)明者吳殷美, 苗磊, 金重會 申請人:三星電子株式會社