專利名稱:代碼轉換設備和方法以及用于解碼多對象音頻信號的方法
技術領域:
本發明涉及一種用于對具有各種聲道的多對象音頻信號進行編碼和解碼的設備和方法;且更具體地,涉及一種包括邊信息(side information)比特流轉換的用于對具有各種聲道的多對象音頻信號進行編碼和解碼的設備和方法,所述邊信息比特流轉換用于變換邊信息比特流、并基于變換后的邊信息比特流來恢復具有所期望的輸出信號(即,各種聲道)的多對象音頻信號。具有各種聲道的多對象音頻信號表示用于針對每個音頻對象具有不同聲道(例如,單聲道、立體聲和5. I聲道)的多對象的音頻信號。這項工作受MIC/IITA 的 IT R&D 規劃[2005-S-403-02,“Development ofSuper-intelligent Multimedia Anytime-anywhere Realistic TV SmarTVTechnology (超智能多媒體任何時間任何地點逼真TV智能TV技術的開發)”]支持。
背景技術:
根據傳統的音頻編碼/解碼技術,用戶應該被動地(inactively)聆聽音頻內容。 這樣,需要開發一種用于對在用于多個音頻對象的多聲道中的音頻信號進行編碼和解碼的設備和方法,使得可以通過根據用戶的需要而控制其每一個具有不同聲道的音頻對象并以各種方法而組合一個音頻內容,來消費各種音頻對象。傳統的空間音頻編碼(SAC)是一種用于將多聲道音頻信號代表、傳送、和恢復為縮混后的單聲道或立體聲信號的技術,并且它可以以低比特率來傳送高質量的多聲道音頻信號。然而,由于傳統的SAC能夠對在僅用于一個音頻對象的多聲道中的信號進行編碼和解碼,所以它不能編碼/解碼多聲道和多對象音頻信號,例如,用于多聲道(例如,單聲道、立體聲和5. I聲道)中的各種對象的音頻信號。此外,傳統的心理聲學編碼(BCC :Binaural Cue Coding)技術可以編碼/解碼用于多對象的音頻信號。然而,由于音頻對象的聲道限于單聲道,所以不能對具有包括單聲道的各種聲道的多對象音頻信號進行編碼/解碼。總之,由于傳統的技術僅可以編碼/解碼具有單個聲道的多對象音頻信號、或者具有多聲道的單對象音頻信號,所以不能對具有各種聲道的多對象音頻信號進行編碼/解碼。因此,根據傳統的音頻編碼/解碼技術,用戶應該被動地聆聽音頻內容。相應地,需要開發一種用于對在用于每個多音頻對象的各種聲道中的音頻信號進行編碼和解碼的設備和方法,以通過控制根據用戶的需要而不同的多聲道中的每個音頻對象、并根據各種方法而組合一個音頻內容來消費各種音頻對象。
此外,需要一種用于將多對象音頻比特流轉換為傳統的SAC比特流并且反之亦然的設備和方法,以提供在多對象音頻編碼器中創建的邊信息比特流與傳統的SAC編碼器/ 解碼器的邊信息比特流之間的后向兼容性。如上所述,作為用于通過單獨控制具有不同聲道的多個音頻對象并根據各種方法而組合一個音頻內容來對各種聲道的多對象音頻信號進行編碼和解碼的設備和方法,需要開發一種可執行比特流轉換的多聲道和多對象音頻編碼和解碼設備及方法,以提供與傳統 SAC比特流的后向兼容性,并控制具有多聲道的每個多音頻對象,從而以多樣的方法來組合一個音頻對象。
發明內容
技術問題本發明的實施例旨在提供一種用于對具有各種聲道的多對象音頻信號進行編碼和解碼、以提供與傳統的空間音頻編碼(SAC)比特流的后向兼容性的設備和方法。技術解決方案根據本發明的一方面,提供了一種用于編碼多對象音頻信號的設備,包括音頻對象編碼單元,用于基于空間線索(spatial cue)來編碼輸入到編碼設備的音頻對象信號,并創建用于編碼后的音頻對象信號的渲染信息,其中所述渲染信息包括用于音頻對象信號的空間線索信息、音頻對象信號的聲道信息和音頻對象信號的標識信息。根據本發明的又一方面,提供了一種用于創建渲染信息來解碼多對象音頻信號的代碼轉換設備,包括第一矩陣單元,用于基于已編碼音頻對象信號的對象控制信息和播放信息來創建渲染信息,該渲染信息包括用于已編碼音頻對象信號的功率增益信息和輸出位置信息;和渲染單元,用于基于第一矩陣單元所創建的渲染信息和用于從編碼設備輸入的已編碼音頻對象信號的渲染信息,來創建用于要從解碼設備輸出的音頻信號的空間線索信肩、O根據本發明的又一方面,提供了一種用于創建多聲道音頻信號和用于解碼多聲道音頻信號的渲染信息的代碼轉換設備,包括解析單元,用于從用于由編碼設備輸入的已編碼音頻信號的渲染信息中分出用于已編碼音頻對象信號的渲染信息和用于多聲道音頻信號的渲染信息;第一矩陣單元,用于基于已編碼音頻對象信號的對象控制信息和播放信息來創建渲染信息,該渲染信息包括用于已編碼音頻對象信號的功率增益信息和輸出位置信息;第二矩陣單元,用于基于由解析單元單獨獲取的用于已編碼多聲道音頻信號的渲染信息,來創建包括用于多聲道音頻信號的每個聲道的功率增益信息的渲染信息,和渲染單元, 用于基于第一矩陣單元所創建的渲染信息、第二矩陣單元所創建的渲染信息、和由解析單元單獨獲取的用于已編碼音頻對象信號的渲染信息,來創建用于從解碼設備輸出的音頻信號的空間線索信息。根據本發明的又一方面,提供了一種用于編碼多對象音頻信號的方法,包括如下步驟基于空間線索來對所輸入的音頻對象信號進行編碼,并創建用于編碼后的音頻對象信號的渲染信息,其中所述渲染信息包括用于音頻對象信號的空間線索信息、音頻對象信號的聲道信息和音頻對象信號的標識信息。根據本發明的又一方面,提供了一種用于創建渲染信息來解碼多對象音頻信號的代碼轉換方法,包括如下步驟基于已編碼音頻對象信號的對象控制信息和播放信息來創建渲染信息,該渲染信息包括用于已編碼音頻對象信號的功率增益信息和輸出位置信息; 和基于在所述創建渲染信息的步驟中創建的渲染信息和用于在編碼之后輸入的已編碼音頻對象信號的渲染信息,來創建用于要在解碼之后輸出的音頻信號的空間線索信息。根據本發明的又一方面,提供了一種用于創建渲染信息以解碼多聲道音頻信號和多對象音頻信號的代碼轉換方法,包括如下步驟從用于在編碼之后輸入的已編碼音頻信號的渲染信息中分出用于已編碼音頻對象信號的渲染信息和用于多聲道音頻信號的渲染信息;基于用于已編碼音頻對象信號的對象控制信息和播放信息來創建渲染信息,該渲染信息包括用于已編碼音頻對象信號的功率增益信息和輸出位置信息;基于在所述分出渲染信息的步驟中單獨獲取的用于已編碼多聲道音頻信號的渲染信息,來創建包括用于多聲道音頻信號的每個聲道的功率增益信息的渲染信息,和基于在所述創建包括功率增益信息和輸出位置信息的渲染信息的步驟中創建的渲染信息、在所述創建包括用于多聲道音頻信號的每個聲道的功率增益信息的渲染信息的步驟中創建的渲染信息、和在所述分出渲染信息的步驟中單獨獲取的用于已編碼音頻對象信號的渲染信息,來創建用于要在解碼之后輸出的音頻信號的空間線索信息。根據本發明的又一方面,提供了一種用于解碼多對象音頻信號的方法,包括如下步驟接收多聲道和多對象縮混信號以及多聲道多對象邊信息信號;將所述多聲道多對象縮混信號變換為多聲道縮混信號;將多聲道和多對象信息信號變換為多聲道邊信息信號; 基于所獲取的多聲道縮混信號和多聲道邊信息信號來合成音頻信號。有利效果通過提供一種能夠執行邊信息比特流轉換的用于編碼和解碼具有各種聲道的多對象音頻信號的設備和方法,本發明可通過有效地編碼和解碼各種聲道中的多對象音頻內容而根據用戶的需要來主動地消費音頻內容。此外,本發明可通過提供與傳統上使用的比特流的后向兼容性,來提供與傳統編碼和解碼設備的兼容性。
圖I是示出了根據本發明實施例的多對象音頻編碼器和多對象解碼器的框圖。圖2是示出了根據本發明實施例的多對象音頻編碼器和多對象解碼器的框圖。圖3是圖示了根據本發明實施例的圖2的代碼轉換器(transcoder) 103的框圖。圖4圖示了根據本發明實施例的由圖2的比特流格式器(formatter) 205創建的代表性空間音頻對象編碼(SAOC)比特流。圖5示出了根據本發明另一實施例的圖2的代表性SAOC比特流。圖6是示出了根據本發明另一實施例的圖2的代碼轉換器103的框圖。圖7是示出了在圖2的多對象音頻編碼器和解碼器中另外包括音頻對象去除器 701的情況的框圖。圖8是示出了用MPEG環繞編碼器和解碼器來替換圖2的SAC編碼器201和SAC 解碼器105的情況的框圖。
具體實施方式
根據下文中陳述的參考附圖的以下實施例描述,本發明的優點、特征和方面將變明顯。下文中將參考附圖來詳細描述本發明的特定實施例。圖I是示出了根據本發明實施例的多對象音頻編碼器和多對象解碼器的框圖。參考圖1,本發明包括空間音頻對象編碼器(SAOC) 101、代碼轉換器103、和空間音頻編碼(SAC) 105。根據SAOC方法,輸入到編碼器的信號被編碼為音頻對象。每個音頻對象不由解碼器恢復并獨立地播放。然而,用于音頻對象的信息被渲染(render)以形成所期望的音頻場景,并輸出具有各種聲道的多對象音頻信號。因此,SAC解碼器需要用于渲染被輸入以獲取所期望的音頻場景的用于音頻對象的信息的設備。SAOC編碼器101是基于空間線索的編碼器,并將輸入音頻信號編碼為音頻對象。 所述音頻對象是向SAOC編碼器101輸入的單聲道或立體聲信號。SAOC編碼器101輸出來自多于一個輸入音頻對象的縮混信號,并通過提取空間線索和邊信息來創建SAOC比特流。所輸出的縮混信號是單聲道或立體聲信號。SAOC編碼器 101基于“異類布局SA0C”或者“Faller”技術來分析所輸入的音頻對象信號。所提取的SAOC比特流包括空間線索和邊信息,并且所述邊信息包括輸入音頻對象的空間信息。一般基于頻率區域子帶單位來分析并提取所述空間線索。所述空間線索是在編碼和解碼音頻信號中使用的信息。它提取自頻率區域,并包括用于所輸入的兩個信號之間的大小差、延遲差和相關性的信息。例如,空間線索包括用于示出音頻信號的功率增益信息的、音頻信號之間的聲道電平差(CLD);音頻信號之間的聲道間電平差(ICLD);音頻信號之間的聲道間時間差(ICTD);用于示出音頻信號之間的相關信息的、音頻信號之間的相關聲道間相關(ICC);和音頻信號之間的虛擬源位置信息,但是不限于這些示例。此外,所述邊信息包括用于恢復并控制空間線索和音頻信號的信息。所述邊信息包括標首信息。所述標首信息包括用于恢復并播放具有各種聲道的多對象音頻信號的信息,并且可通過定義用于音頻對象的聲道信息和音頻對象的標識(ID)來提供用于具有單聲道、立體聲或多聲道的音頻對象的解碼信息。例如,定義用于每個對象的ID和信息,以標識已編碼的特定音頻對象是單聲道音頻信號還是立體聲音頻信號。作為實施例,所述標首信息可包括空間音頻編碼(SAC)標首信息、音頻對象信息和預設信息。代碼轉換器103渲染被輸入到SAOC編碼器101的音頻對象,并基于從外部輸入的控制信號(即,每個對象的聲音信息和播放環境信息)來將從SAOC編碼器101提取的SAOC 比特流變換為SAC比特流。也就是說,代碼轉換器103基于所提取的SAOC比特流執行渲染,以將輸入到SAOC 編碼器101的音頻對象恢復為具有各種聲道的多對象音頻信號。可以在參數區域執行基于邊信息的渲染。此外,代碼轉換器103將SAOC比特流變換為SAC比特流。所述代碼轉換器103從 SAOC比特流獲得輸入音頻對象的信息,并與所期望的音頻場景對應地渲染輸入音頻對象的信息。在渲染過程中,代碼轉換器103預測與所期望的音頻場景對應的空間信息,變換并輸出已預測的空間信息作為SAC邊信息比特流。將參考圖3來詳細描述代碼轉換器103。
SAC解碼器105是基于空間線索的多聲道音頻解碼器,基于從代碼轉換器103輸出的SAC比特流而將從SAOC編碼器101輸出的縮混信號恢復為每個對象的音頻信號,并將每個對象的音頻信號恢復為具有各種聲道的多對象音頻信號。SAC解碼器105可以用運動圖象專家組(MPEG)環繞解碼器和心理聲學編碼(BCC)解碼器來替換。圖2是示出了根據本發明實施例的多對象音頻編碼器和多對象解碼器的框圖,并示出了輸入信號是具有各種聲道的多對象音頻信號的情況。參考圖2和圖I,本發明包括SAOC編碼器101、代碼轉換器103、SAC解碼器105、 SAC編碼器201、預設音頻場景信息(ASI) 203和比特流格式器205。當SAOC編碼器101僅支持單聲道或立體聲音頻對象時,SAC編碼器201從所輸入的多聲道音頻信號輸出一個音頻對象。所輸出的音頻對象是縮混后的單聲道或立體聲信號。此外,SAC編碼器201提取空間線索和邊信息,并創建SAC比特流。SAOC編碼器101從包括由SAC編碼器201輸出的一個音頻對象的多于一個音頻對象輸出代表性縮混信號,提取空間線索和邊信息,并創建SAOC比特流。預設ASI 203將從外部輸入的控制信號(即,每個對象的聲音信息和播放環境信息)形成為預設ASI,并創建包括預設ASI的預設ASI比特流。將參考圖4來詳細描述預設 ASI。比特流格式器205基于由SAOC編碼器101創建的SAOC比特流、由SAC編碼器201 創建的SAC比特流、和由預設ASI 203創建的預設ASI比特流,來創建代表性SAOC比特流。代碼轉換器103渲染向SAOC編碼器101輸入的音頻對象,并基于從外部輸入的每個對象的聲音信息和播放環境信息來將比特流格式器205所創建的代表性SAOC比特流變換為代表性SAC比特流。代碼轉換器103被包括在SAC解碼器105中并如上所述地起作用。SAC解碼器105基于從代碼轉換器103輸出的SAC比特流,來將從SAOC編碼器101 輸出的縮混信號恢復為具有各種聲道的多對象音頻信號。SAC解碼器105可以用MPEG環繞解碼器和BCC解碼器來替換。圖3是圖示了根據本發明實施例的圖2的代碼轉換器103的框圖。參考圖3,代碼轉換器103包括解析單元301、渲染單元303、第二矩陣單元311、 和第一矩陣單元313,并將代表性SAOC比特流變換為代表性SAC比特流。在圖I中,代碼轉換器103將SAOC比特流變換為SAC比特流。解析單元301解析由比特流格式器205創建的代表性SAOC比特流或者由圖I的 SAOC編碼器101創建的SAOC比特流,并劃分在所述代表性SAOC比特流中包括的SAOC比特流和SAC比特流。此外,解析單元301從已劃分SAOC比特流中提取用于輸入到SAOC編碼器101的音頻對象數目的信息。由于當解析由圖I的SAOC編碼器101創建的SAOC比特流時沒有SAC比特流,所以不必劃分SAC比特流。第二矩陣單元311基于由解析單元301劃分的SAC比特流創建第二矩陣。第二矩陣是關于輸入到SAC編碼器201的多聲道音頻信號的行列式。當在代表性SAOC比特流中不包括SAC比特流時,即當解析由圖I的SAOC編碼器101創建的SAOC比特流時,不需要第二矩陣單元311。第二矩陣示出了輸入到SAC編碼器201的多聲道音頻信號的功率增益值,并示出在等式I中。矩陣II通常,在將一個幀劃分為子帶之后的分析是SAC的基本分析過程。^是從SAC編碼器201輸出的縮混信號;k是頻率系數索引;并且b是子帶索引。是從SAC比特流獲得的多聲道信號的空間線索信息,并用于恢復第i聲道信號的頻率信息,I彡i彡M。因此,可以表達為頻率系數的大小信息或相位信息。因此,在等式I的右邊項中,是等式I的結果,并示出了從SAC解碼器105輸出的多聲道音頻信號。和1^」是向量,并且的轉置矩陣的維數是的維數。例如,這將被描述為等式2。由于從SAC編碼器201輸出的縮混信號是單聲道或立體聲,所以m是I或 2。如上所述,^4—,是包括在SAC比特流中的空間線索信息。當指示每個聲道的子帶中的功率增益時,可以從聲道電平差空間線索中預測。當^4—,被用作用于補償頻率系數的相位差的系數時,可以從聲道時間差空間線索或聲道間相干空間線索中預測。作為示例,將描述^被用作用于補償頻率系數之間的相位差的系數的情況。等式I的第二矩陣應表達每個聲道的功率增益值,并且是縮混信號的向量的維數的逆,使得可以利用從SAC編碼器201輸出的縮混信號通過矩陣運算來創建輸出信號
YLM。當第二矩陣單元311創建滿足等式I和2的第二矩陣時,渲染單元303組合所創建的第二矩陣和第一矩陣單元313的輸出。第一矩陣單元313基于控制信號(例如,對象控制信息和播放系統信息),來創建期望多于一個的、輸入到SAOC編碼器101的音頻對象的輸出,即要被映射到具有各種聲道的多對象音頻信號的第一矩陣。當輸入到SAOC編碼器101的音頻對象的數目是N時,從SAC編碼器201輸出的縮混信號被認為是一個音頻對象并包括在所輸入的N個音頻對象中。相應地,除了從SAC編碼器201輸出的縮混信號之外的每個音頻對象可以基于第一矩陣而被映射到從SAC解碼器 105輸出的聲道。當從SAC解碼器105輸出的聲道的數目是M時,第一矩陣可滿足接下來的條件。
10
權利要求
1.一種用于創建渲染信息來解碼多對象音頻信號的代碼轉換設備,包括第一矩陣裝置,用于基于已編碼音頻對象信號的對象控制信息和播放信息來創建渲染信息,該渲染信息包括用于已編碼音頻對象信號的功率增益信息和輸出位置信息;和渲染裝置,用于基于第一矩陣裝置所創建的渲染信息和用于從編碼設備輸入的已編碼音頻對象信號的渲染信息,來創建用于要從解碼設備輸出的音頻信號的空間線索信息。
2.根據權利要求I的代碼轉換設備,其中所述渲染裝置創建除了用于已編碼音頻對象信號之中的預定音頻對象信號的空間線索信息之外、用于要從解碼設備輸出的音頻對象信號的空間線索信息,和其中所述代碼轉換設備還包括音頻對象去除裝置,所述音頻對象去除裝置用于去除已編碼音頻信號之中的預定音頻對象信號。
3.一種用于創建渲染信息以解碼多聲道音頻信號和多對象音頻信號的代碼轉換設備, 包括解析裝置,用于從用于由編碼設備輸入的已編碼音頻信號的渲染信息中分出用于已編碼音頻對象信號的渲染信息和用于多聲道音頻信號的渲染信息;第一矩陣裝置,用于基于已編碼音頻對象信號的對象控制信息和播放信息來創建渲染信息,該渲染信息包括用于已編碼音頻對象信號的功率增益信息和輸出位置信息;第二矩陣裝置,用于基于由解析裝置單獨獲取的用于已編碼多聲道音頻信號的渲染信息,來創建包括有關多聲道音頻信號的每個聲道的功率增益信息的渲染信息,和渲染裝置,用于基于第一矩陣裝置所創建的渲染信息、第二矩陣裝置所創建的渲染信息、和由解析裝置單獨獲取的用于已編碼音頻對象信號的渲染信息,來創建用于從解碼設備輸出的音頻信號的空間線索信息。
4.根據權利要求3的代碼轉換設備,其中用于第一矩陣裝置的已編碼音頻對象信號的對象控制信息和播放信息是從編碼設備輸入的預設信息,并且該預設信息包括音頻對象信號的聲音信息和播放信息;和所述解析裝置還從用于從編碼設備輸入的已編碼音頻信號的渲染信息中分出預設信息
5.根據權利要求3的代碼轉換設備,其中所述渲染裝置創建除了用于已編碼音頻對象信號之中的預定音頻信號的空間線索信息之外、用于要從解碼設備輸出的音頻信號的空間線索信息,和其中所述代碼轉換設備還包括音頻對象去除裝置,所述音頻對象去除裝置用于去除關于已編碼音頻信號之中的預定音頻信號的音頻對象信號。
6.根據權利要求3的代碼轉換設備,其中所述渲染裝置創建用于由包括運動圖像專家組(MPEG)環繞編碼器的編碼設備所編碼的音頻信號的左信號和右信號中的每個的空間線索信息,作為用于要從解碼設備輸出的音頻信號的空間線索信息,和其中所述代碼轉換設備對已編碼的音頻信號進行變換,使得由包括MPEG環繞編碼器的編碼設備所編碼的音頻信號包括左信號信息和右信號信息。
7.一種用于創建渲染信息來解碼多對象音頻信號的代碼轉換方法,包括如下步驟 基于已編碼音頻對象信號的對象控制信息和播放信息來創建渲染信息,該渲染信息包括用于已編碼音頻對象信號的功率增益信息和輸出位置信息;和基于在所述創建渲染信息的步驟中創建的渲染信息和用于在編碼之后輸入的已編碼音頻對象信號的渲染信息,來創建用于要在解碼之后輸出的音頻信號的空間線索信息。
8.根據權利要求7的代碼轉換方法,其中在所述創建空間線索信息的步驟中,創建除了用于已編碼音頻對象信號之中的預定音頻對象信號的空間線索信息之外的、用于要在解碼之后輸出的音頻對象信號的空間線索信息,和其中所述代碼轉換方法還包括去除已編碼音頻信號之中的預定音頻對象信號的步驟。
9.一種用于創建渲染信息以解碼多聲道音頻信號和多對象音頻信號的代碼轉換方法, 包括如下步驟從用于在編碼之后輸入的已編碼音頻信號的渲染信息中分出用于已編碼音頻對象信號的渲染信息和用于多聲道音頻信號的渲染信息;基于用于已編碼音頻對象信號的對象控制信息和播放信息來創建渲染信息,該渲染信息包括用于已編碼音頻對象信號的功率增益信息和輸出位置信息;基于在所述分出渲染信息的步驟中單獨獲取的用于已編碼多聲道音頻信號的渲染信息,來創建包括用于多聲道音頻信號的每個聲道的功率增益信息的渲染信息;和基于在所述創建包括功率增益信息和輸出位置信息的渲染信息的步驟中創建的渲染信息、在所述創建包括用于多聲道音頻信號的每個聲道的功率增益信息的渲染信息的步驟中創建的渲染信息、和在所述分出渲染信息的步驟中單獨獲取的用于已編碼音頻對象信號的渲染信息,來創建用于要在解碼之后輸出的音頻信號的空間線索信息。
10.根據權利要求9的代碼轉換方法,其中,在所述創建包括用于已編碼音頻對象信號的功率增益信息和輸出位置信息的渲染信息的步驟中,用于已編碼音頻對象信號的對象控制信息和播放信息是在編碼之后輸入的預設信息,該預設信息包括音頻對象信號的聲音信息和播放信息;和其中,所述分出渲染信息的步驟還包括從用于在編碼之后輸入的已編碼音頻信號的渲染信息中分出預設信息的步驟。
11.根據權利要求9的代碼轉換方法,其中,在所述創建空間線索信息的步驟中,創建除了用于已編碼音頻信號之中的預定音頻信號的空間線索信息之外的、用于要在解碼之后輸出的音頻信號的空間線索信息,和其中所述代碼轉換方法還包括去除關于已編碼音頻信號之中的預定音頻信號的音頻對象信號的步驟。
12.根據權利要求9的代碼轉換方法,其中,在創建用于要在解碼之后輸出的音頻信號的空間線索信息的步驟中,創建用于由包括運動圖像專家組(MPEG)環繞編碼器的已編碼的音頻信號的左信號和右信號中的每個的空間線索信息,作為用于要在解碼之后輸出的音頻信號的空間線索信息,和其中所述代碼轉換方法還包括對已編碼的音頻信號進行變換、使得由包括MPEG環繞編碼器的已編碼的音頻信號包括左信號信息和右信號信息的步驟。
13.一種用于解碼多對象音頻信號的方法,包括如下步驟接收多聲道和多對象縮混信號以及多聲道多對象邊信息信號;將所述多聲道多對象縮混信號變換為多聲道縮混信號;將多聲道和多對象信息信號變換為多聲道邊信息信號;基于所獲取的多聲道縮混信號和多聲道邊信息信號來合成音頻信號。
14.根據權利要求13的解碼方法,其中所述變換多聲道縮混信號的步驟包括基于從多聲道和多對象邊信息信號獲得的對象相關信息來從多聲道和多對象縮混信號去除對象信息的步驟。
15.根據權利要求14的解碼方法,其中所述對象相關信息是基于對象控制信息來控制的。
16.根據權利要求14的解碼方法,其中所述對象相關信息是基于解碼系統信息來控制的。
17.根據權利要求13的解碼方法,其中所述變換多聲道縮混信號的步驟包括基于從多聲道和多對象邊信息信號獲得的對象相關信息來控制來自多聲道多對象縮混信號的對象信息的步驟。
全文摘要
提供了一種用于編碼和解碼具有各種聲道的多對象音頻信號的設備和方法,所述設備和方法提供了與傳統的空間音頻編碼(SAC)比特流的后向兼容性。所述設備包括音頻對象編碼單元,用于基于空間線索來編碼輸入到編碼設備的音頻對象信號,并創建用于編碼后的音頻對象信號的渲染信息,其中所述渲染信息提供了包括用于音頻對象信號的空間線索信息、音頻對象信號的聲道信息和音頻對象信號的標識信息的編碼設備,并且所述編碼設備使用在音頻信號的編碼和解碼中。
文檔編號G10L19/00GK102595303SQ20121003386
公開日2012年7月18日 申請日期2007年12月27日 優先權日2006年12月27日
發明者姜京玉, 張大永, 徐廷一, 李泰辰, 李用主, 洪鎮佑, 白承權, 金鎮雄 申請人:韓國電子通信研究院