麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

計(jì)算和調(diào)節(jié)音頻信號的感覺響度和/或感覺頻譜平衡的制作方法

文檔序號:7538168閱讀:822來源:國知局
專利名稱:計(jì)算和調(diào)節(jié)音頻信號的感覺響度和/或感覺頻譜平衡的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及音頻信號處理。更具體而言,本發(fā)明涉及音頻信號的感覺聲音響度和/或感覺頻譜平衡的測量和控制。本發(fā)明可用于例如以下的一個或更多方面響度補(bǔ)償音量控制、自動增益控制、動態(tài)范圍控制(包括例如限幅器、壓縮器、擴(kuò)展器等等)、動態(tài)均衡、和補(bǔ)償音頻重放環(huán)境中的背景噪聲干擾。
背景技術(shù)
已經(jīng)進(jìn)行過許多嘗試來開發(fā)令人滿意的測量響度的客觀方法。Fletcher和Munson在1933年確定人的聽覺在低頻和高頻時比在中間(或話音)頻率較不敏感。他們還發(fā)現(xiàn)敏感度的相對變化隨聲級的增加而降低。早先的響度測量儀由麥克風(fēng)、放大器、測量器和被設(shè)計(jì)用于在低、中和高聲級大致模仿聽覺的頻率響應(yīng)的濾波器的組合而構(gòu)成。
盡管這些設(shè)備提供了單一的、恒定聲級、獨(dú)立音調(diào)的響度測量,但是更加復(fù)雜聲音的測量不能非常好地匹配響度的主觀感覺。這種類型的聲級測量儀已經(jīng)被標(biāo)準(zhǔn)化,但是它僅僅用于諸如監(jiān)控和控制工業(yè)噪聲的特定任務(wù)。
在20世紀(jì)50年代早期,Zwicker和Stevens在開發(fā)更為逼真的響度感覺處理的模型中擴(kuò)展了Fletcher和Munson的工作。Stevens于1956年在Journal of the Acoustical Society of America中發(fā)表了一種用于“Caculation of the Loudness of Complex Noise”的方法,以及Zwicker在1958年在Acoustica中發(fā)表了他的論文“Psychological andMethodical Basis of Loudness”。在1959年Zwicker發(fā)表了響度計(jì)算的圖形化處理以及不久之后發(fā)表了若干類似的論文。Stevens和Zwicker方法已(分別地)標(biāo)準(zhǔn)化為ISO532部分A和B。兩種方法包含類似的步驟。
首先,通過將音頻傳遞通過具有在臨界頻帶速率標(biāo)度上均勻間隔的中心頻率的一組帶通聽覺濾波器模擬被稱之為激勵的沿內(nèi)耳基膜能量的時間變化分布。每個聽覺濾波器被設(shè)計(jì)成模擬沿內(nèi)耳基膜在特定位置的頻率響應(yīng),該濾波器的中心頻率對應(yīng)于這個位置。臨界頻帶帶寬定義為這樣一個濾波器的帶寬。以Hz為單位進(jìn)行度量,這些聽覺濾波器的臨界帶寬隨中心頻率的增加而增加。所以,有利的是定義曲折的頻率標(biāo)度以便以這種曲折標(biāo)度度量的所有聽覺濾波器的臨界帶寬是常量。這種曲折的標(biāo)度被稱之為臨界頻帶速率標(biāo)度并且對理解和模擬范圍廣泛的心理聲學(xué)現(xiàn)象非常有用。例如,參見E.Zwicker和H.Fastl所著的Psychoacoustics-Facts and Models,Springer-Verlag,柏林,1990年。Stevens和Zwicker的方法使用被稱之為Bark標(biāo)度的臨界頻帶速率標(biāo)度,其中臨界頻帶帶寬在500Hz以下是常量并且在500Hz以上增加。近來,Moore和Glasberg定義了一種臨界帶寬速率標(biāo)度,他們稱其為等效矩形帶寬(ERB)標(biāo)度(B.C.J.Moore,B.Glasberg,T.Baer,“A Model for the Prediction of Thresholds,Loudness,and Partial Loudness”,Journal of the Audio EngineeringSociety,Vol.45,No.4,1997年4月,pp.224-240)。通過使用陷波噪聲屏蔽器的心理聲學(xué)實(shí)驗(yàn),Moore和Glasberg證明臨界頻帶帶寬在500Hz以下繼續(xù)減小,這與臨界頻帶帶寬保持恒定的Bark標(biāo)度相反。
在激勵計(jì)算之后是產(chǎn)生稱之為“單位響度”的量的非線性壓縮功能。單位響度是作為頻率和時間的函數(shù)的感覺響度的度量并且可以沿諸如以上討論的Bark或ERB標(biāo)度的臨界頻率速率標(biāo)度以每個單位頻率的感覺響度為單元進(jìn)行度量。最后,通過在頻率上積分單位響度計(jì)算時間變化“總響度”。當(dāng)根據(jù)沿臨界頻帶速率標(biāo)度均勻分布的一組有限聽覺濾波器估計(jì)單位響度時,可以通過對來自每個濾波器的單位響度簡單地進(jìn)行求和計(jì)算總響度。
響度可以以“方”(phon)為單位度量。以方為單位給定聲音的響度是具有等于聲音響度的主觀響度的1kHz音調(diào)的聲壓級(SPL)。傳統(tǒng)上,SPL的基準(zhǔn)0dB是2×10-5帕壓強(qiáng)的均方根,所以這也是基準(zhǔn)0方。使用這種定義在比較在除1kHz以外的頻率音調(diào)的響度和在1kHz音調(diào)的響度中,等響度輪廓能夠被確定用于給定的方級。
圖11所示為用于20Hz和12.5kHz之間的頻率,以及4.2方(被認(rèn)為是聽覺的門限)和120方之間的方級的等響度輪廓(ISO2261087(E),“Acoustics-Normal equal loudness level contours”)。這種方度量考慮人耳隨頻率變化的敏感度,但是結(jié)果不允許以變化的級評價聲音的相對主觀的響度,因?yàn)闆]有嘗試以校正響度隨SPL增加的非線性,即輪廓的間隔發(fā)生變化的事實(shí)。
響度還可以以“宋”(sone)為單位度量。如在圖11中所指示,在方單位和宋單位之間存在一一映射。1宋定義為40dB(SPL)1kHz純正弦波的響度并且等效于40方。宋單位是這樣的,即宋單位兩倍的增加對應(yīng)于感覺響度的加倍。例如,4宋被感覺為2宋兩倍的響度。因此,以宋為單位表達(dá)響度級提供更多的信息。如果單位響度定義為作為頻率和時間的函數(shù)的感覺響度的度量,單位響度可以以每單位頻率宋為單位進(jìn)行度量。因此,當(dāng)使用Bark標(biāo)度時,單位響度具有每Bark宋的單位,同理當(dāng)使用ERB標(biāo)度時,所述單位是每ERB宋。
如上所述,人耳的敏感度隨頻率和級變化,這是在心理聲學(xué)文獻(xiàn)中充分記載的事實(shí)。其中的一個結(jié)果是給定聲音的感覺頻譜或音色隨聽到聲音的聲級而變化。例如,對于包含低頻、中頻和高頻的聲音,感覺的相對成比例的這些頻率分量隨聲音的總響度變化;當(dāng)無聲時低頻和高頻分量相對于中頻比當(dāng)嘈雜時它們聽起來更無聲。這種現(xiàn)象是眾所周知的并且已經(jīng)在聲音再現(xiàn)設(shè)備中通過所謂的響度控制減輕。響度控制是當(dāng)音量下降時應(yīng)用低頻以及有時候還應(yīng)用高頻增強(qiáng)的音量控制。因此,人耳在頻率極限處的較低敏感度被通過這些頻率的人為增強(qiáng)進(jìn)行補(bǔ)償。這些控制是完全被動的;應(yīng)用的補(bǔ)償程度是音量控制或某些其他用戶操作控制的設(shè)置的函數(shù),而不是音頻信號內(nèi)容的函數(shù)。
實(shí)際上,在低頻、中頻和高頻中感覺的相對頻譜平衡的變化取決于信號,特別是其實(shí)際的頻譜以及是否目的是高聲或低聲。考慮交響樂團(tuán)的錄音。在音樂廳內(nèi)聽眾中的一員將會聽到的相同級再現(xiàn),無論交響樂正在大聲或無聲地演奏都可以校正在頻譜上的平衡。如果例如以10dB較無聲地再現(xiàn)音樂,在頻譜上的感覺平衡對于大聲通過以一種方式改變以及以對于無聲通過以另一種方式改變。傳統(tǒng)的被動響度控制不應(yīng)用作為音樂的函數(shù)的不同的補(bǔ)償。
在Seefeldt等人于2004年5月27日申請的第PCT/US2004/016964號、2004年12月23日公開號為WO2004/111994A2的國際專利申請中,公開了一種測量和調(diào)節(jié)音頻信號的感覺響度的系統(tǒng)。指定美國的所述PCT申請?jiān)诖巳堪鲄⒖肌T谒錾暾堉校睦砺晫W(xué)模型以感覺單元計(jì)算音頻信號的響度。另外,該申請引入了計(jì)算寬帶乘法增益的技術(shù),當(dāng)該增益被應(yīng)用于音頻時,導(dǎo)致增益修正音頻的響度基本上與基準(zhǔn)響度相同。但是,這種寬帶增益的應(yīng)用改變了音頻的感覺頻譜平衡。

發(fā)明內(nèi)容
在一個方面,本發(fā)明提供通過修改音頻信號以便減小它的單位響度和目標(biāo)單位響度之間的差來導(dǎo)出可用來控制音頻信號的單位響度的信息。單位響度是作為頻率和時間的函數(shù)的感覺響度的度量。在實(shí)際的實(shí)現(xiàn)中,經(jīng)修改音頻信號的單位響度可以近似目標(biāo)單位響度。如下所述,這種近似不僅受普遍信號處理?xiàng)l件而且受在修改中可以被應(yīng)用的時間和/或頻率平滑的影響。
由于單位響度是作為頻率和時間的函數(shù)的音頻信號的感覺響度的度量,以便減小音頻信號的單位響度和目標(biāo)單位響度之間的差,所述修改可以修改音頻信號作為頻率的函數(shù)。盡管在某些情況下目標(biāo)單位響度可以是時間恒定的以及音頻信號典型本身可以是穩(wěn)態(tài)時間恒定的信號,但是所述修改還可以修改音頻信號作為時間的函數(shù)。
還可以應(yīng)用本發(fā)明的這些方面補(bǔ)償在音頻重放環(huán)境中干擾的背景噪聲。當(dāng)在存在背景噪聲的情況下傾聽音頻時,所述噪聲可能部分或全部地以一種取決于音頻級和頻譜以及噪聲級和頻譜的方式屏蔽該音頻。結(jié)果是音頻感覺頻譜的改變。根據(jù)心理聲學(xué)研究(例如參見Moore、Glasberg、和Baer,“A Model for the Prediction of Thresholds,Loudness,and Partial Loudness”,J.Audio Eng.Soc.,Vol.45,No.4,1997年4月),可將音頻的“部分單位響度”定義為在存在諸如噪聲的次干擾聲音信號的情況下音頻的感覺響度。
因此,在另一個方面,本發(fā)明提供通過修改音頻信號以便減小它的部分單位響度和目標(biāo)單位響度之間的差來導(dǎo)出控制音頻信號的部分單位響度可使用的信息。這樣做以感覺精確的方式減輕了噪聲的影響。在考慮到干擾噪聲信號的本發(fā)明這個方面和其他方面,假設(shè)存在對音頻信號和次干擾信號的單獨(dú)地存取。
在另一個方面,本發(fā)明提供通過修改音頻信號以便減小它的單位響度和目標(biāo)單位響度之差來控制音頻信號的單位響度。
在另一個方面,本發(fā)明提供通過修改音頻信號以便減小它的部分單位響度和目標(biāo)單位響度之差來控制音頻信號的部分單位響度。
當(dāng)目標(biāo)單位響度不是音頻信號的函數(shù)時,它可能是一個已存儲的或接收的目標(biāo)單位響度。當(dāng)目標(biāo)單位響度不是音頻信號的函數(shù)時,修改或?qū)С隹梢燥@式或隱式地計(jì)算單位響度或部分單位響度。顯式計(jì)算的實(shí)例包括查詢表或“封閉式”數(shù)學(xué)表達(dá)式,其中本質(zhì)上是確定單位響度和/或部分單位響度(術(shù)語封閉式的意思是描述使用有限數(shù)量的標(biāo)準(zhǔn)數(shù)學(xué)運(yùn)算和函數(shù),諸如指數(shù)和余弦來精確地表示的數(shù)學(xué)表達(dá)式)。而且當(dāng)目標(biāo)單位響度不是音頻信號的函數(shù)時,目標(biāo)單位響度可以是時間和頻率恒定的或者它可以僅僅是時間恒定的。
在再一個方面,本發(fā)明提供通過根據(jù)一個或更多處理以及一個或更多處理控制參數(shù)處理音頻信號或音頻信號的度量以產(chǎn)生目標(biāo)單位響度來處理音頻信號。盡管目標(biāo)單位響度可以是時間恒定(“固定”)的,但是目標(biāo)單位響度可以有利地是音頻信號的單位響度的函數(shù)。盡管它典型可以是靜態(tài)的、頻率和時間恒定的信號,但是音頻信號本身是頻率和時間變化的,因此當(dāng)它是音頻信號的函數(shù)時導(dǎo)致目標(biāo)單位響度也是頻率和時間變化的。
可以從發(fā)送接收或根據(jù)存儲媒體再現(xiàn)所述音頻和目標(biāo)單位響度或目標(biāo)單位響度的表示。
目標(biāo)單位響度的表示可以是定標(biāo)音頻信號或音頻信號度量的一個或更多定標(biāo)因子。
本發(fā)明的任何上述方面的目標(biāo)單位響度可以是音頻信號或音頻信號度量的函數(shù)。音頻信號的一種適當(dāng)?shù)亩攘渴且纛l信號的單位響度。音頻信號或音頻信號度量的函數(shù)可以是音頻信號或音頻信號度量的定標(biāo)。例如,所述定標(biāo)可以是以下定標(biāo)之一或其組合(a)時間和頻率變化定標(biāo)因子Ξ[b,t]定標(biāo)單位響度為如下關(guān)系N^[b,t]=Ξ[b,t]N[b,t];]]>(b)時間變化、頻率恒定的定標(biāo)因子Ф[t]定標(biāo)單位響度為如下關(guān)系N^[b,t]=Φ[t]N[b,t];]]>(c)時間恒定、頻率變化的定標(biāo)因子Θ[b]定標(biāo)單位響度為如下關(guān)系N^[b,t]=Θ[b]N[b,t];]]>和(d)時間恒定、頻率恒定的定標(biāo)因子α定標(biāo)音頻信號的單位響度為如下關(guān)系N^[b,t]=αN[b,t],]]>其中 是目標(biāo)單位響度,N[b,t]是音頻信號的單位響度,b是頻率的度量,以及t是時間的度量。
在時間和頻率變化定標(biāo)因子的情況(a)中,至少可以部分地通過期望的多頻帶響度和音頻信號的多頻帶響度之比確定所述定標(biāo)。這種定標(biāo)可以用作動態(tài)范圍控制。應(yīng)用本發(fā)明的這些方面作為動態(tài)范圍控制的進(jìn)一步細(xì)節(jié)在以下進(jìn)行闡述。
而且在時間和頻率變化定標(biāo)因子的情況(a)中,通過期望頻譜形狀的度量和音頻信號頻譜形狀的度量之比可以定標(biāo)所述單位響度。這種定標(biāo)可以被應(yīng)用于將音頻信號的感覺頻譜從時間變化的感覺頻譜變換成基本上時間恒定的感覺頻譜。當(dāng)通過期望頻譜形狀的度量和音頻信號頻譜形狀的度量定標(biāo)單位響度時,這種定標(biāo)可以用作動態(tài)均衡器。應(yīng)用本發(fā)明的這些方面作為動態(tài)均衡器的進(jìn)一步細(xì)節(jié)在以下進(jìn)行闡述。
在時間變化、頻率恒定定標(biāo)因子的情況(b)中,至少可以部分地通過期望的寬帶響度和音頻信號的寬帶響度之比來確定所述定標(biāo)。這種定標(biāo)可以用作自動增益控制或動態(tài)范圍控制。應(yīng)用本發(fā)明的這些方面作為自動增益控制或動態(tài)范圍控制的進(jìn)一步細(xì)節(jié)在以下進(jìn)行闡述。
在情況(a)(時間和頻率變化定標(biāo)因子)或情況(b)(時間變化、頻率恒定定標(biāo)因子)中,所述定標(biāo)因子可以是音頻信號或音頻信號度量的函數(shù)。
在時間恒定、頻率變化定標(biāo)因子的情況(c)或時間恒定、頻率恒定定標(biāo)因子的情況(d)中,所述修改或?qū)С隹梢园ù鎯Χ?biāo)因子或從外部來源接收定標(biāo)因子。
在(c)和(d)的任何一種情況中,定標(biāo)因子可以不是音頻信號或音頻信號度量的函數(shù)。
在本發(fā)明各個方面及其變型中任何一個中,修改、導(dǎo)出、或再現(xiàn)可以以不同的方式、顯式或隱式地計(jì)算(1)單位響度,和/或(2)部分單位響度,和/或(3)目標(biāo)單位響度。顯式計(jì)算可以包含例如查詢表或封閉式數(shù)學(xué)表達(dá)式。
修改參數(shù)可以被時間平滑。修改參數(shù)可以例如是(1)和音頻信號頻帶相關(guān)的多個幅度定標(biāo)因子或(2)控制諸如多抽頭FIR濾波器或多極IIR濾波器的一個或更多濾波器的多個濾波器系數(shù)。所述定標(biāo)因子或?yàn)V波器系數(shù)(以及應(yīng)用它們的濾波器)可以是時間變化的。
在計(jì)算定義目標(biāo)單位響度的音頻信號的單位響度的函數(shù)或該函數(shù)的反函數(shù)中,執(zhí)行這種計(jì)算的處理以可以被表征為感覺(心理聲學(xué))響度域的方式操作-該計(jì)算的輸入和輸出是單位響度。相反,在應(yīng)用幅度定標(biāo)因子于音頻信號的頻帶中或應(yīng)用濾波器系數(shù)于音頻信號的可控制濾波中,修改參數(shù)進(jìn)行操作以修改在可以被表征為電信號域的感覺(心理聲學(xué))響度域之外的音頻信號。盡管對音頻信號的修改可以用于電信號域中的音頻信號,但是在感覺(心理聲學(xué))響度域中根據(jù)計(jì)算導(dǎo)出這種電信號域中的改變以便經(jīng)修改的音頻信號具有近似期望的目標(biāo)單位響度的單位響度。
通過根據(jù)在響度域中的計(jì)算導(dǎo)出修改參數(shù),可以比如果在電信號域中導(dǎo)出這種修改參數(shù)實(shí)現(xiàn)在感覺響度和感覺頻譜平衡上的較強(qiáng)控制。另外,在執(zhí)行響度域計(jì)算中使用模擬心理聲學(xué)濾波器組的基膜或其等效物可以比在電信號域中導(dǎo)出修改參數(shù)的結(jié)構(gòu)提供更詳細(xì)的感覺頻譜控制。
修改、導(dǎo)出、和再現(xiàn)中的每一個可以取決于干擾音頻信號度量、目標(biāo)單位響度、根據(jù)經(jīng)修改音頻信號的單位響度或部分單位響度導(dǎo)出的未經(jīng)修改音頻信號的單位響度估計(jì)、未經(jīng)修改音頻信號的單位響度、以及根據(jù)經(jīng)修改音頻信號的單位響度或部分單位響度導(dǎo)出的目標(biāo)單位響度近似中一個或更多。
所述修改或?qū)С隹梢灾辽俨糠值馗鶕?jù)干擾音頻信號的度量、目標(biāo)單位響度、根據(jù)經(jīng)修改音頻信號的單位響度或部分單位響度導(dǎo)出的未經(jīng)修改音頻信號的單位響度的估計(jì)、未經(jīng)修改音頻信號的單位響度、以及根據(jù)經(jīng)修改音頻信號的單位響度或部分單位響度導(dǎo)出的目標(biāo)單位響度的近似之一或更多導(dǎo)出修改參數(shù)。
更具體而言,所述修改或?qū)С隹梢灾辽俨糠值馗鶕?jù)以下導(dǎo)出修改參數(shù)(1)目標(biāo)單位響度和從經(jīng)修改音頻信號的單位響度所導(dǎo)出的未經(jīng)修改音頻信號的單位響度的估計(jì)之一,以及(2)未經(jīng)修改音頻信號的單位響度和根據(jù)經(jīng)修改音頻信號的單位響度導(dǎo)出的目標(biāo)單位響度的近似之一,或者當(dāng)考慮干擾音頻信號時,所述修改或?qū)С隹梢灾辽俨糠值馗鶕?jù)以下導(dǎo)出修改參數(shù)(1)干擾音頻信號的度量,(2)目標(biāo)單位響度和根據(jù)經(jīng)修改音頻信號的部分單位響度導(dǎo)出的未經(jīng)修改音頻信號的單位響度估計(jì)之一,以及(3)未經(jīng)修改音頻信號的單位響度和根據(jù)經(jīng)修改音頻信號的部分單位響度導(dǎo)出的目標(biāo)單位響度的近似之一。
可以應(yīng)用前饋結(jié)構(gòu),其中根據(jù)音頻信號導(dǎo)出單位響度以及從方法外部源接收目標(biāo)單位響度或者當(dāng)修改或?qū)С霭ù鎯δ繕?biāo)單位響度時從存儲接收該目標(biāo)單位響度。可替換地,可以應(yīng)用混合前饋/反饋結(jié)構(gòu),其中根據(jù)經(jīng)修改的音頻信號導(dǎo)出目標(biāo)單位響度的近似以及從方法外部源接收目標(biāo)單位響度或者當(dāng)所述修改或?qū)С霭ù鎯δ繕?biāo)單位響度時從存儲接收該目標(biāo)單位響度。
所述修改或?qū)С隹梢园ㄓ糜陲@式或隱式獲得目標(biāo)單位響度的一個或更多處理,其中的一個處理或更多處理顯式或隱式地計(jì)算音頻信號或音頻信號度量的函數(shù)。在一種替換中,可以應(yīng)用根據(jù)音頻信號導(dǎo)出單位響度和目標(biāo)單位響度的前饋結(jié)構(gòu),目標(biāo)單位響度的導(dǎo)出應(yīng)用音頻信號或音頻信號度量的函數(shù)。在另一種替換中,可以應(yīng)用根據(jù)經(jīng)修改音頻信號導(dǎo)出目標(biāo)單位響度的近似以及根據(jù)音頻信號導(dǎo)出目標(biāo)單位響度的混合前饋/反饋結(jié)構(gòu),目標(biāo)單位響度的導(dǎo)出應(yīng)用音頻信號或音頻信號度量的函數(shù)。
所述修改或?qū)С隹梢园@式或隱式地響應(yīng)于經(jīng)修改的音頻信號獲得未經(jīng)修改音頻信號的單位響度估計(jì)的一個或更多處理,其中一個處理或更多處理顯式或隱式地計(jì)算音頻信號或音頻信號度量的函數(shù)的反函數(shù)。在一種替換中,應(yīng)用根據(jù)經(jīng)修改音頻信號導(dǎo)出未經(jīng)修改音頻信號的單位響度的估計(jì)和目標(biāo)單位響度的近似的反饋結(jié)構(gòu),單位響度的估計(jì)使用音頻信號音頻信號度量的函數(shù)的反函數(shù)或進(jìn)行計(jì)算。在另一種替換中,應(yīng)用根據(jù)音頻信號導(dǎo)出單位響度以及根據(jù)經(jīng)修改音頻信號導(dǎo)出未經(jīng)修改音頻信號的單位響度估計(jì)的混合前饋/反饋結(jié)構(gòu),估計(jì)的導(dǎo)出使用音頻信號或音頻信號度量的所述函數(shù)的反函數(shù)進(jìn)行計(jì)算。
修改參數(shù)可以應(yīng)用于音頻信號以產(chǎn)生經(jīng)修改的音頻信號。
本發(fā)明的另一個方面在于可以存在處理或設(shè)備的時間和/或空間分離,以便實(shí)際上存在編碼器或編碼以及還有解碼器或解碼。例如,可以存在編碼/解碼系統(tǒng),其中所述修改或?qū)С隹梢园l(fā)送和接收或存儲以及還再現(xiàn)音頻信號以及(1)修改參數(shù)或(2)目標(biāo)單位響度或目標(biāo)單位響度的表示。可替換地,實(shí)際上可以僅存在編碼器或編碼,其中發(fā)送或存儲音頻信號和(1)修改參數(shù)或(2)目標(biāo)單位響度或目標(biāo)單位響度的表示。可替換地,如上所述,實(shí)際上可以僅存在解碼器或解碼,其中接收和再現(xiàn)音頻信號(1)修改參數(shù)或(2)目標(biāo)單位響度或目標(biāo)單位響度的表示。


圖1是示例根據(jù)本發(fā)明方面的前饋實(shí)現(xiàn)實(shí)例的功能框圖。
圖2是示例根據(jù)本發(fā)明方面的反饋實(shí)現(xiàn)實(shí)例的功能框圖。
圖3是示例根據(jù)本發(fā)明方面的混合前饋/反饋實(shí)現(xiàn)實(shí)例的功能框圖。
圖4是示例根據(jù)本發(fā)明方面的另一種混合前饋/反饋實(shí)現(xiàn)實(shí)例的功能框圖。
圖5是示例可以存儲或發(fā)送如通過前饋、反饋、和混合前饋反饋結(jié)構(gòu)中任何一個所確定的未經(jīng)修改音頻信號和修改參數(shù)用于例如時間或空間分離設(shè)備或處理中的方式的功能框圖。
圖6是示例可以存儲或發(fā)送如通過前饋、反饋、和混合前饋反饋結(jié)構(gòu)中任何一個所確定的未經(jīng)修改音頻信號和目標(biāo)單位響度或其表示用于例如時間或空間分離設(shè)備或處理中的方式的功能框圖。
圖7是顯示本發(fā)明方面的概述的示意功能框圖或示意流程圖。
圖8是在本發(fā)明實(shí)施例中適合用作傳輸濾波器的線性濾波器P(z)的理想特性響應(yīng),其中垂直軸是單位為分貝(dB)的衰減以及水平軸是對數(shù)底為10單位為Hz的頻率。
圖9所示為ERB頻率標(biāo)度(垂直軸)和單位為Hz的頻率(水平軸)之間的關(guān)系。
圖10所示為近似臨界頻帶的設(shè)置的理想聽覺濾波器特性響應(yīng)。水平標(biāo)度是單位為Hz的頻率以及垂直標(biāo)度是單位為分貝的級。
圖11所示為ISO226的等響度輪廓。水平標(biāo)度是單位為Hz的頻率(對數(shù)底為10的標(biāo)度)以及垂直標(biāo)度是單位為分貝的聲壓級。
圖12所示為通過傳輸濾波器P(z)規(guī)格化的ISO226的等響度輪廓。水平標(biāo)度是單位為Hz的頻率(對數(shù)底為10的標(biāo)度)以及垂直標(biāo)度是單位為分貝的聲壓級。
圖13a是顯示用于在柔和語音段上0.25響度定標(biāo)的寬帶和多頻帶增益的理想化圖。水平標(biāo)度是ERB頻帶和垂直標(biāo)度是單位為分貝(dB)的相對增益。
圖13b是分別顯示原始信號、寬帶增益修改信號、以及多頻帶增益修改信號的單位響度的理想化圖。水平標(biāo)度是ERB頻帶以及垂直標(biāo)度是單位響度(宋/ERB)。
圖14a是顯示作為用于典型AGC的Li[t]的函數(shù)的L0[t]的理想化圖。水平標(biāo)度是log(Li[t])以及垂直標(biāo)度是log(L0[t])。
圖14b是顯示作為用于典型DRC的Li[t]的函數(shù)的L0[t]的理想化圖。水平標(biāo)度是log(Li[t])以及垂直標(biāo)度是log(L0[t])。
圖15是顯示用于多頻帶DRC的典型頻帶平滑函數(shù)的理想化圖。水平標(biāo)度是頻帶號以及垂直標(biāo)度是頻帶b的增益輸出。
圖16是顯示本發(fā)明方面的概述的示意功能框圖或示意流程圖。
圖17是類似于圖1的示意功能框圖或示意流程圖,它還包括補(bǔ)償重放環(huán)境中的噪聲。
具體實(shí)施例方式
圖1到4所示為示例根據(jù)本發(fā)明方面的可能的前饋、反饋、以及兩種型式的混合前饋/反饋實(shí)現(xiàn)實(shí)例的功能框圖。
參考圖1中的前饋拓?fù)涞膶?shí)例,音頻信號被施加于兩個通道(1)具有能夠響應(yīng)于修改參數(shù)以修改音頻的處理或設(shè)備2的信號通道(“修改音頻信號”),和(2)具有能夠產(chǎn)生這些修改參數(shù)的處理或設(shè)備4的控制通道(“產(chǎn)生修改參數(shù)”)。在圖1中前饋拓?fù)鋵?shí)例以及圖2-4每個實(shí)例中的修改音頻信號2可以是根據(jù)從產(chǎn)生修改參數(shù)4(或分別從圖2-4每個實(shí)例中的對應(yīng)處理或設(shè)備4’、4”和4_)接收的修改參數(shù)M以頻率和/或時間變化的方式修改音頻信號例如其幅度的設(shè)備或處理。產(chǎn)生修改參數(shù)4及其圖2-4中的對應(yīng)部分的每一個至少部分在感覺響度域中操作。在圖1-4的每個實(shí)例中修改音頻信號2在電信號域中操作并產(chǎn)生修改的音頻信號。而且在圖1-4的每個實(shí)例中,修改音頻信號2和產(chǎn)生修改參數(shù)4(或其對應(yīng)部分)修改所述音頻信號以減小其單位響度和目標(biāo)單位響度之間的差值。
在圖1的前饋實(shí)例中,處理或設(shè)備4可以包括若干處理和/或設(shè)備響應(yīng)于音頻信號或音頻信號的度量諸如音頻信號的單位響度計(jì)算目標(biāo)單位響度“計(jì)算目標(biāo)單位響度”處理或設(shè)備6,響應(yīng)于音頻信號或音頻信號的度量諸如它的激勵計(jì)算音頻信號的單位響度的“計(jì)算單位響度”處理或設(shè)備8,以及響應(yīng)于單位響度和目標(biāo)單位響度計(jì)算修改參數(shù)的“計(jì)算修改參數(shù)”處理或設(shè)備10。計(jì)算目標(biāo)單位響度6可以執(zhí)行一個或更多函數(shù)“F”,每個函數(shù)可以具有函數(shù)參數(shù)。例如,它可以計(jì)算音頻信號的單位響度以及然后應(yīng)用一個或更多函數(shù)F給它以提供目標(biāo)單位響度。這在圖1中被示意性指示為處理或設(shè)備6的“選擇函數(shù)F和函數(shù)參數(shù)”輸入。代替通過設(shè)備或處理6進(jìn)行計(jì)算,目標(biāo)單位響度可以由包括在產(chǎn)生修改參數(shù)4中或與它相關(guān)的存儲處理或設(shè)備(示意性示為處理或設(shè)備10的“存儲”輸入)提供,或者通過整個處理或設(shè)備的外部源(示意性示為處理或設(shè)備10的“外部”輸入)提供。因此,所述修改參數(shù)至少部分基于在感覺(心理聲學(xué))響度域中的計(jì)算(即,至少單位響度,以及在某些情況下基于目標(biāo)單位響度計(jì)算)。
處理或設(shè)備6、8和10(以及圖2實(shí)例中的處理或設(shè)備12、14、10’,圖3實(shí)例中的6、14、10”,圖4實(shí)例中的8、12、10_)執(zhí)行的計(jì)算可以被顯式和/或隱式地執(zhí)行。顯式執(zhí)行的實(shí)例包括(1)查詢表,它的項(xiàng)目全部或部分地基于單位響度和/或目標(biāo)單位響度和/或修改參數(shù)計(jì)算,以及(2)封閉式數(shù)學(xué)表達(dá)式,它本質(zhì)上全部或部分地基于單位響度和/或目標(biāo)單位響度和/或修改參數(shù)。
盡管示意性示出并且單獨(dú)地描述圖1實(shí)例的計(jì)算處理或設(shè)備6、8和10(以及圖2實(shí)例中的處理或設(shè)備12、14、10’,圖3實(shí)例中的6、14、10”,圖4實(shí)例中的8、12、10_),但是這僅僅是為了說明的目的。將會明白這些處理或設(shè)備的部分或全部可以被組合到單個處理或設(shè)備中或以不同的方式組合到多個處理或設(shè)備中。例如,在以下圖9的結(jié)構(gòu)中,如圖1實(shí)例中的前饋拓?fù)洌?jì)算修改參數(shù)的處理或設(shè)備響應(yīng)于根據(jù)音頻信號和目標(biāo)單位響度導(dǎo)出的平滑激勵這樣做。在圖9的實(shí)例中,顯式計(jì)算修改參數(shù)的設(shè)備或處理計(jì)算音頻信號的單位響度。
作為本發(fā)明的一個方面,在圖1的實(shí)例以及在這里本發(fā)明實(shí)施例的其他實(shí)例中,通過利用一個或更多定標(biāo)因子定標(biāo)所述單位響度N[b,t]可以計(jì)算目標(biāo)單位響度 這種定標(biāo)可以是以如下關(guān)系定標(biāo)所述單位響度的時間和頻率變化的定標(biāo)因子Ξ[b,t]N^[b,t]=Ξ[b,t]N[b,t],]]>以如下關(guān)系定標(biāo)單位響度的時間變化、頻率恒定的定標(biāo)因子Ф[t]N^[b,t]=Φ[t]N[b,t],]]>以如下關(guān)系定標(biāo)單位響度的時間恒定、頻率變化的定標(biāo)因子Θ[b]N^[b,t]=Θ[b]N[b,t],]]>或以如下關(guān)系定標(biāo)音頻信號的單位響度的定標(biāo)因子αN^[b,t]=αN[b,t],]]>其中,b是頻率的度量(例如頻帶號)以及t是時間的度量(例如塊號)。還可以使用特定定標(biāo)的多個實(shí)例和/或特定定標(biāo)的組合應(yīng)用多個定標(biāo)。以下給出這些多個定標(biāo)的實(shí)例。在某些情況下,如以下進(jìn)一步的說明,所述定標(biāo)可以是音頻信號或音頻信號度量的函數(shù)。在其他情況下,正如以下進(jìn)一步的說明,當(dāng)所述定標(biāo)不是音頻信號度量的函數(shù)時,同樣可以確定或提供該定標(biāo)。例如,用戶能夠選擇或應(yīng)用時間和頻率恒定的定標(biāo)因子α或時間恒定、頻率變化的定標(biāo)因子Θ[b]定標(biāo)。
因此,目標(biāo)單位響度可以被表示為音頻信號或音頻信號度量的一個或更多函數(shù)F(單位響度是音頻信號的一個可能的度量)N^[b,t]=F(N[b,t]).]]>如果函數(shù)F是可逆的,未經(jīng)修改音頻信號的單位響度(N[b,t])可以計(jì)算為目標(biāo)單位響度 的反函數(shù)或函數(shù)F-1N^[b,t]=F-1(N^[b,t]).]]>正如在以下將會看到,在圖2和4的反饋和混合前饋/反饋實(shí)例中計(jì)算反函數(shù)或函數(shù)F-1。
用于計(jì)算目標(biāo)單位響度6的“選擇函數(shù)和函數(shù)參數(shù)”輸入被示出以指示設(shè)備或處理6可以根據(jù)一個或更多函數(shù)參數(shù)通過應(yīng)用一個或更多函數(shù)計(jì)算目標(biāo)單位響度。例如,計(jì)算目標(biāo)單位響度8可以計(jì)算音頻信號的單位響度的函數(shù)“F”以便定義目標(biāo)單位響度。例如,“選擇函數(shù)參數(shù)”輸入可以選擇落入上述類型定標(biāo)之一或更多中的一個或更多特定函數(shù),以及諸如關(guān)于函數(shù)的常數(shù)(例如定標(biāo)因子)的一個或更多函數(shù)參數(shù)。
如上所指示,與定標(biāo)相關(guān)的所述定標(biāo)因子可以用作目標(biāo)單位響度的表示因?yàn)槟繕?biāo)單位響度可以被計(jì)算單位響度的定標(biāo)。因此,在以下描述和上述的圖9實(shí)例中,可以通過定標(biāo)因子和激勵對查詢表進(jìn)行索引,從而單位響度和目標(biāo)單位響度的計(jì)算固有位于該表中。
無論是應(yīng)用查詢表、封閉式數(shù)學(xué)表達(dá)式還是其他技術(shù),產(chǎn)生修改參數(shù)4的操作(及其在圖2-4每個實(shí)例中的對應(yīng)處理或設(shè)備4’、4”和4_)都是這樣的,即所述計(jì)算基于感覺(心理聲學(xué))響度域即使可以不顯式地計(jì)算單位響度和目標(biāo)單位響度。存在顯式的單位響度或存在抽象的隱式單位響度。類似地,存在顯式的目標(biāo)單位響度或存在抽象的隱式目標(biāo)單位響度。在任何情況下,修改參數(shù)的計(jì)算旨在產(chǎn)生修改音頻信號以減小單位響度和目標(biāo)單位響度之差的修改參數(shù)。
在具有諸如噪聲的次干擾音頻信號的重放環(huán)境中,計(jì)算修改參數(shù)10(及其分別在圖2-4每個實(shí)例中的對應(yīng)處理或設(shè)備10’、10”和10_)還可以接收這種次干擾音頻信號的度量作為可選的輸入或者次干擾信號本身作為其輸入之一。這種可選的輸入在圖1(以及圖2-4)中示為虛引線。次干擾信號的度量可以是它的激勵諸如在以下描述的圖17實(shí)例中。應(yīng)用干擾信號度量或信號本身(假設(shè)干擾信號單獨(dú)可用于處理)于圖1中的計(jì)算修改參數(shù)處理或設(shè)備10(及其分別在圖2-4實(shí)例中的相應(yīng)處理或設(shè)備10’、10”和10_)允許適當(dāng)配置的這種處理或設(shè)備在標(biāo)題“噪聲補(bǔ)償”下如以下進(jìn)一步的說明計(jì)算考慮干擾信號的修改參數(shù)。在圖2-4的實(shí)例中,部分單位響度的計(jì)算假設(shè)干擾信號的適當(dāng)度量不僅被應(yīng)用于相應(yīng)的計(jì)算修改參數(shù)10’、10”或10_,而且還被應(yīng)用于“計(jì)算未經(jīng)修改音頻的單位響度的近似”處理或設(shè)備12和/或“計(jì)算目標(biāo)單位響度的近似”處理或設(shè)備14以便方便通過該函數(shù)或設(shè)備計(jì)算部分單位響度。在圖1的前饋實(shí)例中,不顯式地計(jì)算部分單位響度-圖1的計(jì)算修改參數(shù)10計(jì)算適當(dāng)?shù)男薷膮?shù)以使經(jīng)修改音頻的部分單位響度近似所述目標(biāo)單位響度。這在以下的標(biāo)題“噪聲補(bǔ)償”下進(jìn)行進(jìn)一步的說明。
如上所述,在圖1-4的每個實(shí)例中,當(dāng)修改參數(shù)M被音頻信號修改器2應(yīng)用于音頻信號時,該參數(shù)減小所產(chǎn)生的經(jīng)修改音頻信號的單位響度或部分單位響度與目標(biāo)單位響度之差。在理想情況下,經(jīng)修改音頻信號的單位響度與目標(biāo)單位響度嚴(yán)密地近似或相同。所述修改參數(shù)M例如可以采取被應(yīng)用于根據(jù)濾波器組所導(dǎo)出頻帶的時間變化增益因子或時間變化濾波器系數(shù)的形式。因此,在所有圖1-4實(shí)例中,修改音頻信號2可以例如被實(shí)現(xiàn)為多個幅度定標(biāo)器,每個定標(biāo)器在一頻帶中工作,或?qū)崿F(xiàn)為時間變化濾波器(例如,多抽頭FIR濾波器或多極IIR濾波器)。
在本文的這里或其他地方,使用相同的附圖標(biāo)記指示設(shè)備或處理可以基本上與另一個或其他具有相同附圖標(biāo)記的設(shè)備或處理相同。具有撇號的附圖標(biāo)記(例如,10’)指示該設(shè)備或處理在結(jié)構(gòu)或功能方面相類似但可以是具有相同基本附圖標(biāo)記或其帶撇號型式的另一個或其他設(shè)備或處理的修改。
在一定的約束下,可以實(shí)現(xiàn)圖1中前饋實(shí)例的幾乎等效的反饋結(jié)構(gòu)。圖2描述了音頻信號還在單個通道中被應(yīng)用于修改音頻信號處理或設(shè)備2的這樣一個實(shí)例。處理或設(shè)備2還從控制通道接收修改參數(shù)M,反饋結(jié)構(gòu)中的產(chǎn)生修改參數(shù)處理或設(shè)備4’在該通道中從修改音頻信號2的輸出接收經(jīng)修改的音頻信號作為它的輸入。因此,在圖2的實(shí)例中,經(jīng)修改的音頻而不是未經(jīng)修改的音頻被應(yīng)用于控制通道。修改音頻信號處理或設(shè)備2以及產(chǎn)生修改參數(shù)處理或設(shè)備4’修改所述音頻信號以減小它的單位響度和目標(biāo)單位響度之間的差。處理或設(shè)備4’可以包括若干功能或設(shè)備“計(jì)算未經(jīng)修改音頻單位響度的近似”處理或設(shè)備12、“計(jì)算目標(biāo)單位響度的近似”處理或設(shè)備14、以及計(jì)算修改參數(shù)的“計(jì)算修改參數(shù)”處理或設(shè)備10’。
利用函數(shù)F可逆的約束,處理或設(shè)備12通過應(yīng)用反函數(shù)F-1給經(jīng)修改音頻信號的單位響度或部分單位響度估計(jì)未經(jīng)修改音頻信號的單位響度。如上所述,設(shè)備或處理12可以計(jì)算反函數(shù)F-1。這在圖2中被示意性指示為處理或設(shè)備12的“選擇反函數(shù)F-1和函數(shù)參數(shù)”輸入。“計(jì)算目標(biāo)單位響度的近似”14通過計(jì)算經(jīng)修改音頻信號的單位響度或部分單位響度進(jìn)行操作。這種單位響度或部分單位響度是目標(biāo)單位響度的近似。未經(jīng)修改音頻信號的單位響度的近似和目標(biāo)單位響度的近似被計(jì)算修改參數(shù)10’用來導(dǎo)出修改參數(shù)M,如果該參數(shù)被修改音頻信號2應(yīng)用于音頻信號,它將減小經(jīng)修改音頻信號的單位響度或部分單位響度與所述目標(biāo)單位響度之差。如上所述,這些修改參數(shù)M可以例如采取被應(yīng)用于濾波器組頻帶的時間變化增益或時間變化濾波器的系數(shù)的形式。在計(jì)算修改參數(shù)10”的實(shí)際實(shí)施例中,反饋環(huán)路可能在修改參數(shù)M的計(jì)算和應(yīng)用之間引入延遲。
如上所述,在具有諸如噪聲的次干擾音頻信號的重放環(huán)境中,計(jì)算修改參數(shù)10、計(jì)算未經(jīng)修改音頻單位響度的近似12、以及計(jì)算目標(biāo)單位響度的近似14其每一個可以接收這種次干擾音頻信號的度量作為可選的輸入或次干擾信號本身作為其輸入之一并且處理或設(shè)備12以及處理或設(shè)備14每個可以計(jì)算經(jīng)修改音頻信號的部分單位響度。在圖2中使用虛引線示出這種可選的輸入。
如上所述,本發(fā)明方面的混合前饋/反饋實(shí)現(xiàn)實(shí)例也是可能的。圖3和4示出了這些實(shí)現(xiàn)的兩個實(shí)例。正如在圖1和2的實(shí)例中,在圖3和4的實(shí)例中,所述音頻信號還在信號通道中被應(yīng)用于修改音頻信號處理或設(shè)備2,但是產(chǎn)生修改參數(shù)(圖3中的4”和圖4中的4_)在相應(yīng)的控制通道中每個都接收未經(jīng)修改的音頻信號和經(jīng)修改的音頻信號。在圖3和4的實(shí)例中,修改音頻信號2和產(chǎn)生修改參數(shù)(分別是4”和4_)修改所述音頻信號以減小它的可能是隱式的單位響度和也可以是隱式的目標(biāo)單位響度之間的差。
在圖3的實(shí)例中,產(chǎn)生修改參數(shù)處理或設(shè)備4’可以包括若干功能和或設(shè)備如圖1實(shí)例中的計(jì)算目標(biāo)單位響度6、如圖2反饋實(shí)例中的計(jì)算目標(biāo)單位響度的近似14、以及如圖1實(shí)例中的“計(jì)算修改參數(shù)”處理或設(shè)備10”。如在圖1的實(shí)例中,在這種混合前饋/反饋實(shí)例的前饋部分中,計(jì)算目標(biāo)單位響度6可以執(zhí)行一個或更多函數(shù)“F”,其中每個函數(shù)可以具有函數(shù)參數(shù)。這在圖3中被示意性指示為處理或設(shè)備6的“選擇函數(shù)F和函數(shù)參數(shù)”輸入。在這種混合前饋/反饋實(shí)例的反饋部分中,經(jīng)修改的音頻信號被應(yīng)用于計(jì)算目標(biāo)單位響度14的近似,如在圖2的反饋實(shí)例中。設(shè)備或處理14在圖3的實(shí)例中如在圖2的實(shí)例一樣通過計(jì)算經(jīng)修改音頻信號的單位響度或部分單位響度進(jìn)行操作。這種單位響度或部分單位響度是目標(biāo)單位響度的近似。目標(biāo)單位響度(來自處理或設(shè)備6)以及目標(biāo)單位響度的近似(來自處理或設(shè)備14)被應(yīng)用于計(jì)算修改參數(shù)10”以導(dǎo)出修改參數(shù)M,如果該參數(shù)被修改音頻信號2應(yīng)用于音頻信號,將減小未經(jīng)修改音頻信號的單位響度和目標(biāo)單位響度之差。如上所述,這些修改參數(shù)M可以例如采取應(yīng)用于濾波器組頻帶的時間變化增益或時間變化濾波器系數(shù)的形式。在實(shí)際的實(shí)施中,反饋環(huán)路可以在修改參數(shù)M的計(jì)算和應(yīng)用之間引入延遲。如上所述,在具有諸如噪聲的次干擾音頻信號的重放環(huán)境中,計(jì)算修改參數(shù)10”和計(jì)算目標(biāo)單位響度14的近似其中每一個還可以接收這種次干擾音頻信號的度量作為可選的輸入或次干擾信號本身作為它的輸入之一以及處理或設(shè)備14可以計(jì)算經(jīng)修改音頻信號的部分單位響度。所述可選的輸入在圖3中使用虛引線示出。
計(jì)算修改參數(shù)10”可以應(yīng)用誤差檢測設(shè)備或函數(shù),從而它的目標(biāo)單位響度和目標(biāo)單位響度近似輸入之差調(diào)節(jié)所述修改參數(shù)以減小目標(biāo)單位響度的近似和“實(shí)際的”目標(biāo)單位響度之間的差。這些調(diào)節(jié)減小未經(jīng)修改音頻信號的單位響度和可以是隱式的所述目標(biāo)單位響度之間的差。因此,修改參數(shù)M可以被基于在前饋通道中根據(jù)原始音頻的單位響度使用函數(shù)F計(jì)算的目標(biāo)單位響度和在反饋通道中根據(jù)經(jīng)修改音頻的單位響度或部分單位響度計(jì)算的目標(biāo)單位響度近似之間的誤差進(jìn)行更新。
在圖4的實(shí)例中,示出了替換的前饋/反饋實(shí)例。這種替換不同于圖3的實(shí)例之處在于在反饋通道中計(jì)算反函數(shù)或函數(shù)F-1而不是在前饋通道中計(jì)算函數(shù)F。在圖4的實(shí)例中,產(chǎn)生修改參數(shù)處理或設(shè)備4’可以包括若干功能和或設(shè)備如圖1前饋實(shí)例中的計(jì)算單位響度8、如圖2反饋實(shí)例中的計(jì)算未經(jīng)修改音頻信號12的單位響度的近似、以及計(jì)算修改參數(shù)10_。如圖1前饋實(shí)例中的計(jì)算單位響度8提供未經(jīng)修改音頻信號的單位響度作為計(jì)算修改參數(shù)10_的輸入。如在圖2的反饋實(shí)例中,約束條件是函數(shù)F是可逆的,處理或設(shè)備12通過應(yīng)用反函數(shù)F-1給經(jīng)修改音頻信號的單位響度或部分單位響度以估計(jì)未經(jīng)修改音頻信號的單位響度。如上所述,計(jì)算未經(jīng)修改音頻12的單位響度近似的“選擇反函數(shù)和反函數(shù)參數(shù)”輸入被示出以指示設(shè)備或處理12可以計(jì)算反函數(shù)F-1。這在圖4中被示意性指示為處理或設(shè)備12的“選擇反函數(shù)F-1和函數(shù)參數(shù)”輸入。因此,處理或設(shè)備12提供未經(jīng)修改音頻信號的單位響度的近似作為計(jì)算修改參數(shù)10_的另一個輸入。
如在圖1-3的實(shí)例中,計(jì)算修改參數(shù)10_導(dǎo)出修改參數(shù)M,如果該參數(shù)被修改音頻信號2應(yīng)用于音頻信號,將減小未經(jīng)修改音頻信號的單位響度和在本實(shí)例中隱式的目標(biāo)單位響度之間的差。如上所述,修改參數(shù)M可以例如采取應(yīng)用于濾波器組頻帶的時間變化增益或時間變化濾波器系數(shù)的形式。在實(shí)際的實(shí)施中,反饋環(huán)路可以在修改參數(shù)M的計(jì)算和應(yīng)用之間引入延遲。如上所述,在具有諸如噪聲的次干擾音頻信號的重放環(huán)境中,計(jì)算修改參數(shù)10_和計(jì)算未經(jīng)修改音頻12的單位響度近似其中每個還接收這種次干擾音頻信號的度量作為可選的輸入或次干擾信號本身作為它的輸入之一以及處理或設(shè)備12可以計(jì)算經(jīng)修改音頻信號的部分單位響度。所述可選的輸入在圖4中使用虛引線示出。
計(jì)算修改參數(shù)10_可以應(yīng)用誤差檢測設(shè)備或函數(shù),從而它的目標(biāo)單位響度和目標(biāo)單位響度近似輸入之差產(chǎn)生調(diào)節(jié)所述修改參數(shù)的輸出以減小單位響度的近似和“實(shí)際的”單位響度之間的差。由于單位響度的近似根據(jù)經(jīng)修改音頻的單位響度或部分單位響度進(jìn)行導(dǎo)出,這能夠被視為目標(biāo)單位響度的近似,所以這些調(diào)節(jié)將減小經(jīng)修改音頻信號的單位響度和目標(biāo)單位響度之間的差,所述單位響度近似在本質(zhì)上以F-1函數(shù)。因此,修改參數(shù)M可以基于在前饋通道中根據(jù)原始音頻計(jì)算的單位響度,和在反饋通道中使用反函數(shù)或函數(shù)F-1根據(jù)經(jīng)修改音頻的單位響度或部分單位響度計(jì)算的單位響度近似之間的誤差進(jìn)行更新。由于所述反饋通道,實(shí)際的實(shí)現(xiàn)可以在修改參數(shù)的更新和應(yīng)用之間引入延遲。
盡管圖1-4實(shí)例中的修改參數(shù)M當(dāng)被應(yīng)用于修改音頻信號處理或設(shè)備2時減小音頻信號的單位響度和目標(biāo)單位響度之差,在實(shí)際的實(shí)施中響應(yīng)于同一音頻信號產(chǎn)生的相應(yīng)修改參數(shù)不可以彼此相同。
盡管對于本發(fā)明的方面不關(guān)鍵或不必要,音頻信號或經(jīng)修改音頻信號的單位響度的計(jì)算可以有利地應(yīng)用在第PCT/US2004/016964號、公開號為WO2004/111964A2的所述國際專利申請中所闡述的技術(shù),其中所述計(jì)算從一組兩個或更多單位響度模型函數(shù)中選擇兩個或更多單位響度模型函數(shù)之一或組合,這種選擇受輸入音頻信號特征的度量的控制。圖1中單位響度104的描述在以下描述了這種結(jié)構(gòu)。
根據(jù)本發(fā)明的其他方面,未經(jīng)修改的音頻信號和(1)修改參數(shù)或(2)目標(biāo)單位響度或目標(biāo)單位響度的表示(例如在顯式或隱式地計(jì)算目標(biāo)單位響度中可使用的定標(biāo)因子)可以被存儲或發(fā)送用于例如時間和/或空間分離的設(shè)備或處理中。修改參數(shù)、目標(biāo)單位響度、或目標(biāo)單位響度的表示可以以任何適當(dāng)?shù)姆绞酱_定,例如以如上所述的圖1-4的前饋、反饋、和混合前饋反饋結(jié)構(gòu)實(shí)例之一。實(shí)際上,諸如圖1實(shí)例中的前饋結(jié)構(gòu)是最小復(fù)雜度和最快速的因?yàn)樗苊饬嘶诮?jīng)修改音頻信號的計(jì)算。發(fā)送或存儲未經(jīng)修改音頻和修改參數(shù)的實(shí)例在圖5中示出,而發(fā)送或存儲未經(jīng)修改音頻和目標(biāo)單位響度或目標(biāo)單位響度表示的實(shí)例在圖6中示出。
諸如圖5實(shí)例中的結(jié)構(gòu)可以被用于時間和/或空間地分離修改參數(shù)到音頻信號的應(yīng)用與這些修改參數(shù)的產(chǎn)生。諸如在圖6實(shí)例中的結(jié)構(gòu)可以被用于時間和/或空間地分離修改產(chǎn)生的產(chǎn)生和應(yīng)用與目標(biāo)單位響度或目標(biāo)單位響度表示的產(chǎn)生。兩種類型的結(jié)構(gòu)有可能產(chǎn)生簡單低成本的重放或接收結(jié)構(gòu),這種結(jié)構(gòu)避免了產(chǎn)生修改產(chǎn)生或產(chǎn)生目標(biāo)單位響度的復(fù)雜性。盡管圖5類型的結(jié)構(gòu)比圖6類型的結(jié)構(gòu)更簡單,但是圖6的結(jié)構(gòu)所具有的優(yōu)點(diǎn)是存儲或發(fā)送所需的信息可以更少,特別是當(dāng)存儲或發(fā)送目標(biāo)單位響度的表示,諸如一個或更多定標(biāo)因子時。這種信息存儲或發(fā)送的減小在低比特率音頻環(huán)境中尤其有用。
相應(yīng)地,本發(fā)明的其他方面提供一種設(shè)備或處理(1)從存儲或發(fā)送設(shè)備或處理接收或重放修改參數(shù)M并將它們應(yīng)用于還接收的音頻信號或(2)從存儲或發(fā)送設(shè)備或處理接收或重放目標(biāo)單位響度或目標(biāo)單位響度的表示,通過應(yīng)用目標(biāo)單位響度或目標(biāo)單位響度表示給還接收的所述音頻信號(或音頻信號的度量諸如它的單位響度,該度量可以從音頻信號導(dǎo)出)產(chǎn)生修改參數(shù)M,并將修改參數(shù)M應(yīng)用于接收的音頻信號。這些設(shè)備或處理可以被表征為解碼處理或解碼器;而產(chǎn)生存儲或發(fā)送的信息所需的設(shè)備或處理可以被表征為編碼處理或編碼器。這些編碼處理或編碼器是圖1-4結(jié)構(gòu)實(shí)例可用于通過相應(yīng)的解碼處理或解碼器產(chǎn)生所需信息的那些部分。這些解碼處理器或解碼器可以與實(shí)際上任何類型的處理和/或再現(xiàn)聲音的處理或設(shè)備相關(guān)或一起操作。
在本發(fā)明的一個方面,如在圖5的實(shí)例中,未經(jīng)修改的音頻信號和例如通過修改參數(shù)產(chǎn)生處理或發(fā)生器諸如圖1的產(chǎn)生修改參數(shù)4、圖2的4’、圖3的4”或圖4的4_產(chǎn)生的修改參數(shù)M可以被應(yīng)用于任何適當(dāng)?shù)拇鎯虬l(fā)送設(shè)備或函數(shù)(“存儲或發(fā)送”)16。在使用圖1中的前饋實(shí)例作為編碼處理或編碼器的情況下,修改音頻信號2將不需要用于產(chǎn)生經(jīng)修改的音頻并且如果不需要在編碼器或編碼處理的時間或空間位置上提供經(jīng)修改的音頻則它能夠被省略。存儲或發(fā)送16可以包括例如任何適當(dāng)?shù)拇判浴⒐鈱W(xué)或固態(tài)存儲和重放設(shè)備或任何適當(dāng)?shù)挠芯€或無線發(fā)送和接收設(shè)備,所述這些設(shè)備的選擇對于本發(fā)明來說并不關(guān)鍵。重放或接收的修改參數(shù)然后可以被應(yīng)用于在圖1-4實(shí)例中所應(yīng)用類型的修改音頻信號2,以修改重放或接收的音頻信號,從而它的單位響度近似目標(biāo)單位響度或本質(zhì)上位于導(dǎo)出修改參數(shù)的結(jié)構(gòu)中。所述修改參數(shù)可以以各種方式中的任何一種進(jìn)行存儲或發(fā)送。例如,它們可以作為伴隨音頻信號的元數(shù)據(jù)被存儲或發(fā)送,它們可以在獨(dú)立通道或信道中被發(fā)送,它們可以在音頻中被用密碼編碼,它們可以被多路復(fù)用等等。使用修改參數(shù)修改音頻信號可以是可選的,如果可選,它們的使用也是例如通過用戶可選擇的。例如,如果修改參數(shù)被應(yīng)用于音頻信號,該修改參數(shù)可能減小音頻信號的動態(tài)范圍。是否應(yīng)用這種動態(tài)范圍減小是能夠通過用戶可選擇的。
在本發(fā)明的另一個方面,如在圖6的實(shí)例中,未經(jīng)修改的音頻信號和目標(biāo)單位響度或目標(biāo)單位響度表示可以被應(yīng)用于任何適當(dāng)?shù)拇鎯虬l(fā)送設(shè)備或函數(shù)(“存儲或發(fā)送”)16。在使用諸如圖1實(shí)例的前饋結(jié)構(gòu)作為編碼處理或編碼器的情況下,不論計(jì)算修改參數(shù)10類型的處理或設(shè)備還是修改音頻信號2類型的處理或設(shè)備都不需要并且如果不需要在編碼器或編碼處理的時間或空間位置上提供經(jīng)修改音頻的修改參數(shù)它們能夠被省略。如在圖5實(shí)例的情況下,存儲或發(fā)送16可以包括例如任何適當(dāng)?shù)拇判浴⒐鈱W(xué)或固態(tài)存儲和重放設(shè)備或任何適當(dāng)?shù)挠芯€或無線發(fā)送和接收設(shè)備,這些設(shè)備的選擇對于本發(fā)明來說并不關(guān)鍵。重放或接收的目標(biāo)單位響度或目標(biāo)單位響度表示然后可以與未經(jīng)修改的音頻一起被應(yīng)用于在圖1實(shí)例中所應(yīng)用類型的計(jì)算修改參數(shù)10,或在圖3實(shí)例中所應(yīng)用類型的計(jì)算修改參數(shù)10”,以提供任何被應(yīng)用于在圖1-4實(shí)例中所應(yīng)用類型的修改音頻信號2的修改參數(shù)M,以修改重放或接收的音頻信號從而它的單位響度近似目標(biāo)單位響度或本質(zhì)上位于導(dǎo)出修改參數(shù)的結(jié)構(gòu)中。盡管圖1實(shí)例類型的編碼處理或編碼器中可以最容易地獲得目標(biāo)單位響度或目標(biāo)單位響度表示,但是在圖2到4實(shí)例類型的編碼處理或編碼器中也可以獲得目標(biāo)單位響度或目標(biāo)單位響度表示或目標(biāo)單位響度或目標(biāo)單位響度表示的近似(在圖2和3的處理或設(shè)備14中以及在圖4的處理或設(shè)備12中計(jì)算近似)。目標(biāo)單位響度或目標(biāo)單位響度表示可以以各種方式中的任何一種方式被存儲或發(fā)送。例如,它可以作為伴隨音頻信號的元數(shù)據(jù)被存儲或發(fā)送,它可以在單獨(dú)的通道或信道中發(fā)送,它可以在音頻中被用密碼編碼,它可以被多路復(fù)用等等。使用根據(jù)存儲或發(fā)送的目標(biāo)單位響度或表示導(dǎo)出的修改參數(shù)修改音頻信號可以是可選的,如果可選,它們的使用可以是例如通過用戶可選擇的。例如,如果修改參數(shù)被應(yīng)用于音頻信號,該參數(shù)可能減小音頻信號的動態(tài)范圍。是否應(yīng)用這種動態(tài)范圍減小是能夠通過用戶可選擇的。
當(dāng)實(shí)現(xiàn)本公開的發(fā)明為數(shù)字系統(tǒng)時,前饋結(jié)構(gòu)是最實(shí)際的,所以以下將詳細(xì)地描述這些結(jié)構(gòu)的實(shí)例,應(yīng)該明白本發(fā)明的范圍并不受到這種限制。
在本申請的全文中,術(shù)語諸如“濾波器”或“濾波器組”在這里被用于包括基本上任何形式的遞歸和非遞歸濾波諸如IIR濾波器或變換,以及“濾波的”信息是應(yīng)用這些濾波器的結(jié)果。以下描述的實(shí)施例應(yīng)用通過變換實(shí)現(xiàn)的濾波器組。
圖7描述了以前饋結(jié)構(gòu)實(shí)施的本發(fā)明一個方面的示意性實(shí)施例進(jìn)一步的細(xì)節(jié)。音頻首先通過分析濾波器組函數(shù)或設(shè)備(“分析濾波器組”)100,它將音頻信號分離成多個頻帶(因此,圖5所示為來自分析濾波器組100的多個輸出,每個輸出表示一個頻帶,輸出維持各種函數(shù)或設(shè)備到將頻帶求和成組合的寬帶信號的合成濾波器組,如以下進(jìn)一步的描述)。與分析濾波器組100中的每個頻帶相關(guān)的濾波器的響應(yīng)被設(shè)計(jì)成模擬在內(nèi)耳基膜的特定位置處的響應(yīng)。分析濾波器組100中每個濾波器的輸出接下來傳遞到模擬通過外耳和中耳的音頻傳輸?shù)臑V波器效應(yīng)的傳輸濾波器或傳輸濾波器函數(shù)(“傳輸濾波器”)101中。如果只有音頻的響度將要被測量,在分析濾波器組之前能夠應(yīng)用傳輸濾波器,但是由于分析濾波器組輸出用于合成經(jīng)修改的音頻,因此在濾波器組之后應(yīng)用傳輸濾波器是有利的。傳輸濾波器101的輸出接下來傳遞到激勵函數(shù)或設(shè)備(“激勵”)102,它的輸出模擬沿基膜的能量分布。激勵能量值可以通過平滑函數(shù)或設(shè)備(“平滑”)103在時間上進(jìn)行平滑。平滑函數(shù)的時間常量根據(jù)想要應(yīng)用的要求進(jìn)行設(shè)置。平滑的激勵信號接下來在單位響度函數(shù)或設(shè)備(“單位響度(SL)”)104中被轉(zhuǎn)換成單位響度。單位響度以每單位頻率宋為單位來表示。與每個頻帶相關(guān)的單位響度分量被傳遞到單位響度修改函數(shù)或設(shè)備(“SL修改”)105中。SL修改105采取原始單位響度作為它的輸入以及然后輸出想要的或“目標(biāo)的”單位響度,根據(jù)本發(fā)明的一個方面,所述目標(biāo)單位響度優(yōu)選是原始單位響度的函數(shù)(參見以下的下一個標(biāo)題,標(biāo)題為“目標(biāo)單位響度”)。SL修改105可以在每個頻帶上獨(dú)立地操作,或者取決于想要的效果,可能存在頻帶之間的互相依賴性(在圖7中通過交叉連接線所建議的頻率平滑)。采取來自激勵102的平滑的激勵頻帶分量以及來自SL修改105的目標(biāo)單位響度作為它的輸入,增益解算器函數(shù)或設(shè)備(“增益解算器”)106確定需要被應(yīng)用于分析濾波器組100輸出的每個頻帶的增益以便將測量的單位響度變換成目標(biāo)單位響度。所述增益解算器可以以各種方式實(shí)現(xiàn)。例如,增益解算器可以包括迭代處理諸如以第PCT/US2004/016964號、公開號為WO2004/111964A2的所述國際專利申請中公開的方式或可替換地以表查詢的方式。盡管增益解算器106產(chǎn)生的每個頻帶增益可以進(jìn)一步通過可選的平滑函數(shù)或設(shè)備(“平滑”)107在時間上進(jìn)行平滑以便最小化感覺結(jié)果,優(yōu)選的是如在別處所述在整個處理或設(shè)備中在別處應(yīng)用時間平滑。最后,通過相應(yīng)的乘法合并函數(shù)或合并器108將所述增益應(yīng)用于分析濾波器組100的相應(yīng)頻帶,以及在合成濾波器組函數(shù)或設(shè)備(“合成濾波器組”)110中根據(jù)增益修改的頻帶合成經(jīng)處理或“經(jīng)修改的”音頻。另外,來自分析濾波器組的輸出可以在應(yīng)用增益之前通過延遲函數(shù)或設(shè)備(“延遲”)109被延遲以便補(bǔ)償與增益計(jì)算相關(guān)的任何等待時間。可替換地,代替計(jì)算用于在頻帶中應(yīng)用增益修改中使用的增益,增益解算器106可以計(jì)算控制諸如多抽頭FIR濾波器或多極IIR濾波器的時間變化濾波器的濾波器系數(shù)。為了簡單說明,本發(fā)明的這些方面主要被描述為應(yīng)用被應(yīng)用于頻帶的增益因子,應(yīng)該明白在實(shí)際的實(shí)施例中還可以應(yīng)用濾波器系數(shù)和時間變化濾波器。
在實(shí)際的實(shí)施例中,音頻的處理可以在數(shù)字域中執(zhí)行。相應(yīng)地,音頻輸入信號通過離散時間序列x[n]表示,該時間序列已經(jīng)以某采樣頻率fs從音頻源進(jìn)行采樣。假設(shè)序列x[n]已經(jīng)被適當(dāng)?shù)囟?biāo)從而通過以下公式以分貝給出的x[n]的均方根(rms)功率RMSdB=10log10(1LΣn=0Lx2[n])]]>等于收聽者正在以它進(jìn)行傾聽的單位為dB的聲壓級。另外,為了簡化說明起見假設(shè)所述音頻信號是單聲道的。
如下將更詳細(xì)地描述分析濾波器組100、傳輸濾波器101、激勵102、單位響度104、單位響度修改105、增益解算器106、以及合成濾波器組110。
分析濾波器組100所述音頻輸入信號被應(yīng)用于分析濾波器組或?yàn)V波器組函數(shù)(“分析濾波器組”)100。分析濾波器組100中的每個濾波器被設(shè)計(jì)成模擬在沿內(nèi)耳基膜的特定位置處的頻率響應(yīng)。濾波器組100可以包括一組線性濾波器,其帶寬和間隔在等效矩形帶寬(ERB)頻率標(biāo)度上是恒定的,如通過Moore、Glasberg和Baer(上文提到的B.C.J.Moore,B.Glasberg,T.Baer,“A Model for the Prediction of Thresholds,Loudness,and Partial Loudness,”)所定義的。
盡管ERB頻率標(biāo)度更加緊密地匹配人的感覺并且顯示出在產(chǎn)生匹配主觀響度結(jié)果的客觀響度度量中改進(jìn)的性能,但是可以利用降低的性能應(yīng)用Bark頻率標(biāo)度。
對于單位為Hz的中心頻率f,單位為Hz的ERB頻帶的帶寬可以被近似為ERB(f)=24.7(4.37f/1000+1)(1)根據(jù)這種關(guān)系定義曲折的頻率標(biāo)度即在沿曲折標(biāo)度的任何點(diǎn)上,以曲折標(biāo)度為單位的相應(yīng)ERB等于一。用于從單位Hz的線性頻率轉(zhuǎn)換到這種ERB頻率標(biāo)度的函數(shù)通過積分方程1的倒數(shù)而獲得HzToERB(f)=∫124.7(4.37f/1000+1)df=21.4log10(4.37f/100+1)---(2a)]]>通過解方程2a求解f表示從ERB標(biāo)度回變換回線性頻率標(biāo)度也是有用的ERBToHz(e)=f=10004.3710(e/21.4-1),---(2b)]]>其中,e是以ERB標(biāo)度的單位。圖9所示為ERB標(biāo)度和單位為Hz的頻率之間的關(guān)系。
分析濾波器組100可以包括位于沿ERB標(biāo)度均勻間隔的中心頻率fc[1]...fc[B]的被稱之為頻帶的B聽覺濾波器。更具體而言,fc[1]=fmin(3a)fc[b]=fc[b-1]+ERBToHz(HzToERB(fc[b-1])+Δ) b=2...B(3b)fc[B]<fmax,(3c)其中,Δ是想要的分析濾波器組100的ERB間隔,以及fmin和fmax分別是想要的最小和最大中心頻率。可以選擇Δ=1,并且考慮人耳敏感的頻率范圍,可以設(shè)置fmin=50Hz和fmax=20000Hz。利用這些參數(shù),例如,應(yīng)用方程3a-c產(chǎn)生B=40的聽覺濾波器。
每個聽覺濾波器的幅度頻率響應(yīng)其特征在于如Moore和Glasberg所提出的舍入指數(shù)函數(shù)。具體而言,具有中心頻率fc[b]的濾波器的幅度響應(yīng)可以被計(jì)算為Hb(f)=(1+pg)e-pg(4a)這里g=|f-fc[b]fc[b]|,---(4b)]]>
p=4fc[b]ERB(fc[b])---(4c)]]>在圖10示出了在ERB標(biāo)度上近似臨界頻帶的這些B聽覺濾波器的幅度響應(yīng)。
使用有限長度離散余弦變換可以充分地近似分析濾波器組100的濾波操作,所述變換通常被稱之為短時間離散傅里葉變換(STDFT),因?yàn)楸环Q之為全速率實(shí)現(xiàn)即在音頻信號的采樣速率運(yùn)行濾波器的實(shí)現(xiàn)被認(rèn)為提供比精確響度度量所必須的分辨率更高的時間分辨率。通過使用STDFT代替全速率實(shí)現(xiàn),可以實(shí)現(xiàn)效率的提高和計(jì)算復(fù)雜度的降低。
輸入音頻信號x[n]的STDFT定義如下X[k,t]=Σn=0N-1w[n]x[n+tT]e-j2πkN,---(5a)]]>其中,k是頻率索引,t是時間塊索引,N是DFT大小,T是跳躍大小,以及w[n]是規(guī)格化的長度為N的窗從而Σn=0N-1w2[n]=1---(5b)]]>應(yīng)該注意到方程5a中的變量t是表示與以秒為單位的時間度量相對的STDFT時間塊的離散索引。t中的每個遞增表示沿信號x[n]的T采樣的跳躍。接下來參考索引t假設(shè)這種定義。盡管取決于實(shí)現(xiàn)的細(xì)節(jié),可以使用不同的參數(shù)設(shè)置和窗形狀,對于fs=44100Hz,選擇N=2048,T=1024,并且讓w[n]是漢寧窗提供時間和頻率分辨率的足夠平衡。使用快速傅里葉變換(FFT)上述的STDFT可以更加有效。
取代STDFT,可以使用修正離散余弦變換(MDCT)實(shí)現(xiàn)分析濾波器組。MDCT是一種通常在諸如Dolby AC-3的感覺音頻編碼器中使用的變換。如果本公開的系統(tǒng)利用這種感覺編碼的音頻實(shí)現(xiàn),通過處理現(xiàn)有的編碼音頻的MDCT系數(shù),并因此消除執(zhí)行分析濾波器組變換的需要,本公開的響度測量和修改可以被更為有效地實(shí)現(xiàn)。輸入音頻信號x[n]的MDCT通過以下公式給出X[k,t]=Σn=0N-1w[n]x[n+tT]cos((2π/N)(k+1/2)(n+n0)),]]>
其中n0=(N/2)+12---(6)]]>通常情況下,選擇跳躍大小T精確為一半的變換長度N以便有可能完全重構(gòu)信號x[n]。
傳輸濾波器101分析濾波器組100的輸出被應(yīng)用于根據(jù)通過外耳和中耳的音頻傳輸濾波濾波器組的每個頻帶的傳輸濾波器或傳輸濾波器函數(shù)(“傳輸濾波器”)101。圖8描述了傳輸濾波器在可聽頻率范圍上的一種適當(dāng)?shù)姆阮l率響應(yīng)P(f)。該響應(yīng)統(tǒng)一低于1kHz,以及在1kHz以上,遵循在ISO226標(biāo)準(zhǔn)中規(guī)范的聽覺門限的倒數(shù),該門限被規(guī)格化成等于在1kHz的1。
激勵102為了計(jì)算輸入音頻信號的響度,在應(yīng)用傳輸濾波器101之后需要在分析濾波器組100的每個濾波器中音頻信號短時間能量的度量。這種時間和頻率變化的度量被稱之為激勵。在激勵函數(shù)102中通過頻率域中的濾波器響應(yīng)和輸入信號的功率譜相乘可以近似分析濾波器組100中的每個濾波器的短時間能量輸出E[b,t]=1NΣk=0N-1|Hb[k]|2|P[k]|2|X[k,t]|2,---(7)]]>其中,b是頻帶號,t是塊號,以及Hb[k]和P[k]分別是聽覺濾波器和傳輸濾波器的頻率響應(yīng),所述輸入信號以對應(yīng)于STDFT或MDCT二進(jìn)制索引k的頻率進(jìn)行采樣。應(yīng)該注意到除方程4a-c中規(guī)定以外的聽覺濾波器幅度響應(yīng)的形式可以在方程7中使用以實(shí)現(xiàn)類似的結(jié)果。例如,第PCT/US2004/016964號、公開號為WO2004/111964A2的所述國際申請描述了兩種替換通過第12階IIR傳遞函數(shù)表征的聽覺濾波器,以及低成本的“磚墻(brick-wall)”帶通近似。
總而言之,激勵函數(shù)102的輸出是在每時間周期t的各個ERB頻帶b中能量E的頻率域表示。
時間平均(“平滑”)103如下所述,對于本公開發(fā)明的一定應(yīng)用,可能期望在它的變換到單位響度之前平滑激勵E[b,t]。例如,在平滑函數(shù)103中根據(jù)以下方程可以遞歸地執(zhí)行平滑E[b,t]=λbE[b,t]+(1-λb)E[b,t],(8)其中,根據(jù)期望的應(yīng)用選擇在每個頻帶b的時間常量λb。在絕大多數(shù)情況下時間常量可以被有利地選擇為與在頻帶b內(nèi)人類響度感覺的積分時間成比例。Watson和Gengel進(jìn)行的實(shí)驗(yàn)表明這種積分時間在低頻(125-200Hz)位于150-175ms的范圍內(nèi)以及在高頻位于40-60ms內(nèi)(Charles S.Watson and Roy W.Gengel,“Signal Duration andSignal Frequency in Relation to Auditory Sensitivity”,Journal of theAcoustical Society of America,Vol.46,No.4(Part 2),1969年,第989-997頁)。
單位響度104在單位響度轉(zhuǎn)換器或轉(zhuǎn)換函數(shù)(“單位響度”)104中,將激勵的每個頻帶轉(zhuǎn)換成以每ERB宋為單位度量的單位響度的分量值。
開始,在計(jì)算單位響度中,每個頻帶中的激勵級E[b,t]可以被變換成如ISO226的等響度輪廓所規(guī)定的(圖11)通過傳輸濾波器P(z)規(guī)格化的在1kHz的等效激勵級(圖12)E1kHz[b,t]=T1kHz(E[b,t],fc[b]), (9)其中,T1kHz(E,f)是產(chǎn)生在1Kz所述級的函數(shù),該級和在頻率f的級E一樣響。實(shí)際上,將T1Hz(E,f)實(shí)現(xiàn)為通過傳輸濾波器規(guī)格化的等響度輪廓查詢表的內(nèi)插。轉(zhuǎn)換成在1kHz的等效級簡化了以下的單位響度計(jì)算。
接下來,每個頻帶中的單位響度可以計(jì)算為N[b,t]=α[b,t]NNB[b,t]+(1-α[b,t])NWB[b,t],(10)其中,NNB[b,t]和NWB[b,t]分別是基于窄帶和寬帶信號模型的單位響度值。值α[b,t]是根據(jù)音頻信號計(jì)算的位于0和1之間的內(nèi)插因子。第PCT/US2004/016964、公開號為WO2004/111964A2的所述國際申請描述了一種根據(jù)激勵的頻譜平坦性計(jì)算α[b,t]的技術(shù)。它還更詳細(xì)地描述“窄帶”和“寬帶”信號模型。
所述窄帶和寬帶單位響度值NNB[b,t]和NWB[b,t]可以使用指數(shù)函數(shù)根據(jù)變換的激勵進(jìn)行估計(jì)
NNB[b,t]=GNB((E‾1kHz[b,t]TQ1kHz)βNB-1),E‾1kHz[b,t]>TQ1kHz0,otherwise---(11a)]]>NWB[m,t]=GWB((E‾1kHz[b,t]TQ1kHz)βWB-1),E‾1kHz[b,t]>TQ1kHz0,otherwise---(11b)]]>其中,TQ1kHz是對于1KHz宋來說在無聲門限的激勵級。根據(jù)等響度輪廓(圖11和12)TQ1kHz等于4.2dB。注意到當(dāng)所述激勵等于無聲門限時這些單位響度函數(shù)都等于零。對于大于無聲門限的激勵,兩個函數(shù)根據(jù)Stevens的級感覺定律以冪定律單調(diào)地增加。選擇窄帶函數(shù)的指數(shù)大于寬帶函數(shù)的指數(shù),使得窄帶函數(shù)相對于寬帶函數(shù)更快速地增加。具體選擇的用于窄帶和寬帶情況的指數(shù)β和增益G被選擇成在音調(diào)和噪聲的響度增加時匹配實(shí)驗(yàn)數(shù)據(jù)。
Moore和Glasberg建議當(dāng)所述激勵處于聽覺門限時單位響度應(yīng)該等于取代零的某些小值。然后單位響度應(yīng)該隨激勵減小到零而單調(diào)地減小到零。理由是聽覺門限是蓋然性門限(在這點(diǎn)上50%的時間檢測音調(diào)),以及每個位于門限的大量音調(diào)一起存在可以相加成一種比任何各個音調(diào)更可聽的聲音。在本公開的申請中,利用這種特性增加單位響度函數(shù)已經(jīng)具有當(dāng)所述激勵接近門限時使以下討論的增益解算器行為更加正確的附加益處。如果當(dāng)所述激勵位于門限或低于門限時所述單位響度被定義成零,那么對于位于門限或低于門限的激勵來說增益解算器的唯一解不存在。另一方面,如果單位響度被定義成對于大于或等于零的所有激勵值來說單調(diào)地增加,如Moore和Glasberg所建議的,那么唯一解存在。大于統(tǒng)一值的響度定標(biāo)將總是導(dǎo)致大于統(tǒng)一值的增益并且反之亦然。方程11a和11b中的單位響度函數(shù)可以被修改成具有根據(jù)以下公式的期望特性NNB[b,t]=GNB((E‾1kHz[b,t]TQ1kHz)βNB-1),E‾1kHz[b,t]>λTQ1kHzexp{KNB(-log(E‾1kHz[b,t]TQ1kHz)+CNB)ηNB},otherwise---(11c)]]>
NWB[m,t]=GWB((E‾1kHz[b,t]TQ1kHz)βWB-1)E‾1kHz[b,t]>λTQ1kHzexp{KWB(-log(E‾1kHz[b,t]TQ1kHz)+CWB)ηWB},otherwise---,(11c)]]>其中,常量λ大于1,η指數(shù)小于1,以及常量K和C如此選擇從而單位響度函數(shù)及其一階導(dǎo)數(shù)在點(diǎn)E1kHz[b,t]=λTQ1kHz處是連續(xù)的。
根據(jù)單位響度,通過在所有頻帶b上單位響度的求和給出全部或“總”響度L[t]L[t]=ΣbN[b,t]---(12)]]>單位響度修改105在單位響度修改函數(shù)(“單位響度修改”)105中,被稱之為 的目標(biāo)單位響度可以取決于全部設(shè)備或處理的期望應(yīng)用以各種方式根據(jù)SL104的單位響度(圖7)計(jì)算。正如以下更詳細(xì)的描述,例如,在音量控制的情況下,目標(biāo)單位響度可以使用定標(biāo)因子α計(jì)算。參見以下的方程16及其相關(guān)的描述。在自動增益控制(AGC)和動態(tài)范圍控制(DRC)的情況下,目標(biāo)單位響度可以使用期望輸出響度和輸入響度的比率進(jìn)行計(jì)算。參見以下的方程17和18及其相關(guān)的描述。在動態(tài)均衡的情況下,目標(biāo)單位響度可以使用方程23及其相關(guān)描述中闡述的關(guān)系進(jìn)行計(jì)算。
增益解算器106在本實(shí)例中,對于每個頻帶b和每個時間間隔t,增益解算器106采取平滑的激勵E[b,t]和目標(biāo)單位響度 作為它的輸入并且產(chǎn)生接下來修改所述音頻使用的增益G[b,t]。讓函數(shù)Ψ{·}表示從激勵導(dǎo)單位響度的非線性變換從而N[b,t]=Ψ{E[b,t), (13)增益解算器得到G[b,t],從而N^[b,t]=Ψ{G2[b,t]E‾[b,t]}.---(14a)]]>增益解算器106確定頻率和時間變化的增益,當(dāng)該增益被應(yīng)用于原始激勵時,它產(chǎn)生在理想情況下等于期望目標(biāo)單位響度的單位響度。實(shí)際上,所述增益解算器確定頻率和時間變化的增益,當(dāng)該增益被應(yīng)用于音頻信號的頻率域型式時導(dǎo)致修改所述音頻信號以便減小它的單位響度和目標(biāo)單位響度之間的差。在理想情況下,所述修改是這樣的即經(jīng)修改的音頻信號具有緊密近似目標(biāo)單位響度的單位響度。方程14a的解可以以大量的方式實(shí)現(xiàn)。例如,如果通過Ψ-1{·}表示的用于反單位響度的封閉形式的數(shù)學(xué)表達(dá)式存在,那么所述增益可以直接通過重新安排方程14a進(jìn)行計(jì)算G[b,t]=Ψ-1(N^[b,t])E‾[b,t]---(14b)]]>可替換地,如果用于Ψ-1{·}的封閉形式的解不存在,可以應(yīng)用迭代方法,其中對于每個迭代使用增益的當(dāng)前估計(jì)評估方程14a。比較所產(chǎn)生的單位響度和期望的目標(biāo)單位響度以及基于誤差更新增益。如果增益被正確地更新,它們將會聚到期望的解。另一種方法包含對于每個頻帶中的激勵范圍預(yù)先計(jì)算函數(shù)Ψ{·}以創(chuàng)建查詢表。根據(jù)該查詢表,獲得反函數(shù)Ψ-1{·}的近似以及然后可以根據(jù)方程14b計(jì)算所述增益。正如以前所述,目標(biāo)單位響度可以通過單位響度的定標(biāo)表示N^[b,t]=Ξ[b,t]N[b,t]---(14c)]]>將方程13代入14c中然后將14c代入14b中產(chǎn)生增益的替換表達(dá)式G[b,t]=Ψ-1(Ξ[b,t]Ψ(E‾[b,t]))E‾[b,t]---(14d)]]>我們看到增益可以精確地表示為激勵E[b,t]和單位響度定標(biāo)Ξ[b,t]的函數(shù)。所以,通過14d方程或等效查詢表可以計(jì)算所述增益而不用顯式地計(jì)算單位響度或目標(biāo)單位響度作為中間值。但是,通過方程14d的使用隱式地計(jì)算這些值。可以設(shè)計(jì)通過顯式或隱式計(jì)算單位響度或目標(biāo)單位響度用于計(jì)算修改參數(shù)的其他等效方法,本發(fā)明旨在覆蓋所有這些方法。
合成濾波器組110如上所述,分析濾波器組100可以通過使用短時間離散傅里葉變換(STDFT)或修正離散余弦變換有效地實(shí)現(xiàn),以及可以類似地使用STDFT或MDCT實(shí)現(xiàn)合成濾波器組110。具體而言,如以前所述,讓X[k,t]表示輸入音頻的STDFT或MDCT,經(jīng)處理(修改)的音頻STDFT或MDCT在合成濾波器組110可以被計(jì)算為X^[k,t]=ΣbG[b,t]Sb[k]X[k,t-d],---(15)]]>其中,Sb[k]是與頻帶b相關(guān)的合成濾波器的響應(yīng),以及d是與圖7中延遲塊109相關(guān)的延遲。可以選擇合成濾波器的形狀Sb[k]與分析濾波器組中使用的濾波器Hb[k]相同,或者可以修改它們以在缺少任何增益修改(即,當(dāng)G[b,t]=1時)中提供完全的重構(gòu)。然后如本領(lǐng)域普通技術(shù)人員所熟知的那樣,通過 的逆傅里葉或修正余弦變換和疊加附加合成可以產(chǎn)生最后處理的音頻。
目標(biāo)單位響度實(shí)施本發(fā)明這些方面的結(jié)構(gòu)的行為諸如圖1-7的實(shí)例主要通過計(jì)算目標(biāo)單位響度 的方式指示。盡管本發(fā)明并不局限于任何特定的計(jì)算目標(biāo)單位響度的函數(shù)或反函數(shù),但是現(xiàn)在將描述用于它們的若干這些函數(shù)和適當(dāng)?shù)膽?yīng)用。
適于音量控制的時間恒定和頻率恒定函數(shù)標(biāo)準(zhǔn)音量控制通過應(yīng)用寬帶信號給所述音頻調(diào)節(jié)音頻信號的響度。通常,所述增益被耦合到通過用戶調(diào)節(jié)的旋鈕或滑動塊直到音頻的響度位于期望的級。本發(fā)明的一個方面考慮用于實(shí)現(xiàn)這種控制的更加心理聲學(xué)一致的方式。根據(jù)本發(fā)明的這個方面,不是具有耦合到音量控制的寬帶增益,其中該音量控制在所有頻帶上通過相同的量產(chǎn)生增益的變化,這可能導(dǎo)致感覺頻譜的變化,而是相反將單位響度定標(biāo)因子與音量控制調(diào)節(jié)進(jìn)行相關(guān)以便通過考慮人類聽覺模型的量改變多個頻帶的每個頻帶中的增益,從而在理想情況下不存在感覺頻譜的變化。在本發(fā)明這個方面及其示意性應(yīng)用的上下文中,“常量”或“時間恒定”旨在考慮音量控制定標(biāo)因子的設(shè)置中例如通過用戶不時的變化。這種“時間恒定”有時候被稱之為“準(zhǔn)時間恒定”、“準(zhǔn)固定”、“分段時間恒定”、“分段固定”、“逐步時間恒定”和“逐步固定”。給定這種定標(biāo)因子α,目標(biāo)單位響度可以被計(jì)算為通過α相乘的度量的單位響度N^[b,t]=αN[b,t.].---(16)]]>由于總響度L[t]是在所有頻帶b上單位響度N[b,t]的求和,上述修改還通過因子α定標(biāo)總響度,但是它以這樣一種方式進(jìn)行即保存在特定時間音量對于控制調(diào)節(jié)變化來說相同的感覺頻譜。換言之,在任何特定的時間,音量控制調(diào)節(jié)的變化導(dǎo)致感覺響度的變化但是經(jīng)修改音頻的感覺頻譜和未經(jīng)修改音頻的感覺頻譜之比值不變化。圖13a描述了當(dāng)對于由柔和語音組成的音頻信號α=0.25時在特定時間“t”在頻帶“b”上所產(chǎn)生的多頻帶增益G[b,t]。為了比較,如在標(biāo)準(zhǔn)音量控制中,還對通過0.25定標(biāo)原始總響度所需的寬帶增益(水平線)進(jìn)行繪圖。與中頻帶相比多頻帶增益G[b,t]在低頻帶和高頻帶增加。這與指示人耳在低頻和高頻較不敏感的等響度輪廓相一致。
圖13b描述了用于原始音頻信號、如根據(jù)現(xiàn)有技術(shù)音量控制修改的寬帶增益修改信號、和如根據(jù)本發(fā)明本方面修改的多頻帶增益修改信號的單位響度。多頻帶增益修改信號的單位響度是通過0.25定標(biāo)的原始信號的單位響度。寬帶增益修改信號的單位響度已經(jīng)相對于原始未經(jīng)修改信號改變了它的頻譜形狀。在這種情況下,在相對意義上,單位響度在低頻和高頻具有丟失的響度。隨著它的音量降低這被感覺為音頻的不洪亮,一個多頻帶修改信號不會發(fā)生的問題,該信號的響度受在感覺響度域中所導(dǎo)出增益的控制。
連同與傳統(tǒng)音量控制相關(guān)的感覺頻譜平衡的失真這里存在第二個問題。在方程11a-11d表示的響度模型中所反映的響度感覺的特性是在任何頻率的信號的響度隨信號級接近聽覺門限而更快速地降低。結(jié)果,給予更柔和信號相同響度衰減的電子衰減小于較響亮信號所需的衰減。傳統(tǒng)的音量控制給予恒定衰減而不管信號級如何,所以柔和信號相對于較響亮信號隨音量降低而變得“太柔和”。在許多情況下這導(dǎo)致音頻細(xì)節(jié)的丟失。考慮在回響室內(nèi)響板的記錄。在這種記錄中響板的主“擊打”與回響回聲相相比較相當(dāng)?shù)仨懥粒撬莻鬟_(dá)房間大小的回響回聲。當(dāng)利用傳統(tǒng)的音量控制降低音量時,回響回聲相對主擊打變得較柔和并且最終消失在聽覺門限之下,留下“干的”發(fā)聲音的響板。基于響度的音量控制通過相對于較響亮的主擊打增強(qiáng)記錄的較柔和回響部分,以便這些部分之間的相對響度保持恒定來防止記錄的較柔和部分消失。為了實(shí)現(xiàn)這個效果,多頻帶增益G[b,t]必須以和人的響度感覺時間分辨率相稱的一定速率隨時間變化。由于多頻帶增益G[b,t]被計(jì)算為平滑激勵E[b,t]的函數(shù),方程8中時間常量λb的選擇指示在每個頻帶b中增益如何可以在時間上快速地變化。如之前所述的,可以選擇這些時間常量為在頻帶b中人響度感覺的成比例的積分時間,并因此隨時間產(chǎn)生G[b,t]的適當(dāng)變型。應(yīng)該注意到如果不正確地選擇這些時間常量(過快或過慢),那么在處理的音頻中可能引入可感覺的客觀結(jié)果。
適于固定均衡的時間恒定和頻率變化函數(shù)在某些應(yīng)用中,可能希望應(yīng)用固定感覺均衡于所述音頻,在這種情況下可以通過應(yīng)用如以下關(guān)系中的時間恒定但頻率變化的定標(biāo)因子Θ[b]計(jì)算目標(biāo)單位響度N^[b,t]=Θ[b]N[b,t],]]>其中, 是目標(biāo)單位響度,N[b,t]是音頻信號的單位響度,b是頻率的度量,以及t是時間的度量。在這種情況下,所述定標(biāo)可以隨頻帶而變化。這種應(yīng)用對于加重例如語音頻率所支配的頻譜部分以便增強(qiáng)清晰度是有用的。
適于自動增益和動態(tài)范圍控制的的頻率恒定和時間變化函數(shù)自動增益和動態(tài)范圍控制(AGC和DRC)的技術(shù)在音頻處理領(lǐng)域中是熟知的。在一種抽象含義下,兩種技術(shù)以某種方式測量音頻信號的級以及然后通過為測量級函數(shù)的量來增益修改該音頻信號。對于AGC的情況,增益修改所述信號以便它的測量級更接近于用戶選擇的參考級。對于DRC,增益修改所述信號以便將信號的度量級的范圍變換成某種期望的范圍。例如,可能希望使得音頻的無聲部分更響亮以及響亮部分較無聲。Robinson和Gundry(Charles Robinson和Kenneth Gundry,“Dynamic Range Control via Metadata”,107thConvention of the AES,Preprint 5028,1999年9月24-27日,紐約)描述了這種系統(tǒng)。AGC和DRC的傳統(tǒng)實(shí)現(xiàn)通常使用音頻信號級的簡單度量,諸如平滑的峰值或均方根(rms)幅度以驅(qū)動增益修改。這些簡單的度量和音頻感覺響度的某種度相關(guān),但是本發(fā)明的方面通過利用基于心理聲學(xué)模型的響度的度量驅(qū)動增益修改考慮更加感覺相關(guān)的AGC和DRC。而且,許多傳統(tǒng)的AGC和DRC系統(tǒng)應(yīng)用具有寬帶增益的增益修改,從而導(dǎo)致經(jīng)處理音頻中的上述音質(zhì)(頻譜)失真。另一方面,本發(fā)明的這些方面使用多頻帶增益以減小或最小化這些失真的方式對所述單位響度整形。
應(yīng)用本發(fā)明這些方面的AGC和DRC應(yīng)用通過一種函數(shù)表征,該函數(shù)將輸入寬帶響度Li[t]變換或映射成期望的輸出寬帶響度Lo[t],這里所述響度以諸如宋的感覺響度單位進(jìn)行度量。輸入寬帶響度Li[t]是輸入音頻信號的單位響度N[b,t]的函數(shù)。盡管它可以和輸入音頻信號的總響度相同,但是它可以是音頻信號總響度的時間平滑的型式。
圖14a和14b描述了典型分別用于AGC和DRC的映射函數(shù)的實(shí)例。給定Lo[t]是Li[t]的函數(shù)的這種映射,目標(biāo)單位響度可以被計(jì)算為N^[b,t]=Lo[t]Li[t]N[b,t].---(17)]]>音頻信號的原始單位響度N[b,t]簡單地通過期望的輸出寬帶響度和輸入寬帶響度之比進(jìn)行定標(biāo)以產(chǎn)生輸出單位響度 對于AGC系統(tǒng),輸入寬帶響度Li[t]應(yīng)該通常是音頻的長期總響度的度量。這能夠通過在時間上平滑總響度L[t]產(chǎn)生Li[t]予以實(shí)現(xiàn)。
與AGC相比較,DRC系統(tǒng)反作用于信號響度的較短期變化,所以能夠使Li[t]簡單等于L[t]。結(jié)果,通過Lo[t]/Li[t]給出的單位響度的定標(biāo)可以快速地波動,這導(dǎo)致經(jīng)處理音頻中的不想要的非自然信號。一種典型的結(jié)果是通過一些其他相對不相關(guān)的頻譜部分對一部分頻譜的聲頻調(diào)制。例如,經(jīng)典音樂選擇可能包含持續(xù)的弦音所支配的高頻,而低頻包含大聲激增的定音鼓。無論何時定音鼓擊打,總響度Li[t]都將增加,以及DRC系統(tǒng)應(yīng)用衰減給整個單位響度。然后弦被聽到利用定音鼓在響度方面上下“急劇起伏”。這種在頻譜中的交叉急劇起伏是傳統(tǒng)寬帶DRC系統(tǒng)的問題,以及典型的解決方案包含獨(dú)立地應(yīng)用DRC于不同的頻帶。由于濾波器組和應(yīng)用感覺響度模型的單位響度計(jì)算所以這里公開的系統(tǒng)本質(zhì)上是多頻帶的,因此修改DRC系統(tǒng)根據(jù)本發(fā)明的方面以多頻帶方式工作相對地直接并且接下來進(jìn)行描述。
適于動態(tài)范圍控制的頻率變化和時間變化的函數(shù)DRC系統(tǒng)可以被擴(kuò)展成通過允許輸入和輸出響度獨(dú)立于頻帶b變化從而以多頻帶或頻率變化方式工作。這些多頻帶響度值指Li[b,t]和Lo[b,t],目標(biāo)單位響度然后可以通過以下公式給出N^[b,t]=Lo[b,t]Li[b,t]N[b,t],---(18)]]>其中,如在圖14b中所示例,已經(jīng)根據(jù)Li[b,t]計(jì)算或從它映射Lo[b,t],但是對于每個頻帶b來說是獨(dú)立的。輸入多頻帶響度Li[b,t]是輸入音頻信號的單位響度N[b,t]的函數(shù)。盡管它可以和輸入音頻信號的單位響度相同,但是它可以是音頻信號的單位響度的時間平滑/或頻率平滑的型式。
計(jì)算Li[b,t]的最直接的方式是設(shè)置它等于單位響度N[b,t]。在這種情況下,在感覺響度模型的聽覺濾波器組中的每個頻帶上獨(dú)立地執(zhí)行DRC而不是根據(jù)上述在標(biāo)題“適于自動增益和動態(tài)范圍控制的頻率恒定和時間變化函數(shù)”下用于所有頻帶的相同輸入相對于輸出響度比率。在應(yīng)用40頻帶的實(shí)際實(shí)施例中,沿頻率軸這些頻帶的間隔相對精細(xì)以便提供響度的精確度量。但是,獨(dú)立地應(yīng)用DRC定標(biāo)因子于每個頻帶可以導(dǎo)致經(jīng)處理的音頻聽起來“一團(tuán)糟”。為了避免這個問題,可以選擇通過在頻帶上平滑單位響度N[b,t]以便從一個頻帶應(yīng)用到下一個頻帶的DRC量不劇烈地變化來計(jì)算Li[b,t]。這可以通過定義頻帶平滑濾波器Q(b)以及然后根據(jù)標(biāo)準(zhǔn)的卷積和在所有頻帶c上平滑單位響度實(shí)現(xiàn)Li[b,t]=ΣcQ(b-c)N[c,t].---(19)]]>其中,N[c,t]是音頻信號的單位響度以及Q(b-c)是平滑濾波器的頻帶位移響應(yīng)。圖15描述了這種頻帶平滑濾波器的一個實(shí)例。
如果計(jì)算作為Lo[b,t]的函數(shù)的Li[b,t]的DRC函數(shù)對于每個頻帶b是固定的,那么單位響度N[b,t]的每個頻帶導(dǎo)致的變化類型將根據(jù)被處理音頻的頻譜變化,即使信號的總響度保持相同。例如,具有響亮低音和無聲高音的音頻信號可以讓低音削減以及讓高音增強(qiáng)。具有無聲低音和響亮高音的音頻信號可以發(fā)生相反的情況。實(shí)際效果是音頻的音質(zhì)或感覺頻譜的變化,并且這在一定的應(yīng)用中可能是令人想要的。
但是,可能希望執(zhí)行多頻帶DRC而不修改音頻的平均的感覺頻譜。可能想要平均在每個頻帶中的修改成大致的相同同時仍然允許修改的短期變化在頻帶之間以及頻帶中獨(dú)立地操作。想要的效果可以通過強(qiáng)制每個頻帶中DRC的平均行為和某種參考行為相同實(shí)現(xiàn)。可以選擇這種參考行為作為用于寬帶輸入響度Li[t]的想要的DRC。讓函數(shù)Lo[t]=DRC{Li[t]}表示用于寬帶響度的想要的DRC映射。然后讓Li[t]表示寬帶輸入響度的時間平均型式,以及讓Li[b,t]表示多頻帶輸入響度Li[b,t]的時間平均型式。然后多頻帶輸出響度可以被計(jì)算為Lo[b,t]=L‾i[b,t]L‾i[t]DRC{L‾i[t]L‾i[b,t]Li[b,t]}.---(20)]]>值得注意的是首先將所述多頻帶輸入響度定標(biāo)位于同一平均范圍內(nèi)作為寬帶輸入響度。然后應(yīng)用被設(shè)計(jì)用于寬帶響度的DRC函數(shù)。最后,將該結(jié)果向下定標(biāo)回多頻帶響度的平均范圍。利用多頻帶DRC的這種表示法,保持減小頻譜急劇起伏的有益之處,而與此同時保留音頻的平均感覺頻譜。
適于動態(tài)均衡的頻率變化和時間變化函數(shù)本發(fā)明方面的另一個應(yīng)用是音頻的時間變化感覺頻譜有意的變換成目標(biāo)時間恒定的感覺頻譜同時仍然保留音頻的原始動態(tài)范圍。可以稱這種處理為動態(tài)均衡(DEQ)。利用傳統(tǒng)的靜態(tài)均衡,應(yīng)用簡單的固定濾波于音頻以便改變它的頻譜。例如,可能應(yīng)用固定低音或高音增強(qiáng)。這種處理不考慮音頻的當(dāng)前頻譜并且所以對于某些信號即已經(jīng)包含相對大量低音或高音的信號來說是不適當(dāng)?shù)摹@肈EQ,度量所述信號的頻譜以及然后動態(tài)地修改該信號以便將度量的頻譜變換成基本上靜態(tài)的想要的形狀。對于本發(fā)明的方面,在濾波器組中的頻帶上規(guī)定這種想要的形狀并且被稱為EQ[b]。在實(shí)際的實(shí)施例中,度量的頻譜應(yīng)該表示通過在時間上平滑單位響度N[b,t]所產(chǎn)生的音頻的平均頻譜形狀。可以稱平滑的單位響度為N[b,t]。當(dāng)利用多頻帶DRC時,可以不想要EDQ修改來從一個頻帶到下一個頻帶劇烈地變化,所以可以應(yīng)用頻帶平滑函數(shù)產(chǎn)生頻帶平滑的頻譜L[b,t]L‾[b,t]=ΣcQ(b-c)N‾[c,t].---(21)]]>為了保留音頻的原始動態(tài)范圍,應(yīng)該規(guī)格化想要的頻譜EQ[b]以具有相同的總響度如通過L[b,t]所給出的度量的頻譜形狀。可以稱這種規(guī)格化的頻譜形狀為LEQ[b,t]L‾EQ[b,t]=(ΣcL‾[c,t]ΣcEQ[c])EQ[b].---(22)]]>最后,計(jì)算所述目標(biāo)單位響度為N^[b,t]=(L‾[b,t]L‾EQ[b,t])1-βL‾EQ[b,t]L‾[b,t]N[b,t],---(23)]]>其中,β是范圍從零到一的用戶特定參數(shù),它指示將應(yīng)用的DEQ的程度。參見方程23,注意到當(dāng)β=0時,不修改原始的單位響度,以及當(dāng)β=1時,通過想要的頻譜形狀和度量的頻譜形狀之比定標(biāo)所述單位響度。
一種產(chǎn)生想要的頻譜形狀EQ[b]的簡便方式是用戶將它設(shè)置成等于如對音頻的某些片段所度量的L[b,t],用戶發(fā)現(xiàn)該音頻的頻譜平衡令人愉悅。在實(shí)際的實(shí)施例中,例如在圖16中所示,可以給用戶提供按鈕或其他適當(dāng)?shù)闹聞悠?07,當(dāng)它被激勵時,導(dǎo)致捕獲所述音頻的頻譜形狀L[b,t]的當(dāng)前度量,然后存儲該度量作為當(dāng)啟動DEQ時(如通過預(yù)置選擇508)可以以后被加載到EQ[b]中的預(yù)置(在目標(biāo)單位響度預(yù)置捕獲和存儲506中)。圖16是圖7的簡化型式,其中只示出了單條線來表示從分析濾波器組100到合成濾波器組110的多個頻帶。圖17的實(shí)例還提供動態(tài)EQ單位響度(SL)修改505,該修改提供對根據(jù)如上所述的動態(tài)均衡通過函數(shù)或設(shè)備104所度量的單位響度的修改。
合并處理可能希望合并所有之前描述的處理,包括音量控制(VC)、AGC、DRC和DEQ到單個系統(tǒng)中。由于這些處理中的每個處理可以表示為單位響度的定標(biāo),因此它們?nèi)勘蝗菀椎剡M(jìn)行如下合并N^[b,t]=(ΞVC[b,t]ΞAGC[b,t]ΞDRC[b,t]ΞDEQ[b,t])N[b,t],---(24)]]>其中,Ξ*[b,t]表示與處理“*”相關(guān)的定標(biāo)因子。然后可以為表示合并處理的目標(biāo)單位響度計(jì)算單個一組增益G[b,t]。
在某些情況下,響度修改處理之一或組合的定標(biāo)因子可以隨時間快速地波動并且在所產(chǎn)生的處理音頻中產(chǎn)生非自然信號。所以可能想要平滑這些定標(biāo)因子的某子集。通常,來自VC和DEQ的定標(biāo)因子在時間上平滑地變化,但是可能需要平滑AGC和DRC定標(biāo)因子的組合。讓這些定標(biāo)因子的組合通過以下表示ΞC[b,t]=ΞAGC[b,t]ΞDRC[b,t](25)在平滑之后的基本概念是當(dāng)單位響度增加時組合的定標(biāo)因子應(yīng)該快速地進(jìn)行反作用,以及當(dāng)單位響度減小時定標(biāo)因子應(yīng)該被更加緩慢地平滑。這種概念對應(yīng)于在音頻處理器的設(shè)計(jì)中熟知的使用快攻和慢釋放的實(shí)踐。用于平滑定標(biāo)因子的適當(dāng)時間常量可以通過在時間上平滑單位響度的頻帶平滑型式進(jìn)行計(jì)算。首先計(jì)算單位響度的頻帶平滑型式Σc(b-c)N[c,t]---(26)]]>其中,N[c,t]是音頻信號的單位響度以及Q(b-c)是如上述方程19中的平滑濾波器的頻帶位移響應(yīng)。
然后這種頻帶平滑單位響度的時間平滑型式被計(jì)算為L[b,t]=λ[b,t]L[b,t]+(1-λ[b,t])L[b,t-1] (27)其中,頻帶相關(guān)的平滑系數(shù)λ[b,t]通過以下給出λ[b,t]=λfast,L[b,t]>L‾[b,t]λslowL[b,t]≤L‾[b,t]---(28)]]>然后計(jì)算平滑的組合定標(biāo)因子為ΞC[b,t]=λM[b,t]ΞC[b,t]+(1-λM[b,t])ΞC[b,t-1] (29)其中,λM[b,t]是λ[b,t]的頻帶平滑型式
λM[b,t]=(1ΣcQ(c))ΣcQ(b-c)λ[b,t].---(30)]]>平滑系數(shù)的頻帶平滑防止時間平滑的定標(biāo)因子在頻帶上劇烈地變化。所述定標(biāo)因子時間和頻帶平滑產(chǎn)生包含更少客觀感覺非自然信號的經(jīng)處理的音頻。
噪聲補(bǔ)償在許多音頻重放環(huán)境中存在和聽眾希望聽到的音頻相干擾的背景噪聲。例如,在行使汽車中的聽眾可以在安裝的立體聲系統(tǒng)上播放音樂以及來自引擎和道路的噪聲可以嚴(yán)重地改變音樂的感覺。特別是,對于噪聲能量相對于音樂能量顯著的所述頻譜部分,該音樂的感覺響度被減小。如果噪聲級足夠大,音樂則被完全地屏蔽。有關(guān)本發(fā)明的一個方面,愿意選擇增益G[b,t]從而在存在干擾噪聲的情況下經(jīng)處理音頻的單位響度等于目標(biāo)單位響度 為了實(shí)現(xiàn)這種效果,可以利用如通過Moore和Glasberg在上面定義的部分響度的構(gòu)思。假設(shè)能夠單獨(dú)地獲得噪聲的度量以及單獨(dú)地獲得音頻的度量。讓EN[b,t]表示來自噪聲的激勵以及讓EA[b,t]表示來自音頻的激勵。然后通過以下公式給出音頻和噪聲的組合單位響度NTOT[b,t]=Ψ{EA[b,t]+EN[b,t]}, (31)其中,Ψ{·}仍然表示從激勵到單位響度的非線性變換。可以假設(shè)聽眾的聽覺以一種保留組合單位響度的方式在音頻的部分單位響度和噪聲的部分單位響度之間區(qū)分組合的單位響度NTOT[b,t]=NA[b,t]+NN[b,t]. (32)音頻的部分單位響度NA[b,t]是希望控制的值,所以必須求解該值。噪聲的部分單位響度可以被近似為NN[b,t]=(ETN[b,t]EA[b,t])κ(Ψ{EN[b,t]+ETN[b,t]}-Ψ{ETQ[b]})---(33)]]>其中,ETN[b,t]是存在噪聲時的屏蔽門限,ETQ[b]是在頻帶b處于無聲的聽覺門限,以及κ是位于0和1之間的指數(shù)。組合方程31-33可以得到用于音頻的部分單位響度的表達(dá)式
NA[b,t]=Ψ{EA[b,t]+EN[b,t]}-(ETN[b,t]EA[b,t])κ(Ψ{EN[b,t]+ETN[b,t]}-Ψ{ETQ[b]})---(34)]]>注意到當(dāng)所述音頻的激勵等于噪聲的屏蔽門限時(EA[b,t]=ETN[b,t]),該音頻的部分單位響度在無聲門限等于信號的響度,這是想要的結(jié)果。當(dāng)音頻的激勵非常大于噪聲的激勵時,方程34中的第二項(xiàng)趨于零,以及如果不存在噪聲的話則該音頻的單位響度近似等于它實(shí)際上的值。換言之,如果音頻變得比噪聲更響亮,則噪聲被該音頻所屏蔽。通過經(jīng)驗(yàn)選擇指數(shù)κ以在噪聲中的音調(diào)響度上賦予數(shù)據(jù)最佳的擬合作為信噪比的函數(shù)。Moore和Glasberg已經(jīng)發(fā)現(xiàn)值κ=0.3是合適的。噪聲的屏蔽門限可以被近似為噪聲激勵本身的函數(shù)ETN[b,t]=K[b]EN[b,t]+ETQ[b] (35)其中,K[b]是在較低頻帶上增加的常量。因此,通過方程34給出的音頻的部分單位響度可以被抽象地表示為音頻激勵和噪聲激勵的函數(shù)NA[b,t]=Φ{EA[b,t],EN[b,t]}. (36)然后可以使用修改增益解算器來計(jì)算增益G[b,t],從而在存在噪聲時經(jīng)處理音頻的部分單位響度等于目標(biāo)單位響度N^[b,t]=Φ{G2[b,t]EA[b,t],EN[b,t]}---(37)]]>圖17描述圖7的系統(tǒng),該系統(tǒng)具有被所述噪聲補(bǔ)償增益解算器206替換的原始增益解算器106(注意表示濾波器組的多個頻帶的塊之間的多個垂直線已經(jīng)被替換成單條線以簡化圖)。另外,該圖描述了和音頻激勵(來自平滑103)和目標(biāo)單位響度(來自SL修改105)一起饋送到新增益解算器206中的噪聲激勵的測量(通過分析濾波器組200、傳輸濾波器201、激勵202和平滑203以一種對應(yīng)于方框100、101、102和103的操作的方式)。
在其最基本的操作模式中,圖17中的SL修改105可以簡單地設(shè)置目標(biāo)單位響度 等于音頻的原始單位響度N[b,t]。換言之,SL修改提供對音頻信號的單位響度定標(biāo)的頻率恒定的定標(biāo)因子α,其中α=1。利用諸如圖17中的結(jié)構(gòu),計(jì)算增益從而在噪聲存在時經(jīng)處理音頻的感覺響度頻譜等于在噪聲不存在時所述音頻的響度頻譜。另外,上述計(jì)算目標(biāo)單位響度為原始音頻函數(shù)的技術(shù)中任何一個或組合,包括VC、AGC、DRC和DEQ都可以被結(jié)合噪聲補(bǔ)償響度修改系統(tǒng)使用。
在實(shí)際的實(shí)施例中,可以從被放置在將會播放音頻的環(huán)境中的或靠近這種環(huán)境的麥克風(fēng)獲得噪聲的度量。可替換地,可以使用近似在各種條件下的預(yù)期噪聲頻譜的一組預(yù)定的模板噪聲激勵。例如,可以以各種驅(qū)動速度預(yù)先分析汽車室內(nèi)的噪聲以及然后將其存儲為與速度相對的噪聲激勵的查詢表。接下來可以在汽車速度變化時根據(jù)這個查詢表近似饋送到圖17的增益解算器206中的噪聲激勵。
實(shí)現(xiàn)本發(fā)明可以以硬件或軟件、或二者的組合(例如可編程邏輯陣列)實(shí)現(xiàn)。除非特別聲明,被包括作為本發(fā)明一部分的算法在本質(zhì)上與任何特定的計(jì)算機(jī)或其他設(shè)備無關(guān)。特別是,可以根據(jù)這里的教導(dǎo)利用寫入程序使用各種通用機(jī)器,或者可以更為方便的是構(gòu)造更專用的設(shè)備(例如集成電路)來執(zhí)行所需的方法步驟。因此,本發(fā)明可以以在一個或更多可編程計(jì)算機(jī)系統(tǒng)上執(zhí)行的一個或更多計(jì)算機(jī)程序?qū)崿F(xiàn),每個計(jì)算機(jī)系統(tǒng)包括至少一個處理器、至少一個數(shù)據(jù)存儲系統(tǒng)(包括易失性和非易失性存儲器和/或存儲單元)、至少一個輸入設(shè)備或端口、以及至少一個輸出設(shè)備或端口。應(yīng)用程序代碼給輸入數(shù)據(jù)以執(zhí)行這里描述的功能和產(chǎn)生輸出信息。該輸出信息以已知的方式應(yīng)用于一個或更多輸出設(shè)備。
每個這種程序可以以任何想要的計(jì)算機(jī)語言(包括機(jī)器、匯編、或高級程序、邏輯、或面向?qū)ο蟮木幊陶Z言)實(shí)現(xiàn)以與計(jì)算機(jī)系統(tǒng)進(jìn)行通信。在任何情況下,所述語言可以是編譯或解釋語言。
每個這種計(jì)算機(jī)程序優(yōu)選被存儲在或下載到通用或?qū)S每删幊逃?jì)算機(jī)可讀的存儲媒體或設(shè)備(例如固態(tài)存儲器或媒體、磁性或光學(xué)媒體),用于當(dāng)存儲媒體或設(shè)備被計(jì)算機(jī)系統(tǒng)讀取時,配置和操作計(jì)算機(jī)執(zhí)行這里描述的程序。本發(fā)明的系統(tǒng)還可以考慮實(shí)現(xiàn)為計(jì)算機(jī)可讀的用計(jì)算機(jī)程序配置的存儲媒體,這里如此配置的所述存儲媒體使得計(jì)算機(jī)系統(tǒng)以一種特定和預(yù)先定義的方式操作來執(zhí)行這里描述的功能。
已經(jīng)描述了本發(fā)明的多個實(shí)施例。但是,將會明白在不背離本發(fā)明精神和范圍的條件下可以作出各種修改。例如,這里描述的某些步驟可以是順序不相關(guān)的,因此能夠以不同于這里所描述的順序執(zhí)行這些步驟。
權(quán)利要求
1.一種用于導(dǎo)出可用于控制音頻信號的單位響度的信息的方法,其中單位響度是作為頻率和時間的函數(shù)的感覺響度的度量,該方法包括導(dǎo)出可用于修改音頻信號以便減小它的單位響度和目標(biāo)單位響度之間差值的修改參數(shù)。
2.一種用于導(dǎo)出可用于控制音頻信號的部分單位響度的信息的方法,其中單位響度是作為頻率和時間的函數(shù)的感覺響度的度量以及信號的部分單位響度是作為頻率和時間的函數(shù)的在存在次干擾信號時該信號的感覺響度的度量,該方法包括導(dǎo)出可用于修改音頻信號以便減小它的部分單位響度和目標(biāo)單位響度之間差值的修改參數(shù)。
3.一種用于控制音頻信號的單位響度的方法,其中單位響度是作為頻率和時間的函數(shù)的感覺響度的度量,該方法包括修改所述音頻信號以便減小它的單位響度和目標(biāo)單位響度之間的差值。
4.一種用于控制音頻信號的部分單位響度的方法,其中單位響度是作為頻率和時間的函數(shù)的感覺響度的度量以及信號的部分單位響度是作為頻率和時間的函數(shù)的在存在次干擾信號時該信號的感覺響度的度量,該方法包括修改所述音頻信號以便減小它的部分單位響度和目標(biāo)單位響度之間的差值。
5.根據(jù)權(quán)利要求1-4中任何一個所述的方法,其中所述修改或?qū)С鰪膫鬏斀邮栈驈拇鎯γ襟w再現(xiàn)音頻和目標(biāo)單位響度或目標(biāo)單位響度的表示。
6.根據(jù)權(quán)利要求3或4所述的方法,其中所述修改根據(jù)修改參數(shù)修改所述音頻信號以提供經(jīng)修改的音頻信號以及所述修改從傳輸接收或從存儲媒體再現(xiàn)音頻和修改參數(shù)。
7.根據(jù)權(quán)利要求3或4所述的方法,其中所述修改包括產(chǎn)生修改參數(shù)。
8.根據(jù)權(quán)利要求1-7中任何一個所述的方法,其中所述目標(biāo)單位響度不是音頻信號的函數(shù)。
9.根據(jù)權(quán)利要求8所述的方法,其中所述修改或所述導(dǎo)出包括存儲目標(biāo)單位響度。
10.根據(jù)權(quán)利要求8所述的方法,其中所述修改或所述導(dǎo)出包括從本方法的外部來源接收目標(biāo)單位響度。
11.根據(jù)權(quán)利要求8-10中任何一個所述的方法,其中所述修改或所述導(dǎo)出包括顯式計(jì)算單位響度和/或部分單位響度的處理。
12.根據(jù)權(quán)利要求8-10中任何一個所述的方法,其中所述修改或所述導(dǎo)出包括隱式計(jì)算單位響度和/或部分單位響度的處理。
13.根據(jù)權(quán)利要求12所述的方法,其中所述處理應(yīng)用查詢表以便該處理固有地確定單位響度和/或部分單位響度。
14.根據(jù)權(quán)利要求12所述的方法,其中以所述處理應(yīng)用的封閉式數(shù)學(xué)表達(dá)式固有地確定單位響度和/或部分單位響度。
15.根據(jù)權(quán)利要求8-14中任何一個所述的方法,其中所述目標(biāo)單位響度是時間和頻率恒定的。
16.根據(jù)權(quán)利要求8-14中任何一個所述的方法,其中所述目標(biāo)單位響度是時間恒定的。
17.一種用于處理音頻信號的方法,包括根據(jù)一個或更多處理以及一個或更多處理控制參數(shù)來處理音頻信號或音頻信號的度量以產(chǎn)生目標(biāo)單位響度,其中單位響度是作為頻率和時間的函數(shù)的音頻信號的感覺響度的度量。
18.根據(jù)權(quán)利要求1-7和17中任何一個所述的方法,其中所述目標(biāo)單位響度是音頻信號或音頻信號度量的函數(shù)。
19.根據(jù)權(quán)利要求18所述的方法,其中所述音頻信號的度量是音頻信號的單位響度。
20.根據(jù)權(quán)利要求18或19所述的方法,其中音頻信號或音頻信號度量的函數(shù)是音頻信號或音頻信號度量的一個或更多定標(biāo)。
21.根據(jù)權(quán)利要求20所述的方法,其中所述一個或更多定標(biāo)包括如在以下關(guān)系中定標(biāo)單位響度的時間和頻率變化的定標(biāo)因子Ξ[b,t]N^[b,t]=Ξ[b,t]N[b,t],]]>其中, 是目標(biāo)單位響度,N[b,t]是音頻信號的單位響度,b是頻率的度量,以及t是時間的度量。
22.根據(jù)權(quán)利要求21所述的方法,其中至少部分地通過想要的多頻帶響度和音頻信號的多頻帶響度之比確定所述定標(biāo)。
23.根據(jù)權(quán)利要求22所述的方法,其中所述定標(biāo)可以如在以下關(guān)系中被表示為Lo[b,t]/Li[b,t]N^[b,t]=Lo[b,t]Li[b,t]N[b,t],]]>其中,N[b,t]是音頻信號的單位響度,Lo[b,t]是想要的多頻帶響度,Li[b,t]是音頻信號的多頻帶響度,以及 是目標(biāo)單位響度。
24.根據(jù)權(quán)利要求23所述的方法,其中Lo[b,t]是Li[b,t]的函數(shù)。
25.根據(jù)權(quán)利要求24所述的方法,其中作為Li[b,t]的函數(shù)的Lo[b,t]可以被表示為Lo[b,t]=DRC{Li[b,t]},其中,DRC{}指示將Li[b,t]映射到Lo[b,t]的動態(tài)范圍函數(shù)。
26.根據(jù)權(quán)利要求23所述的方法,其中Li[b,t]是音頻信號的單位響度的時間平滑和/或頻率平滑的型式。
27.根據(jù)權(quán)利要求22-26中任何一個所述的方法,其中該方法可用作動態(tài)范圍控制,在該控制中產(chǎn)生所述修改或所述修改參數(shù)的應(yīng)用或所述目標(biāo)單位響度對應(yīng)于音頻信號,對于單位響度定標(biāo)的不同值來說感覺的音頻頻譜或在存在干擾信號時所述感覺的音頻頻譜是不同的。
28.根據(jù)權(quán)利要求27所述的方法,其中所述動態(tài)范圍函數(shù)控制每個頻帶中的響度從而應(yīng)用于每個頻帶的短期變化在頻帶之間獨(dú)立地變化,而應(yīng)用于每個頻帶的平均變化對于所有頻帶基本上是相同的。
29.根據(jù)權(quán)利要求28所述的方法,其中作為Li[b,t]的函數(shù)的Lo[b,t]可以被表示為Lo[b,t]=L‾i[b,t]L‾i[t]DRC{L‾i[t]L‾i[b,t]Li[b,t]}]]>其中,Lo[t]=DRC{Li[t]}表示音頻信號總響度到想要的總響度的映射,Li[t]表示音頻信號寬帶響度Li[t]的時間平均型式,以及Li[b,t]表示音頻信號的多頻帶響度Li[b,t]的時間平均型式。
30.根據(jù)權(quán)利要求28或29所述的方法,其中該方法可用作動態(tài)范圍控制,在該控制中產(chǎn)生所述修改或所述修改參數(shù)的應(yīng)用或所述目標(biāo)單位響度對應(yīng)于音頻信號,其中對于單位響度定標(biāo)的不同值來說,感覺的音頻頻譜或在干擾信號存在時感覺的音頻頻譜基本上和所述音頻信號的感覺音頻頻譜保持相同。
31.根據(jù)權(quán)利要求21所述的方法,其中通過想要的頻譜形狀和音頻信號的頻譜形狀的度量之比定標(biāo)所述單位響度。
32.根據(jù)權(quán)利要求31所述的方法,其中該方法將音頻信號的感覺頻譜從時間變化的感覺頻譜變換成基本上時間恒定的感覺頻譜。
33.根據(jù)權(quán)利要求31或32所述的方法,其中所述定標(biāo)可以在以下關(guān)系中被表示為(L‾[b,t]L‾EQ[b,t])1-βL‾EQ[b,t]L‾[b,t]:]]>N^[b,t]=(L‾[b,t]L‾EQ[b,t])1-βL‾EQ[b,t]L‾[b,t]N[b,t],]]>以及其中,L[b,t]是音頻信號的時間平滑的多頻帶響度,LEQ[b,t]是想要的頻譜EQ[b],其被規(guī)格化成和多頻帶響度L[b,t]具有相同的寬帶響度,從而可以將LEQ[b,t]表示為L‾EQ[b,t]=(ΣcL‾[c,t]ΣcEQ[c])EQ[b]]]>其中,N[b,t]是音頻信號的單位響度, 是目標(biāo)單位響度,以及β是具有通過并包括零和一所限制范圍的參數(shù),所述參數(shù)控制定標(biāo)的等級。
34.根據(jù)權(quán)利要求33所述的方法,其中通過本方法的外部來源選擇或控制參數(shù)β。
35.根據(jù)權(quán)利要求34所述的方法,其中所述來源是本方法的用戶。
36.根據(jù)權(quán)利要求31到35中任何一個所述的方法,其中該方法可用作動態(tài)均衡器,在該均衡器中產(chǎn)生所述修改或所述修改參數(shù)的應(yīng)用或所述目標(biāo)單位響度對應(yīng)于音頻信號,其中對于單位響度定標(biāo)的不同值來說感覺的音頻頻譜或在干擾信號存在時感覺的音頻頻譜可以是不同的。
37.根據(jù)權(quán)利要求21-36中任何一個所述的方法,其中通過將音頻劃分成臨界頻帶以及在臨界頻帶之一上進(jìn)行頻率平滑來近似音頻信號的多頻帶響度。
38.根據(jù)權(quán)利要求37所述的方法,其中在特定的頻帶b,多頻帶響度的頻帶平滑型式L[b,t]可以表示為在所有頻帶c上的卷積和L[b,t]=ΣcQ(b-c)N[c,t],]]>其中,N[c,t]是音頻信號的單位響度以及Q(b-c)是平滑濾波器的頻帶位移響應(yīng)。
39.根據(jù)權(quán)利要求20所述的方法,其中一個或更多定標(biāo)包括如在以下關(guān)系中定標(biāo)單位響度的時間變化、頻率恒定的定標(biāo)因子Φ[t]N^[b,t]=Φ[t]N[b,t],]]>其中, 是目標(biāo)單位響度,N[b,t]是音頻信號的單位響度,b是頻率的度量,以及t是時間的度量。
40.根據(jù)權(quán)利要求39所述的方法,其中至少部分地通過想要的寬帶響度和音頻信號的寬帶響度之比確定所述定標(biāo)。
41.根據(jù)權(quán)利要求39或40所述的方法,其中音頻信號的單位響度函數(shù)中的所述定標(biāo)可以如在以下關(guān)系中被表示為Lo[t]/Li[t]N^[b,t]=Lo[t]Li[t]N[b,t],]]>其中,N[b,t]是音頻信號的單位響度,Lo[t]是想要的寬帶響度,Li[t]是音頻信號的寬帶響度,以及 是目標(biāo)單位響度。
42.根據(jù)權(quán)利要求41所述的方法,其中Lo[t]是Li[t]的函數(shù)。
43.根據(jù)權(quán)利要求42所述的方法,其中作為Li[t]的函數(shù)的Lo[t]可以被表示為Lo[t]=DRC{Li[t]}其中,DRC{}指示將Li[t]映射到Lo[t]的動態(tài)范圍函數(shù)。
44.根據(jù)權(quán)利要求41所述的方法,其中Li[t]是音頻信號總響度的時間平滑型式。
45.根據(jù)權(quán)利要求41所述的方法,其中Li[t]是音頻信號的長期響度的度量。
46.根據(jù)權(quán)利要求41所述的方法,其中Li[t]是音頻信號的短期響度的度量。
47.根據(jù)權(quán)利要求39-46中任何一個所述的方法,其中該方法可用作自動增益控制或動態(tài)范圍控制,在該控制中產(chǎn)生所述修改或所述修改參數(shù)的應(yīng)用以及所述目標(biāo)單位響度對應(yīng)于音頻信號,其中對于單位響度定標(biāo)或部分單位響度定標(biāo)的不同值來說,感覺的音頻頻譜或在干擾信號存在時感覺的音頻頻譜基本上和音頻信號的感覺音頻頻譜保持相同。
48.根據(jù)權(quán)利要求21-47中任何一個所述的方法,其中所述定標(biāo)因子是音頻信號或音頻信號度量的函數(shù)。
49.根據(jù)權(quán)利要求20所述的方法,其中一個或更多定標(biāo)包括如在以下關(guān)系中定標(biāo)單位響度的時間恒定、頻率變化的定標(biāo)因子Θ[b]N^[b,t]=Θ[b]N[b,t],]]>其中, 是目標(biāo)單位響度,N[b,t]是音頻信號的單位響度,b是頻率的度量,以及t是時間的度量。
50.根據(jù)權(quán)利要求49所述的方法,其中所述修改或所述導(dǎo)出包括存儲定標(biāo)因子Θ[b]。
51.根據(jù)權(quán)利要求49所述的方法,其中從本方法的外部來源接收定標(biāo)因子Θ[b]。
52.根據(jù)權(quán)利要求20所述的方法,其中所述一個或更多定標(biāo)包括如在以下關(guān)系中定標(biāo)音頻信號的單位響度的時間恒定、頻率恒定的定標(biāo)因子αN^[b,t]=αN[b,t],]]>其中, 是目標(biāo)單位響度,N[b,t]是音頻信號的單位響度,b是頻率的度量,以及t是時間的度量。
53.根據(jù)權(quán)利要求52所述的方法,其中所述修改或所述導(dǎo)出包括存儲定標(biāo)因子α。
54.根據(jù)權(quán)利要求52所述的方法,其中從本方法的外部來源接收所述定標(biāo)因子α。
55.根據(jù)權(quán)利要求49-54中任何一個所述的方法,其中該方法可用作音量控制,在該控制中產(chǎn)生所述修改或所述修改參數(shù)的應(yīng)用或所述目標(biāo)單位響度對應(yīng)于音頻信號,其中對于單位響度或部分單位響度定標(biāo)的不同值,感覺的音頻頻譜或在存在干擾信號時感覺的音頻頻譜基本上與音頻信號的感覺音頻頻譜保持相同。
56.根據(jù)權(quán)利要求49-55中任何一個所述的方法,其中所述定標(biāo)因子不是音頻信號或音頻信號度量的函數(shù)。
57.根據(jù)權(quán)利要求1-56中任何一個所述的方法,其中所述修改、所述導(dǎo)出、或產(chǎn)生顯式地計(jì)算(1)單位響度,和/或(2)部分單位響度,和/或目標(biāo)單位響度。
58.根據(jù)權(quán)利要求1-56中任何一個所述的方法,其中所述修改、所述導(dǎo)出、或產(chǎn)生隱式地計(jì)算(1)單位響度,和/或(2)部分單位響度,和/或目標(biāo)單位響度。
59.根據(jù)權(quán)利要求58所述的方法,其中所述修改、所述導(dǎo)出、或所述產(chǎn)生應(yīng)用查詢表,該查詢表固有地確定(1)單位響度,和/或(2)部分單位響度,和/或目標(biāo)單位響度。
60.根據(jù)權(quán)利要求58所述的方法,其中所述修改、所述導(dǎo)出、或所述產(chǎn)生應(yīng)用封閉式數(shù)學(xué)表達(dá)式,該表達(dá)式固有地確定(1)單位響度,和/或(2)部分單位響度,和/或目標(biāo)單位響度。
61.根據(jù)權(quán)利要求1、2、7中任何一個以及從屬于權(quán)利要求1、2或7的權(quán)利要求8-16以及18-60中任何一個所述的方法,其中所述修改或?qū)С?1)發(fā)送和接收或(2)存儲和再現(xiàn)音頻信號和修改參數(shù)。
62.根據(jù)權(quán)利要求1、2、6、7中任何一個以及從屬于權(quán)利要求1、2、6或7的權(quán)利要求8-16以及18-60中任何一個所述的方法,其中時間平滑所述修改參數(shù)。
63.根據(jù)權(quán)利要求62所述的方法,其中所述修改參數(shù)包括多個與音頻信號的頻帶相關(guān)的幅度定標(biāo)因子。
64.根據(jù)權(quán)利要求63所述的方法,其中多個幅度定標(biāo)因子的至少一部分是時間變化的。
65.根據(jù)權(quán)利要求62所述的方法,其中所述修改參數(shù)包括用于控制一個或更多濾波器的多個濾波器系數(shù)。
66.根據(jù)權(quán)利要求65所述的方法,其中一個或更多濾波器中的至少一部分和所述濾波器系數(shù)中的至少一部分是時間變化的。
67.根據(jù)權(quán)利要求1-66中任何一個所述的方法,其中所述修改、所述導(dǎo)出、或所述產(chǎn)生取決于以下之一或更多干擾音頻信號的度量,目標(biāo)單位響度,根據(jù)經(jīng)修改音頻信號的單位響度或部分單位響度導(dǎo)出的未經(jīng)修改音頻信號的單位響度的估計(jì),未經(jīng)修改音頻信號的單位響度,和根據(jù)經(jīng)修改音頻信號的單位響度或部分單位響度導(dǎo)出的目標(biāo)單位響度的近似。
68.根據(jù)權(quán)利要求1-4、7中任何一個以及從屬于權(quán)利要求1-4或7的權(quán)利要求8-16和18-66中任何一個所述的方法,其中所述修改或所述導(dǎo)出至少部分根據(jù)以下之一或更多導(dǎo)出修改參數(shù)干擾音頻信號的度量,目標(biāo)單位響度,根據(jù)經(jīng)修改音頻信號的單位響度或部分單位響度導(dǎo)出的未經(jīng)修改音頻信號的單位響度的估計(jì),未經(jīng)修改音頻信號的單位響度,和根據(jù)經(jīng)修改音頻信號的單位響度或部分單位響度導(dǎo)出的目標(biāo)單位響度的近似。
69.根據(jù)權(quán)利要求68所述的方法,其中所述修改或所述導(dǎo)出至少部分根據(jù)以下導(dǎo)出修改參數(shù)(1)目標(biāo)單位響度和根據(jù)經(jīng)修改音頻信號的單位響度導(dǎo)出的未經(jīng)修改音頻信號的單位響度的估計(jì)之一,以及(2)未經(jīng)修改音頻信號的單位響度和根據(jù)經(jīng)修改音頻信號的單位響度導(dǎo)出的目標(biāo)單位響度的近似之一。
70.根據(jù)權(quán)利要求68所述的方法,其中所述修改或所述導(dǎo)出至少部分根據(jù)以下導(dǎo)出修改參數(shù)(1)干擾音頻信號的度量,(2)目標(biāo)單位響度和根據(jù)經(jīng)修改音頻信號的部分單位響度導(dǎo)出的未經(jīng)修改音頻信號的單位響度的估計(jì)之一,以及(3)未經(jīng)修改音頻信號的單位響度和根據(jù)經(jīng)修改音頻信號的部分單位響度導(dǎo)出的目標(biāo)單位響度的近似之一。
71.根據(jù)權(quán)利要求69或70所述的方法,其中該方法應(yīng)用前饋結(jié)構(gòu),其中根據(jù)音頻信號導(dǎo)出單位響度以及從本方法的外部來源或當(dāng)修改或?qū)С霭ù鎯δ繕?biāo)單位響度時從存儲接收目標(biāo)單位響度。
72.根據(jù)權(quán)利要求69或70所述的方法,其中該方法應(yīng)用混合前饋/反饋結(jié)構(gòu),其中根據(jù)經(jīng)修改的音頻信號導(dǎo)出目標(biāo)單位響度的近似以及從本方法的外部來源或者當(dāng)所述修改或?qū)С霭ù鎯δ繕?biāo)單位響度時從存儲接收目標(biāo)單位響度。
73.根據(jù)權(quán)利要求69或70所述的方法,其中所述修改或?qū)С霭@式或隱式地獲得目標(biāo)單位響度的一個或更多處理,其中的一個或更多處理顯式或隱式地計(jì)算音頻信號或音頻信號度量的所述函數(shù)。
74.根據(jù)權(quán)利要求73所述的方法,其中該方法應(yīng)用前饋結(jié)構(gòu),其中根據(jù)音頻信號導(dǎo)出單位響度和目標(biāo)單位響度,目標(biāo)單位響度的導(dǎo)出應(yīng)用音頻信號或音頻信號度量的所述函數(shù)。
75.根據(jù)權(quán)利要求73所述的方法,其中該方法應(yīng)用混合前饋/反饋結(jié)構(gòu),其中根據(jù)經(jīng)修改的音頻信號導(dǎo)出目標(biāo)單位響度的近似以及根據(jù)音頻信號導(dǎo)出目標(biāo)單位響度,目標(biāo)單位響度的導(dǎo)出應(yīng)用音頻信號或音頻信號度量的所述函數(shù)。
76.根據(jù)權(quán)利要求69或70所述的方法,其中所述修改或?qū)С霭憫?yīng)于經(jīng)修改的音頻信號顯式或隱式地獲得未經(jīng)修改音頻信號的單位響度估計(jì)的一個或更多處理,其中的一個或更多處理顯式或隱式地計(jì)算音頻信號或音頻信號度量的所述函數(shù)的反函數(shù)。
77.根據(jù)權(quán)利要求76所述的方法,其中該方法應(yīng)用反饋結(jié)構(gòu),其中根據(jù)經(jīng)修改的音頻信號導(dǎo)出未經(jīng)修改音頻信號的單位響度的估計(jì)以及目標(biāo)單位響度的近似,使用所述音頻信號或音頻信號度量的所述函數(shù)的反函數(shù)計(jì)算單位響度的估計(jì)。
78.根據(jù)權(quán)利要求76所述的方法,其中該方法應(yīng)用混合前饋/反饋結(jié)構(gòu),其中根據(jù)音頻信號導(dǎo)出單位響度以及根據(jù)經(jīng)修改的音頻信號導(dǎo)出未經(jīng)修改音頻信號的單位響度估計(jì),使用音頻信號或音頻信號度量的所述函數(shù)的反函數(shù)計(jì)算所述估計(jì)的導(dǎo)出。
79.根據(jù)權(quán)利要求1-4、17以及從屬于1-4或17的權(quán)利要求18-78中任何一個所述的方法,其中所述修改或?qū)С?1)發(fā)送和接收或(2)存儲和再現(xiàn)音頻信號和目標(biāo)單位響度或目標(biāo)單位響度的表示。
80.根據(jù)從屬于權(quán)利要求20、21、39、49或52中任何一個的權(quán)利要求79所述的方法,其中目標(biāo)單位響度的表示是定標(biāo)音頻信號或音頻信號度量的一個或更多定標(biāo)因子。
81.根據(jù)權(quán)利要求1、2、6和7以及從屬于權(quán)利要求1、2、6或7的權(quán)利要求8-16和18-80中任何一個所述的方法,還包括應(yīng)用所述修改參數(shù)于音頻信號以產(chǎn)生經(jīng)修改的音頻信號。
82.根據(jù)權(quán)利要求1-4、17以及從屬于權(quán)利要求1-4或17的權(quán)利要求18-78中任何一個所述的方法,還包括發(fā)送或存儲音頻信號和目標(biāo)單位響度或目標(biāo)單位響度的表示。
83.根據(jù)權(quán)利要求82所述的方法,還包括接收或再現(xiàn)發(fā)送的或存儲的音頻信號和目標(biāo)單位響度或目標(biāo)單位響度的表示。
84.根據(jù)權(quán)利要求83所述的方法,還包括響應(yīng)于音頻信號和目標(biāo)單位響度或它的表示修改所述音頻信號,以便減小音頻信號的單位響度和所述目標(biāo)單位響度之間的差值。
85.根據(jù)從屬于權(quán)利要求20-60中任何一個的權(quán)利要求82-84中任何一個所述的方法,其中目標(biāo)單位響度的表示是定標(biāo)所述音頻信號或音頻信號度量的一個或更多定標(biāo)因子。
86.根據(jù)權(quán)利要求1、2、7以及從屬于權(quán)利要求1、2或7的權(quán)利要求18-60中任何一個所述的方法,還包括發(fā)送或存儲音頻信號和修改參數(shù)。
87.根據(jù)權(quán)利要求86所述的方法,還包括接收或再現(xiàn)發(fā)送的或存儲的音頻信號和修改參數(shù)。
88.根據(jù)權(quán)利要求87所述的方法,還包括響應(yīng)于所述修改參數(shù)修改音頻信號。
89.一種適于執(zhí)行權(quán)利要求1到88中任何一個所述的方法的設(shè)備。
全文摘要
本發(fā)明涉及音頻信號的感覺聲音響度和/或感覺頻譜平衡的測量和控制。響應(yīng)于至少部分在感覺(心理聲學(xué))響度域中執(zhí)行的計(jì)算修改音頻信號。本發(fā)明可用于例如以下之一或更多響度補(bǔ)償音量控制、自動增益控制、動態(tài)范圍控制(包括例如限幅器、壓縮器、擴(kuò)展器等等)、動態(tài)均衡、以及補(bǔ)償音頻重放環(huán)境中的背景噪聲。本發(fā)明不僅包括方法而且還包括相應(yīng)的計(jì)算機(jī)程序和設(shè)備。
文檔編號H03G9/14GK101048935SQ200580036760
公開日2007年10月3日 申請日期2005年10月25日 優(yōu)先權(quán)日2004年10月26日
發(fā)明者阿倫·J.·西非爾特 申請人:杜比實(shí)驗(yàn)室特許公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
主站蜘蛛池模板: 三江| 衡山县| 安仁县| 汉阴县| 达日县| 呈贡县| 库伦旗| 甘泉县| 安达市| 阿城市| 修文县| 景东| 绍兴市| 蚌埠市| 岳池县| 镇宁| 彭泽县| 老河口市| 阿瓦提县| 桐庐县| 确山县| 万宁市| 九龙县| 迭部县| 观塘区| 黄平县| 延安市| 吉隆县| 额敏县| 疏勒县| 和田县| 洛川县| 邵阳县| 新田县| 双城市| 尼勒克县| 木里| 六枝特区| 绵竹市| 金溪县| 阜宁县|