用于調平音頻信號的響度變化的系統及方法
【專利摘要】描述了用于對音頻信號的響度變化進行調平的系統及方法。實施方式根據特定標準的響度測量使用感知調平算法和基于標準的響度測量一起來使音頻處理偽聲最小化,并且確保經處理的音頻的測量響度接近于所要求的測量。可以離線地或者實時地使用這些系統和方法。
【專利說明】用于調平音頻信號的響度變化的系統及方法
[0001] 相關申請的交叉引用
[0002] 本申請要求于2012年4月12日提交的美國臨時專利申請No. 61/623,253和于 2012年12月19日提交的美國臨時專利申請No. 61/739,545的優先權,在此通過引用將它 們中的每個的全部內容合并到本文中。
【技術領域】
[0003] 本公開內容一般地涉及信號處理,更具體地,涉及用于對音頻信號的響度變化進 行調平的系統及方法。
【背景技術】
[0004] 在許多情況下,尤其對于廣播電視網絡,響度調平或者音頻信號的響亮部分與柔 和部分之間范圍的自動減小是所希望的。差的創作實踐導致電視節目、廣告或這兩者中響 度級的廣泛變化,并且具有明顯不同的響度級的節目或廣告頻繁地連接。電視觀眾經常發 覺他們自己對他們的電視或聲音重放系統調節音量控制以彌補這些變化;然而,這些觀眾 的反應時間經常不夠快得足以避免煩擾。另外,一些節目(例如電影)具有非常高的動態 范圍。對家庭收聽來說這些范圍通常太寬,其中,聽到對話所要求的音量位置可能產生很高 響度級的音效和音樂,這可能干擾家中的其他人。
[0005] 現有的用于響度調平的方法包括壓縮器方法和限制器方法。這些方法在時間上對 音頻信號水平或功率進行積分。積分時間越短,算法就能夠越快地測量和調整響度的短期 波動。積分時間越長,平均響度受到的影響就越大,但是短期波動持續。通常,這些方法通 過同時對整個音頻信號,即,所有頻率進行增益調整來進行操作。這可能導致可聽偽聲,例 如"喘息效應"或"抽氣效應"。最近,開發出了用于響度測量和調整的心理聲學方法,例如 于2007年4月26日公開的Seefeldt等人的美國專利申請公開No. 2007/0092089A1中所 描述的,在此通過引用將其全部內容合并到本文中。這些算法使用譜分析和人類聽覺模型 以隨頻率變化和隨所測量的響度級變化的方式來調整音頻。這些方法在調整毫秒到秒的時 間尺度的短期響度中表現很好,具有非常少的可聽偽聲。
[0006] 區別于響度級,也存在用于客觀地測量音頻信號的感知響度的方法。示例包括A 加權、B加權和C加權功率測量以及響度的心理聲學模型,例如在"Acoustics-Method for calculating loudness level"IS0 532(1997)和美國專利申請公開 No. 2007/0092089A1 中所描述的。加權的功率測量通過以下方式操作:獲得輸入音頻信號;施加加強更可被感 知的敏感頻率而削弱較不可被感知的敏感頻率的已知的濾波器;然后在預定時間長度上對 經濾波的信號的功率求平均。最近開發出的ITU-R BS. 1770-2客觀響度測量標準使用類似 于B加權的加權濾波器,并且根據最終平均功率計算來消除音頻信號的安靜的或靜音的部 分。
[0007] 心理聲學方法通常更復雜,并且旨在更好地對人耳的工作進行建模。這種心理聲 學方法將信號劃分成模仿耳朵的頻率響應和靈敏度的頻帶,然后在考慮心理聲學現象的情 況下對這些帶進行操作和積分,心理聲學現象例如頻率掩蔽和時間掩蔽以及具有變化的信 號強度的響度的非線性感知。所有這些方法的目的在于得出與音頻信號的主觀印象密切匹 配的數值測量。通常,這些方法對測量音頻信號的例如其中音頻信號長度是30秒或更多并 且通常是數分鐘或數小時的長期感知的響度是有用的。多年來,這些客觀測量算法的發展 和接受伴隨有主觀測試,即將客觀算法的測量與人的收聽進行比較。
[0008] 最近,對于廣播電視音頻信號,尤其對于商業,對保持一致的響度的需求增長。 政府的法規已經推動了這種需求,例如聯邦通信委員會出版No. FCC 11-84, "Notice of Proposed Rulemaking :Implementation of the Commercial Advertisement Loudness Mitigation (CALM) Act"。由于廣播者擁有具有已知的平均響度和動態的創作好的內容以及 具有未知的平均響度和可能寬的動態的未知內容的混合,所以他們頻繁地使用與最終到達 電視觀眾的實時音頻信號一致的響度調平設備。然而,當對音頻信號進行水平調整時,通常 對于短期行為優化響度調平器以使偽聲最小化,因此,當使用長期測量進行測量時,所調平 的音頻信號不一定一致。即,所調平的音頻的部分例如30秒或更多的所測量的響度是不一 致的。
【發明內容】
[0009] 因此,在本領域中需要能夠執行短期無偽聲的響度調平同時確保所調平的音頻的 長期響度與已知的測量標準匹配的實時調平方法。本發明的實施方式通過提供對音頻信號 的響度變化進行調平的系統和方法滿足該需求和其他需求。
[0010] 根據一種實施方式,描述了一種對音頻信號的響度變化進行調平的方法。該方法 包括:接收音頻信號和音頻信號的期望響度;消除音頻信號中的偽聲;測量音頻信號的實 際響度;使用音頻信號的期望響度與實際響度之間的差來計算增益值;以及使用增益值來 修改音頻信號。
[0011] 根據另一實施方式,描述了一種對音頻信號的響度變化進行調平的系統。該系統 包括:短期響度調平模塊,其被配置成接收音頻信號和音頻信號的期望響度,并且消除音頻 信號中的偽聲;長期響度調平模塊,其被配置成測量音頻信號的實際響度;響度到增益模 塊,其被配置成使用音頻信號的期望響度與實際響度之間的差來計算增益值;以及音頻修 改模塊,其被配置成使用增益值來值修改音頻信號。在一種實施方式中,短期響度調平模 塊、長期響度調平模塊、響度到增益模塊和音頻修改模塊中的至少之一被包括在處理器中。
[0012] 根據另一實施方式,描述了一種嵌入有計算機可執行指令的計算機可讀介質,該 指令用于執行以下步驟:接收音頻信號和音頻信號的期望響度;消除音頻信號中的偽聲; 測量音頻信號的實際響度;使用音頻信號的期望響度與實際響度之間的差來計算增益值; 以及使用增益值修改音頻信號。
[0013] 根據下面的詳細描述,簡單地通過示出示例實施方式和實現,包括對于實施本發 明所預期的最佳方式,本發明的其他方面、特征和優點容易顯見。在不脫離本發明的精神和 范圍的情況下,本發明也能夠具有其他不同的實施方式,并且可以在各種方面對其若干細 節進行修改。因此,附圖和描述本質上被視為是說明性的而并非限制性的。
【專利附圖】
【附圖說明】
[0014] 圖1是示出根據實施方式的用于實時地對音頻信號的響度變化進行調平的系統 的示意功能框圖。
[0015] 圖2是示出根據實施方式的用于離線地對音頻信號的響度變化進行調平的系統 的示意功能框圖。
[0016] 圖3是示出根據實施方式的用于實時地使用輸入信號調整對響度變化進行調平 的系統的示意功能框圖。
[0017] 圖4是示出根據實施方式的用于離線地使用輸入信號調整對響度變化進行調平 的系統的示意功能框圖。
[0018] 圖5是示出根據實施方式的用于實時地使用輸入基準水平調整對響度變化進行 調平的系統的示意功能框圖。
[0019] 圖6是示出根據實施方式的用于離線地使用輸入基準水平調整對響度變化進行 調平的系統的示意功能框圖。
[0020] 圖7是具有用于使機器執行本文中所描述的一種或更多種方法中的任意方法的 指令集的機器的圖形表示。
【具體實施方式】
[0021] 描述了用于對音頻信號的響度變化進行調平的系統及方法。在下面的描述中,為 了說明的目的,闡述了大量具體細節以提供對示例實施方式的透徹理解。然而,對本領域 技術人員來說顯見的是,可以在沒有這些具體細節的情況下或使用等同布置來實踐實施方 式。在一些情況下,以框圖的形式示出了公知的結構和裝置,以避免對實施方式的不必要的 混淆。
[0022] 現在參照附圖,在附圖中貫穿若干視圖相同的附圖標記指代相同的或相應的部 分,圖1是示出根據實施方式的用于實時地對響度變化進行調平的系統的示意功能框圖。 將音頻信號110和音頻信號的期望響度140輸入到短期響度調平模塊120中。短期響度調 平模塊120調整音頻信號110以使聽覺調平偽聲如"抽氣效應"和"喘息效應"最小化。短 期響度調平模塊120可以通過美國專利申請公開No. 2007/0092089A1中所描述的方法來實 現該調整,在此通過引用將其全部內容合并到本文中。
[0023] 在一種實施方式中,短期響度調平模塊120對數字脈沖編碼調制("PCM")音頻的 5毫秒的時間間隔即5毫秒周期進行操作。在另一實施方式中,如在模擬系統中,短期響度 調平模塊120連續地進行操作。在又一實施方式中,短期響度調平模塊120對數字系統中 的每個PCM采樣進行操作。
[0024] 短期響度調平模塊120也采用音頻信號的期望響度140作為輸入。在音頻信號是 PCM信號的數字系統中,以相對于全尺度PCM的分貝(dB)為單位表示期望響度140。例如, 期望響度140可以是_24dB FS (全尺度)。
[0025] 然后,將由短期響度調平模塊120處理的音頻信號傳遞至長期響度調平模塊130。 長期響度調平模塊130根據所選擇的客觀響度測量標準例如ITU-R BS. 1770-3(08/2012) 來測量音頻信號的實際響度。長期響度調平模塊130每個周期,S卩,每當測量音頻信號的實 際響度時輸出單個響度數。響度數表示音頻信號的實際響度。在音頻信號是PCM信號的數 字系統中,以相對于全尺度PCM的分貝(dB)為單位表示響度數。
[0026] 在一種實施方式中,將長期響度調平模塊130設置為標稱積分時間,例如30秒。該 積分時間是長期響度調平模塊130用來計算單個響度數的PCM采樣的時間間隔。該功能可 以比積分時間間隔更頻繁地操作;然而,每當操作時,它輸出這樣的數:該數表示其接收到 的最后一個"積分時間間隔"PCM采樣上的測量。
[0027] 在一種實施方式中,長期響度調平模塊130以與短期響度調平模塊120相同的速 度例如每5毫秒進行操作。在其他實施方式中,長期響度調平模塊130以比短期響度調平 模塊120更慢或更快的速度進行操作。例如,長期響度調平模塊130可以每20毫秒進行操 作,或者短期響度調平模塊120每執行其功能4次長期響度調平模塊130操作1次。
[0028] 在一種實施方式中,長期響度調平模塊130可以包括以下操作方式:僅當通常表 示0. 5秒的時間間隔的PCM采樣的塊由ITU-R BS. 1770-1(2006-2007)(在此通過引用將其 全部內容合并到本申請中)中所描述的算法分類為"會話"時才發生PCM采樣的積分(以 計算單個響度數)。該方法僅選通對音頻信號的會話部分的響度測量。或者,對于實現對響 度測量和控制的監管要求的地理區域(例如,荷蘭、德國、奧地利、法國),長期響度調平模 塊 130 可以以單獨遵守 ITU-R BS. 1770-2(03/2011)或者 ITU-R BS. 1770-3(08/2012)(其 指定基于水平的選通技術,并且在此通過引用將它們的全部內容合并到本文中)的模式來 操作。
[0029] 響度到增益模塊150獲得響度數并且將它與期望響度140比較。具體地,響度到 增益模塊150計算期望響度140與響度數之間的差,并且輸出增益值。被音頻修改模塊170 施加于所調平的音頻以產生經修改的音頻信號190的該增益使經調平的音頻信號的長期 測量更接近期望響度140。
[0030] 增益值的計算包括一些速率限制以防止增益值變化太快和引起聽覺偽聲。當處理 開始并且長期響度調平模塊130還未接收足夠的音頻采樣以輸出相應的響度數時,這尤為 重要。在一種實施方式中,響度到增益模塊150以與長期響度調平模塊130相同的速度例 如20毫秒進行操作,并且在每20毫秒計算的每個增益值之間線性內插施加于經調平的音 頻信號的實際增益值。
[0031] 可以根據以下等式來計算增益值(用分貝)。
[0032] D=期望響度-響度數(以dB為單位)[1]
[0033]
【權利要求】
1. 一種對音頻信號的響度變化進行調平的方法,所述方法包括: 接收所述音頻信號以及所述音頻信號的期望響度; 消除所述音頻信號中的偽聲; 測量所述音頻信號的實際響度; 使用所述音頻信號的所述期望響度與所述實際響度之間的差來計算增益值;以及 使用所述增益值來修改所述音頻信號。
2. 根據權利要求1所述的方法,其中,所述音頻信號是脈沖編碼調制(PCM)信號。
3. 根據權利要求1所述的方法,其中,根據客觀響度測量標準來測量所述音頻信號的 所述實際響度。
4. 根據權利要求1所述的方法,其中,當所述音頻信號僅包括會話時測量所述音頻信 號的所述實際響度。
5. 根據權利要求1所述的方法,其中,間隔地測量所述音頻信號的所述實際響度。
6. 根據權利要求1所述的方法,還包括: 存儲所述音頻信號, 其中,跨整個所述音頻信號地測量所述音頻信號的所述實際響度。
7. 根據權利要求1所述的方法,還包括: 在消除所述音頻信號中的偽聲之前,將所述音頻信號調整為具有與所述期望響度相等 的平均響度。
8. 根據權利要求1所述的方法,還包括: 在消除所述音頻信號中的偽聲之前,將與所述音頻信號的所述期望響度和平均響度之 間的差相當的固定增益施加于所述音頻信號。
9. 一種對音頻信號的響度變化進行調平的系統,所述系統包括: 短期響度調平模塊,被配置成:接收所述音頻信號以及所述音頻信號的期望響度,并且 消除所述音頻信號中的偽聲; 長期響度調平模塊,被配置成:測量所述音頻信號的實際響度; 響度到增益模塊,被配置成:使用所述音頻信號的所述期望響度與所述實際響度之間 的差來計算增益值;以及 音頻修改模塊,被配置成:使用所述增益值來修改所述音頻信號。
10. 根據權利要求9所述的系統,其中,所述短期響度調平模塊、所述長期響度調平模 塊、所述響度到增益模塊和所述音頻修改模塊中的至少之一被包括在處理器中。
11. 根據權利要求9所述的系統,其中,所述音頻信號是脈沖編碼調制(PCM)信號。
12. 根據權利要求9所述的系統,其中,所述長期響度調平模塊被配置成根據客觀響度 測量標準來測量所述音頻信號的所述實際響度。
13. 根據權利要求9所述的系統,其中,所述長期響度調平模塊被配置成當所述音頻信 號僅包括會話時測量所述音頻信號的所述實際響度。
14. 根據權利要求9所述的系統,其中,所述長期響度調平模塊被配置成間隔地測量所 述音頻信號的所述實際響度。
15. 根據權利要求9所述的系統,還包括: 存儲器, 其中,所述長期響度調平模塊被配置成跨整個所述音頻信號地測量所述音頻信號的所 述實際響度。
16. 根據權利要求9所述的系統,還包括: 響度到基準水平模塊,被配置成將與所述音頻信號的所述期望響度和平均響度之間的 差相當的固定增益施加于所述音頻信號。
17. -種嵌入有計算機可執行指令的計算機可讀介質,所述計算機可執行指令用于執 行以下步驟: 接收所述音頻信號以及所述音頻信號的期望響度; 消除所述音頻信號中的偽聲; 測量所述音頻信號的實際響度; 使用所述音頻信號的所述期望響度與所述實際響度之間的差來計算增益值;以及 使用所述增益值來修改所述音頻信號。
18. 根據權利要求17所述的計算機可讀介質,其中,所述音頻信號是脈沖編碼調制 (PCM)信號。
19. 根據權利要求17所述的計算機可讀介質,其中,根據客觀響度測量標準來測量所 述音頻信號的所述實際響度。
20. 根據權利要求17所述的計算機可讀介質,其中,當所述音頻信號僅包括會話時測 量所述音頻信號的所述實際響度。
21. 根據權利要求17所述的計算機可讀介質,其中,間隔地測量所述音頻信號的所述 實際響度。
22. 根據權利要求17所述的計算機可讀介質,還包括: 存儲所述音頻信號, 其中,跨整個所述音頻信號地測量所述音頻信號的所述實際響度。
23. 根據權利要求17所述的計算機可讀介質,還包括: 在消除所述音頻信號中的偽聲之前,將所述音頻信號調整為具有與所述期望響度相等 的平均響度。
24. 根據權利要求17所述的計算機可讀介質,還包括: 在消除所述音頻信號中的偽聲之前,將與所述音頻信號的所述期望響度和平均響度之 間的差相當的固定增益施加于所述音頻信號。
【文檔編號】H03G7/00GK104221284SQ201380019366
【公開日】2014年12月17日 申請日期:2013年4月2日 優先權日:2012年4月12日
【發明者】安德魯·P·賴利, 邁克爾·史密瑟斯, 杰弗里·里德米勒 申請人:杜比實驗室特許公司