專利名稱:正常化音頻錄音的響度的制作方法
技術領域:
本發明一般涉及音頻重放,并且具體地說,涉及基于錄音響度 補償各個錄音的重放增益。
背景技術:
給定錄音的響度影響其感覺到的重放響度。因此,對于同一重 放音量設置,聽眾可能感覺到一個錄音比另一錄音較響或較靜。重 放響度中的這些結果差別在某些環境中可能特別有問題。
例如,現在蜂窩手機用戶普遍下載定制鈴聲到他們的手機。隨 著定制鈴聲的迅速增多,手機用戶可更改鈴聲以滿足其變化的喜 惡,并可將不同的鈴聲分配給不同的呼叫者。然而,不同鈴聲文件 的特征響度會有很大的不同,這使得對于相同的振鈴器音量設置, 在不同的鈴聲之間感覺到的振鈴器響度有不適宜的變化。
由錄音響度變化引起的類似問題出現在語音郵件系統等等中。 在此類系統中,由于各個存儲的消息的特征響度存在差別,因此對 于相同的重放音量設置,不同消息之間感覺到的重放響度不同。
當然,由于各個錄音響度變化產生的重放音量問題并不限于上 述兩個環境。錄音響度的變化出現在許多環境中。例如在音樂越來 越多地以數字格式存儲、銷售和傳送時,已收集了在其特征響度上 可能極不同的一批^t字音樂文件的用戶可能遇到相同的重放問題。
發明內容
本發明包括一種正常化例如可能為數字音頻文件的一個或多個 存儲的錄音重放響度的方法和設備。每個此類文件經處理以基于錄 音的響度確定增益控制參數。作為非限制性示例,給定錄音的響度可通過進行其幅度值的RMS測量而確定。具有高響度測量的錄音 的增益控制參數將減小給定音量設置的有效重放增益。相反,具有 低響度測量的錄音的增益控制參數將增大給定音量設置的有效重放 增益。這樣,可使用對應存儲的增益控制參數,正常化對于給定重 放音量設置的不同錄音的感覺到的重放響度。
因此,在示范實施例中,本發明包括處理錄音以改進重放的方 法。該方法包括分析存儲的錄音以確定其響度,基于響度確定錄 音的增益控制參數,以及存儲增益控制參數以便在隨后錄音重放期 間設置重放增益。為多個錄音確定的增益控制參數可單獨存儲,如 在單獨的數據文件或條目中,或者嵌入錄音本身中,或者共同存儲 在具有多個條目的數據結構中。在任一情況下,在選擇重放給定錄 音時,也可以從存儲器中檢索對應的增益控制參數,以用于正常化 錄音的重放響度。
支持上述方法或其變型的示范設備包括一個或多個處理電路, 這些電路配置為處理存儲的錄音以確定其響度,基于響度確定錄音 的增益控制參數,以及存儲增益控制參數以便在隨后錄音重放期間 設置重放增益。 一個或多個處理電路可在功能上布置成配置為確定 錄音響度的響度確定電路和配置為基于響度確定增益控制參數的增 益控制參數計算電路。
然而,由于本發明可實施為硬件、軟件或其任意組合,因此在 其實現方面存在極大的靈活性。例如,本發明的重放響度正常化方 法可總體或部分實現為存儲的程序指令,用于由通用或專用微處理 器或其它數字處理電路執行。
在可使用本發明的應用方面,也存在極大的靈活性。在一個示 范實施例中,諸如移動臺、尋呼機、便攜式數字助理(PDA)等便攜 式通信裝置配置為正常化所存儲鈴聲的重放響度。換而言之,對于 給定振鈴器音量設置,本發明的操作消除(或至少減少)了不同鈴聲 感覺到的響度方面可能不適宜的變化。此類操作在用戶的通信裝置
配置為對于不同的呼叫者ID等使用不同的鈴聲時特別有用。
在另 一示范實施例中,基于網絡的語音郵件服務器使用本發明 的方法正常化存儲的語音郵件消息的重放響度。因此,在向給定網 絡用戶重放存儲的語音郵件消息之前,服務器可確定(和存儲)每個 消息的增益控制參數,并然后使用該參數設置消息的重放增益。用 此方案,通過使用增益控制參數補償了語音郵件消息響度可能廣大 的變化,并且用戶因此在重放其存儲的語音郵件消息時享受較統一 的消息響度。注意,在傳輸到用戶之前(或期間),諸如通過縮放或 偏移包括存儲的消息的幅度值,可在網絡中進行響度正常化。也可 基于例如從網絡接收縮放信息而在用戶的裝置上進行補償。
本發明具有除鈴聲和語音郵件響度正常化以外的廣泛適用性。 其響度正常化處理例如可應用到包括數字音頻文件的數字音樂庫, 這些數字音頻文件可能從不同的源獲得,并可能受錄制響度廣大變 化的影響。因此,在個人計算機(PC)上或可經因特網訪問的數字媒 體服務器上的音樂播放器軟件可配置為生成(和存儲)各個音頻文件 的增益控制參數,以使正常化每個文件的重放響度。在服務器應用 中,正常化可由服務器執行,并且正常化的文件數據可以流式傳輸 或傳送,或者服務器可以流式傳輸或傳送原始文件數據,但另外發 送對應的增益控制參數。在該后一情況中,接收重放裝置或系統可 使用接收的增益控制參數正常化原始文件數據。
當然,本發明并不限于上述特性和優點。本領域技術人員在閱 讀以下詳細說明并查看附圖后將認識到本發明的附加特性和優點。
圖1示出根據本發明一個或多個實施例配置為執行重放響度正 常化的示范裝置或系統10。
圖2示出可實施在圖l設備中的示范增益控制參數確定。
圖3示出還包括重放處理器和音頻重放電路的裝置或系統10
的另一圖示。
圖4示出可實施在圖3設備中的示范重放響度正常化圖示。
圖5示出另外的示范重放響度正常化處理詳情圖示。
圖6示出另外的示范重放響度正常化處理詳情的另 一圖示。
圖7示出根據本發明 一個或多個實施例配置的示范裝置。
圖8示出根據本發明一個或多個實施例配置的示范移動臺例如
蜂窩無線電話手機。
圖9示出包括根據本發明一個或多個實施例配置的語音郵件服
務器的無線通信網絡。
具體實施例方式
在轉到附圖前,按照本發明基礎增益補償過程組織本發明可能 是有幫助的。本發明提供一種方法和設備,由此處理一個或多個存 儲的錄音以確定其響度。基于錄音的響度,為每個此類處理過的錄 音確定增益補償參數,并且存儲該增益補償參數。在選擇重放給定 錄音時,使用對應的增益補償參數固定用于播放錄音的重放增益, 這正常化了錄音的重放響度。也就是說,通過根據錄音的對應增益 補償參數補償用于每個錄音的重放增益,錄音響度極不相同的兩個 不同錄音的重放響度可變得基本相同。
有上述方法在頭腦中,圖1從功能上示出包括響度處理器12 和補償計算器14的至少部分音頻處理裝置或系統10。系統10還包 括配置為存儲一個或多個錄音的存儲系統16,或與該存儲系統相關 聯。響度處理器12又配置為從存儲系統16(直接或間接)獲得存儲 的錄音,并處理該錄音以確定其響度。測量的響度然后由補償計算 器14用于確定對應的增益補償參數,該參數被存儲以便在隨后錄 音重放期間用于設置重放增益。
圖2示出概括此增益補償方法的示范處理邏輯。此類處理邏輯 可以用硬件、軟件或其任意組合的形式實現。在一個實施例中,系 統10的處理邏輯實現為由微處理器執行的計算機程序指令等等。
此類指令可實現為軟件、固件或微代碼。在其它實施例中,處理邏
輯在諸如專用集成電路(ASIC)、現場可編程門陣列(FPGA)、復雜可 編程邏輯器件(CPLD)等硬件中實現。無論如何,硬件、軟件或其某 組合的某類型處理電路可用于實現本發明。
無論具體實現細節如何,處理開始于處理給定存儲的錄音以確 定其響度(步驟100)。用由此確定的錄音響度的測量,處理繼續確 定對應的增益控制參數(步驟102)。增益控制參數可根據與錄音響 度的相反關系確定,例如1/x關系,其中響度值越大,增益控制參 數越小。當然,增益控制參數可以為響度值或其某個直接倍數,因 為相關聯的音頻重放系統的音量(增益)控制布置的本質很大程度上 確定了增益控制參數的最適合形式。
然而,增益補償參數被確定,并且無論它設為縮放因子還是設 為dB偏移值,示范處理都繼續增益控制參數的存儲(步驟104)。此 類存儲可包括將增益控制參數寫入存儲系統16中包含的文件或其 它數據結構,或者可包括將增益控制參數附加或以其它方式集成到 錄音中。此后一方案可能對于其中具有可用的額外數據字段和/或添 加或更改文件標題信息的能力的數字音頻文件特別有吸引力。
用由此確定和存儲的增益控制,圖3從功能上示出了重放處理 器18和相關聯的音頻輸出電路20,該電路20包括增益控制電路22、 模數變換器24、音頻放大器26以及音頻輸出換能器(揚聲器)28。 重放處理器18直接或間接從存儲系統16存取選擇的錄音以便重 放,并使用錄音的對應存儲的增益控制參數經增益控制電路22設 置重放增益。還要注意的是,增益控制電路22也可響應重放音量 控制輸入,使得總增益設為增益補償參數和音量設置的函數。
在圖3的環境中,基于響度的增益控制補償發生在數字域,在 源錄音為數字音頻文件時,這會是一個方便的方案。因此,增益控 制電路22可隨增益控制參數值而變,有效地將音量控制輸入所確
定的其額定增益上調或下調。該調整可基于將偏移值加上或減去錄 音的數字(幅度)值,或者通過凄欠學方式將那些值放大或縮小。如果 相對于錄音的"滿刻度,,值計算增益控制參數,則增益調整將固有地 適合聲音文件的(數字)幅度范圍。還要注意的是,增益補償參數為 錄音重放而固定的增益設置可設為與當前選擇的音量設置固定的增 益設置分開。這種情況下,兩個增益控制電路可串聯放置,例如, 一個電路由增益控制參數控制, 一個電路由音量控制輸入控制。
本領域的技術人員將理解,所關注的錄音可以模擬格式諸如存 儲在帶上等,這種情況下,對應的增益補償值可在模擬或數字域中 確定。類似地,重放增益設置步驟可在數字或模擬域中進行。作為 非限制性示例,增益補償參數可在模擬域中確定,變換為數字值以 方便存儲,然后在對應的錄音重放期間在數字域中或在數模變換后 在模擬域中應用。從廣義上說,本發明因此考慮了其示范響度正常 化方法的所有數字、所有模擬和混合的模擬/數字實現。
圖4所示的示范處理邏輯可用于實現實施在圖3電路的功能。 在此環境中,處理開始于選擇存儲的錄音(步驟106)。選擇可能在 臨時緩沖器和/或永久性、非易失性存儲器中的特定錄音可由用戶輸 入或某一其它選擇機制,諸如蜂窩手機或其它類型無線通信裝置的 鈴聲選擇和重放邏輯觸發。
在選擇或至少標識特定錄音后,處理邏輯獲得對應于所選擇錄 音的存儲的增益控制參數(步驟108)。增益控制參數可與錄音存儲 在同一存儲器中,或者存儲在不同的存儲器中。此外,增益控制參 數可存儲在單個文件中,該文件例如按文件名或者按將存儲的增益 控制參數與其對應的存儲的錄音邏輯相關聯的某一其它機制鏈接到 錄音。或者,多個增益控制參數可一起存儲在可按錄音標識符索引 的公共數據結構中,例如列表或表項中。作為另一備選,增益控制 參數可存儲在錄音本身中,但此后一方案對于具有允許附加或添加 信息的文件類型的錄音最有利,該信息例如是可填充定制信息的可 變長度標題或數據字段。
無論如何存儲和檢索,示范處理都繼續基于增益控制參數設置 重放增益 一 例如增大或減小重放信號鏈中的數字或模擬增益(步 驟110)。作為一個簡單的示例,可以想象,所述的裝置在范圍從1
到10的音量刻度上具有為"5"的當前音量控制設置。在不受益于本
發明的情況下,重放在當前音量設置具有高錄音響度的錄音可能產 生不適宜的高重放音量。相反,如果選擇的錄音具有低錄音響度, 則在當前音量設置的重放可能產生不適宜的低重放音量。通過基于 其各個錄音響度為各個錄音調整重放增益的本發明操作,對于給定 的當前音量設置正常化了不同錄音的重放音量。
增益控制參數(也稱為"GCP")的生成和該參數用于為特定錄音 的重放固定重放增益設置可自動執行。圖5示出示范處理,其中增 益控制參數從儲存器檢索或根據需要"快速"生成。注意,快速生成 可以錄音的額定重放速率或以加速速率實時執行。以可能為重放速 率許多倍的速率加速處理意味著可在例如幾毫秒內確定增益控制參 數,并在假設有足夠的計算能力的情況下是優選的方案。如果由于 GCP生成而在開始重放前發生任何明顯的延遲,則所述的裝置可配 置為向其用戶提供某一類型的指示,即可聽和/或可看的延遲通知。
因此,示范處理開始于選擇要重放的錄音(步驟120)。再者, 此類選擇可基于直接或間接的用戶輸入,或者基于某一其它過程, 諸如振鈴事件過程、歌曲播放列表過程等。處理邏輯確定增益控制 參數是否可用于選擇的錄音(步驟122)。如果是這樣,則處理繼續 基于增益控制參數的值和當前音量設置來設置重放增益(步驟124)。 那可以這樣進行將第一增益設為隨增益控制參數而變,并將第二 增益設為隨音量設置而變,或者將復合增益設為隨增益控制參數的 值和當前音量設置的組合而變。,
處理繼續以補償的重放增益設置重放錄音,例如輸出為另 一裝 置或系統的可聽信號和/或源信號。注意,如果在步驟122無增益控
制參數可用于選擇的錄音,則示范處理邏輯電路處理錄音以確定適
當的增益控制參數(步驟128),保存該參數(步驟130),并如針對步 驟124和126概括的那樣用于重放增益補償。
在尋求為存儲的錄音自動確定增益補償參數的其它方法方面, 圖6示出處理邏輯,其中響應于將錄音接收到臨時(或永久性)存儲 器中而進行增益補償參數的確定。因此,處理開始于裝置接收/下載 錄音(步驟140),其可包括蜂窩手機、尋呼機、音樂播放器等,經 本地接口端口從支持的通信網絡經無線或有線傳送或從主機裝置 (PC)接收數字音頻文件。
在收到錄音時,處理繼續分析錄音以確定其響度(步驟142)。 處理然后轉為基于所確定的錄音響度確定適當的增益控制補償參數 值(步驟144)。該增益控制參^:然后被存儲,以便用于固定在隨后 錄音重放期間使用的重放增益(步驟146)。注意,如果裝置的處理 能力足夠強大,則響應于接收新錄音而自動確定增益控制參數可以 對裝置用戶透明的方式完成,即在正常裝置處理中無可覺察的中 斷,并在新接收錄音的重放可用性方面無可覺察的延遲。當然,如 果有任何可能的明顯延遲,則裝置可配置為向用戶提供某一通知。
相對于可實施本發明的裝置,圖7示出裝置10可實現為示范 裝置(或系統)30,它包括重放處理電路32、 一個或多個存儲器電路 34和可選的音頻輸出電路36。這種情況下,重放處理電^各32包含 對裝置10所示的一個或多個處理電路12和14的功能。存儲器電 路34可包括不同的存儲器裝置,并可包括不同類型的存儲器,例 如供暫時使用和臨時數據緩沖的隨機存取存儲器(RAM)、供存儲程 序數據、包括實現本發明的響度正常化處理的程序指令的只讀存儲 器(ROM)、以及非易失性RAM (NVRAM)、電可擦除可編程ROM (EEPROM)、閃存等。
無論使用的特定類型存儲器如何,重放處理電路32都可包括 存儲接口電路40,用以對一個或多個類型的存儲器裝置讀寫,或對
接到可存取此類裝置的其它處理電路。重放處理電路32還可包括 可操作以將存儲的錄音解碼和/或解壓縮的重放解碼器42。作為非 限制性示例,任一包括的解碼器42可配置為處理一個或多個專有 和/或標準化錄音格式。因此,解碼器42可配置為處理MPEG第3 層(MP3)lt字音頻文件、WINDOWS々某體音頻(WMA)數字音頻文 件、自適應變換聲編碼(ATRAC)數字音頻文件、高級音頻編碼(AAC) 數字音頻文件等。裝置30因此可根據需要或要求配置為對各種數 字音頻文件類型中的任一或多個執行其示范響度正常化。
根據本發明的響度正常化代表一種高級的解決方案,例如與更 改原始編碼音頻文件的增益相比。具體而言,更改音頻文件的原始 編碼增益需要解碼和重新編碼。由于大多數音頻壓縮方案是有損 的,因此解碼和重新編碼過程引入了另外的量化噪聲和飽和失真。 與此相反,本發明的重放正常化不需要音頻文件重新編碼,并允許 同時應用重放響度正常化與用戶增益控制(音量控制)。
因此,在一個或多個實施例中,重放電路32包括配置為經硬 件、軟件或其某一組合確定存儲的錄音響度的響度確定電路44。在 此上下文中,術語"響度"應具有廣義的解釋。因此,響度確定電路 可配置為基于進行存儲的錄音的均方根(RMS)測量來確定存儲的錄 音的響度。在數字音頻文件中,數字化幅度值可經處理以生成給定 文件的RMS測量。類似地,響度確定電路44可配置為基于進行和 方根(RSS)測量來確定響度。再者,對于數字音頻文件,RSS測量 可基于文件中的數字化幅度值。當然,可根據需要或要求對模擬或 數字錄音在模擬域中進行RSS和/或RMS測量。在一個或多個其它 實施例中,存儲的錄音的響度通過標識錄音中的峰值電平和/或平均 電平而確定。對于每個錄音,這些測量最好參考用于錄音的"滿刻 度"值。
另外,任一上述響度測量方法可根據人耳感覺聲音的方式進行 調整。即使在同一重放音量,人耳也會感覺某些頻率范圍內的聲音比其它頻率范圍的聲音較響。更具體地說,較低和較高頻率聲音比
中間范圍頻率具有較低的感覺響度。因此,響度確定電路44可配
置為對存儲的錄音生成頻率加權響度測量,以便對應的增益控制參 數反映音質考慮事項。
這樣,用于正常化給定存儲的錄音重放響度的增益補償參數反 映該錄音的音質特征。給定錄音的增益控制參數可計算為比它們在 不管錄音的頻率特征而確定的情況下具有較少或較多的增益衰減。 簡單地說,頻率無關的增益控制參數計算一般將產生與頻率相關的 計算不同的值。基于音質模型計算增益控制參數 一 即頻率相關響 度確定 一 的額外復雜性可對鈴聲特別有益,這可包括短的重放時 間和相對窄的頻率范圍。
獲得了錄音響度的某個測量后,增益控制參數計算電路46確 定在固定錄音重放增益中使用的對應增益補償參數。在一些實施例 中,增益補償參數只是為錄音確定的響度值。如本文幾次提到的, 該值可以為RMS值、RSS值、峰值、峰值對平均值、平均值或其 它響度測量,并且任一或所有此類測量可進行或不進行頻率加權。 還要注意的是,在至少一個實施例中,增益補償參數實際上可包括 不止一個值。
在另 一實施例中,增益補償參數是從響度測量推導的所計算 值。因此,它可以是簡單的1/x關系,或者它可以基于較復雜的推 導。根據一種方法,增益補償參數是從響度測量確定的增益調整值, 該調整值可以是用乘法補償重^t增益的縮放因子,或者可以是經加 法或減法補償重放增益的偏移因子。無論如何,增益補償參數的范 圍和分辨率取決于音頻重放系統的實現細節。在任一情況下,增益 補償參數存儲在存儲器中以用于重放增益補償。
在執行該重放增益補償時,重放處理電路32可包括將增益補 償參數應用于(解碼的)錄音輸出的增益控制電路48。重放處理電路 32也可接收重放音量控制輸入,并因此可基于增益控制參數和當前
音量控制輸入值的組合設置錄音輸出信號的增益。例如,如果增益 補償參數應用為縮放因子JC,并且音量控制設置應用為縮放因子》 則組合的增益設置可表示為X 》當然,在基于偏移的補償中,音
量控制增益少可按增益補償參數x調整為j;±x。
如果從重放處理電路32略去增益控制電路48,則它可輸出增 益控制信號以及錄音輸出信號。這兩個信號可提供到音頻輸出電路 36,該電路可與重放處理電路在同一位置,或遠離重放處理電路。 在任一情況下,重放處理電路輸出的增益控制信號可以為音量和補 償增益的組合,或者可以只是補償增益,而音量控制輸入直接到音 頻輸出電路36。
如果音頻輸出電路36接收未補償的錄音輸出信號作為其輸 入,則它可包括增益控制電路50,該電路50配置為將增益補償參 數以及可選的音量增益設置應用于輸入信號。如果音頻輸出電路從 重放處理電路32接收增益補償的錄音輸出信號,則此類增益控制 可忽略。本領域的技術人員將理解,此類實現細節并不限制本發明 各方面,因此應理解此類細節可根據需要或要求而改變。
在任一情況下,示范音頻輸出電路36還包括數模變換器52, 該變換器將增益補償的錄音信號變換成模擬波形以便輸入放大器 54,模擬波形可以為立體聲或多通道波形。放大器54又輸出適用 于驅動諸如低阻抗揚聲器等音頻輸出換能器56的信號。還要注意 的是,在數字域中的處理可能只是在例如配置為播放數字音樂文件 的便攜式音樂播放器中的方便問題,但此類處理不是本發明的限制 方面。實際上,增益補償處理和錄音本身可以在(或變換到)模擬域。
此外,盡管應理解本發明的重放響度正常化方法可有利地應用 在重放存儲的錄音或管理此類錄音重放的基本上任何種類的裝置或 系統中,但本發明可在某些環境中具有特殊的優勢。例如,圖8示 出可實現為示范無線通信裝置60的設備10,裝置60可以為蜂窩無 線電話、無線尋呼機、具有通信能力的便攜式數字助理(PDA)等。
因此,其實現細節可隨其預期目的而變,但示范裝置60配置為對 裝置60存儲的至少一些錄音^l行本發明的重放響度正常化方法。
雖然并非所示的每個功能元件都與支持包括本發明的特定信號 處理有關,但示范裝置60包括發射/接收天線組件62、開關/雙工器 64、包括接收機66和發射機68的射頻(RF)收發信機、系統控制器 70、 一個或多個存儲器電路72、與主機系統76(例如PC)通信的主 機接口 74以及用戶接口 77。示范用戶接口 77包括顯示接口 78、 可能為具圖形能力的彩色LCD或其它屏幕類型的顯示器80、鍵盤 接口和鍵盤82以及音頻輸入/輸出子系統84。音頻子系統84可連 接到音頻輸入換能器86(例如麥克風)和音頻輸出換能器88(例如揚 聲器)。
可包括硬件、軟件或兩者的本發明可在系統控制器70中實現。 示范系統控制器70根據需要包括一個或多個微處理器和/或其它處 理電路以及支持電路。因此,系統控制器70可配置為操作為重放 處理電路32(包括電路12和14的功能),以通過例如數據總線從存 儲器電路72讀取錄音,處理錄音以確定其響度和對應的增益控制 參數,然后將增益控制參數寫入存儲器電路72供以后響應于選擇 重放該錄音而用于正常化錄音的重放響度。當然,增益控制參數可 快速確定用于選擇的錄音,并保持在工作存儲器中,用于所選擇錄 音的即時響度正常化。
在獲得錄音方面,裝置60可使用接收機66和發射機68,經 與支持的無線通信網絡的無線4言令"下載"錄音,和/或它可經主機接 口電路74從本地主機76下栽錄音。主機接口電路74可包括基本 上任一類型的本地通信接口電路。作為非限制性示例,主機接口電 路74可包括以下一項或多項通用串行總線(USB)接口 、 IEEE 1394(火線)接口 、紅外(例如IrDA)接口以及短距離無線電接口 (例如 藍牙、802.11等)。
還要注意的是,音頻子系統84可包括可配置為執行根據本發
明的示范重放響度正常化的微處理器或其它(可能是專用)處理電 路。實際上,本發明可使用相對合適的處理資源實現,并且實際上 使用不昂貴的可編程或定制邏輯電路實現。因此,本發明可在商業 上以預編程或預配置的集成電路器件的形式,實施為在指定微處理 器/微控制器核上執行的軟件,和/或實施為與用于設計集成電路的
電子設計自動化(EDA)工具類型一起使用的數字綜合文件。
圖9還不但在本發明的實現細節方面,而且在其應用方面證明 了本發明的靈活性。無線通信網絡卯包括一個或多個核心網絡(CN) 92 ,這些網絡例如可以為IS_95B 、 IS-2000或寬帶CDMA (WCDMA) 無線通信網絡形式的分組和/或電路交換核心網絡。特別關注的是, CN 92包括設備10的實現,配置作為存儲目標為網絡卯用戶的語 音郵件消息的語音郵件服務器系統93。
那些存儲的消息可通過無線電接入網絡(RAN) 94輸送到各個 移動臺96,移動臺例如可如圖8中裝置60所示配置。消息一般來 自多個源,諸如來自以通信方式連接到公共數據網絡98(例如因特 網)的各種不同種類的用戶設備,來自公共交換電話網絡(PSTN) 99 的用戶,以及來自網絡90的其它用戶。正如它們來自這些完全不 同的源,由語音郵件服務器93存儲的語音郵件消息一般具有各不 相同的響度級別。因此,在用戶移動臺96上重放多個消息會遭受 因消息不同而引起的響度上不適宜的變化。
如果各個消息被傳送到移動臺96,并保持在臨時緩沖器中以 便重放,則移動臺96可在播放該消息之前對每個消息執行重放響 度正常化。然而,如果消息流式傳輸到移動臺以便實時重放,則語 音郵件服務器93可將重放響度正常化作為其消息流式傳輸操作的 一部分執行。該處理可基于語音郵件服務器93接收輸入的語音郵 件消息,處理它們以確定響度補償參數,并存儲那些參數以用于重 放響度正常化。
響度正常化可基于在數據流式傳輸到用戶的移動臺96時將增
19
益補償應用于包括給定消息的數據。或者,它可基于在消息傳輸開
始時或開始前發射增益補償參^:到移動臺96,使得移動臺96使用 接收的增益補償參數執行消息的重放響度正常化。
本領域的技術人員將立即理解如前面所述的語音郵件響度正常 化以外和本文較早所述的鈴聲正常化以外的許多其它應用。例如, 語音郵件服務器93可從廣義上視為可通過網絡卯或更一般通過因 特網訪問的任一媒體服務器(例如流式傳輸媒體服務器)。因此,本 發明廣泛適用于任一類型存儲的錄音的重放響度正常化,并在諸如 蜂窩電話、尋呼機、PDA等便攜式通信裝置以及保持媒體文件以便 流式傳輸或傳送的PC、網絡服務器等中發現直接應用。因此,本 發明并不受以上論述限制,也不受附圖限制。而是,本發明只受隨 附權利要求書及其合理合法的等效物限制。
權利要求
1.一種處理錄音以改進重放的方法,包括處理存儲的錄音以確定其響度;基于所述響度為所述錄音確定增益控制參數;以及存儲所述增益控制參數以便在隨后所述錄音重放期間設置重放增益。
2. 如權利要求1所述的方法,其中存儲所述增益控制參數包 括將所述增益控制參數存儲為存儲的數據結構中的條目,所述數據 結構配置為保持對應于多個錄音的多個此類條目。
3. 如權利要求1所述的方法,其中存儲所述增益控制參數包 括將所述增益控制參數存儲為所述錄音的一部分。
4. 如權利要求1所述的方法,其中處理所述存儲的錄音以確 定其響度包括在通信網絡(90)的節點(93)處理存儲的語音郵件消 息,使得在隨后向所述通信網絡(90)的用戶重放所述語音郵件消息 期間所述增益控制參數啟動增益補償。
5. 如權利要求1所述的方法,其中處理所述存儲的錄音以確 定其響度包括在無線通信手機(60)處理存儲的鈴聲文件,使得在 隨后所述鈴聲文件重放期間所述增益控制參數啟動增益4卜償。
6. 如權利要求1所述的方法,其中所述錄音包括數字音頻文 件,并且其中處理所述存儲的錄音以確定其響度包括分析包括所述 數字音頻文件的數字值。
7. 如權利要求6所述的方法,其中分析包括所述數字音頻文 件的所述數字值包括基于所述數字值計算頻率加權的響度參數。
8. 如權利要求6所述的方法,其中分析包括所述數字音頻文 件的所述數字值包括基于所述數字值計算音質模擬參數。
9. 如權利要求6所述的方法,其中分析包括所述數字音頻文 件的所述數字值包括至少以下之一確定所述數字值的均方根值; 確定所述數字值的和方根值;以及確定所述數字值的峰值。
10. 如權利要求1所述的方法,其中處理所述存儲的錄音以確 定其響度包括至少以下之一確定所述錄音的均方根值;確定所述 錄音的和方根值;以及確定所述錄音的峰值。
11. 如權利要求1所述的方法,還包括至少部分基于所述增益 控制參數在所述錄音重放期間設置所述重放增益。
12. 如權利要求1所述的方法,其中至少部分基于所述增益控 制參數在所述錄音重放期間設置所迷重放增益包括基于所述增益 控制參數與重放音量設置的組合生成總重放增益值。
13. 如權利要求1所述的方法,還包括響應于將音頻數據接 收到本地存儲器中作為所迷錄音,自動執行以下步驟處理所述存 儲的錄音;確定所述增益補償參數;以及存儲所述增益補償參數。
14. 如權利要求1所述的方法,還包括響應于識別所述錄音 的第一次嘗試重放,自動執行以下步驟處理所述存儲的錄音;確 定所述增益補償參數;以及存儲所述增益補償參數。
15. —種用于改進錄音重放的設備(IO),包括一個或多個處理 電路(12, 14),配置為處理存儲的錄音以確定其響度; 基于所述響度為所述錄音確定增益控制參數;以及 存儲所述增益控制參數以便在隨后所述錄音重放期間設置重放 增益。
16. 如權利要求15所述的設備(IO),其中所述一個或多個處理 電路(12, 14, 18)還配置為提供所述錄音的重放處理,包括基于所 述存儲的增益控制參數的重放增益控制。
17. 如權利要求15所述的設備(IO),其中所述設備(10)包含包 括所述一個或多個處理電路(12, 14)的數字音頻重放電路(32),并 且其中所述數字音頻重放電路(32)配置為在與所述數字音頻重放電 路(32)相關聯的本地存儲器(34)中將數字音頻文件存儲為錄音,并根據所述設備(10)為各個所述^:字音頻文件單獨確定和存儲的增益 控制參數,重放所述數字音頻文件。
18. 如權利要求17所迷的設備(IO),其中所述設備(10)包括無 線通信裝置(60),所述裝置(60)包括所述數字音頻重放電路(32, 70), 所述電路(32, 70)配置為根據為所述裝置(60)存儲的鈴聲文件確定 的增益控制參數,控制所述存4諸的鈴聲文件的重放增益。
19. 如權利要求17所述的設備(IO),其中所述設備(10)包括數 字音樂播放器,所述播放器包^l舌所述數字音頻重放電路(32)。
20. 如權利要求15所述的設備(IO),其中所述設備(10)包括配 置為控制存儲的語音郵件錄音的重放增益的無線通信網絡(90)中的 處理節點(93)。
21. 如權利要求15所迷的設備(IO),其中所述一個或多個處理 電路(12, 14)包括響度確定電路(44),配置為確定所述錄音的響度;以及 增益控制參數計算電路(46),配置為基于所述響度確定所述增 益控制參數。
22. 如權利要求21所述的設備(IO),其中所述一個或多個處理 電路(12, 14)還包括接口電路(40),所述接口電路配置為對接一個 或多個相關聯的存儲器電路(34),以便將所述增益控制參數寫入存 儲器(34),并從存儲器(34)讀取所述增益控制參數。
23. 如權利要求21所述的設備(IO),還包括增益控制電路(48), 所述增益控制電路配置為至少部分基于所述增益控制參數,為所述 錄音設置所述重放增益。
24. 如權利要求21所述的設備(IO),還包括重放處理電路(18, 32),所述重放處理電路配置為控制所述錄音的重放,并至少部分 基于所述增益控制參數為所述重放設置所述重放增益。
25. 如權利要求21所述的設備(10),其中所述響度確定電路(44) 包括以下之一均方根計算電路,配置為計算所述錄音的均方根值;和方根計算電路,配置為計算所述錄音的和方根值;峰值檢測電路, 配置為檢測所述錄音的峰值;以及錄音電平檢測電路,配置為檢測 所述錄音的錄音電平。
26. 如權利要求15所述的設備(IO),其中所述一個或多個處理 電路(12, 14)配置為將所述錄音的響度確定為頻率加權的響度參數。
27. 如權利要求15所述的設備(IO),其中所述一個或多個處理 電路(12, 14)配置為將所述錄音的響度計算為音質模擬參數。
28. 如權利要求15所述的設備(IO),其中所述一個或多個處理 電路(12, 14)配置為通過至少以下之一計算所述錄音的響度確定 所述錄音的均方根值;確定所述錄音的和方根值;以及確定所述錄 音的峰值。
29. —種正常化所存儲錄音的重放響度的方法,包括 在所述錄音重放之前處理它以確定所述錄音的響度值;以及 通過基于從所述錄音的所述響度值確定的增益補償參數設置用于重放所述錄音的重放增益,來正常化所述錄音的重放響度。
30. 如權利要求29所述的方法,還包括在存儲器(16, 34, 72) 中存儲所述增益補償參數,并響應于所述錄音被選擇重放而從存儲 器(16, 34, 72)檢索所述增益補償。
31. —種可操作以正常化數字音頻文件重放響度的裝置(30), 所述裝置(30)包括存儲器電路(34),配置為存儲數字音頻文件;以及 重放處理電路(32),配置為基于分析所述數字音頻文件的響度 來確定和存儲所述數字音頻文件的增益控制參數,并配置為通過使 用所述增益控制參數設置用于插-放所述數字音頻文件的重放增益來 正常化所述數字音頻文件的所述重放響度。
32. 如權利要求31所述的裝置(30),其中所述裝置(30)包括無 線通信裝置(60),所述無線通信裝置配置成為一個或多個存儲的鈴 聲文件中的每個文件確定和存儲增益控制參數,并且其中所述重放處理電路(32)基于對應的增益控制參數,對于給定振鈴器音量設置 正常化當前選擇的鈴聲文件的重放響度。
33. 如權利要求32所述的裝置(30),其中所述無線通信裝置(60) 配置為響應于在下載操作中接收所述鈴聲文件,為給定鈴聲文件確 定和存儲增益控制參數。
34. —種可操作以正常化所存儲語音郵件消息重放響度的語音 郵件系統(93),所述系統包括存儲器電路,配置為存儲語音郵件消息;以及 重放處理電路,配置為基于分析所述語音郵件消息的響度確定 和存儲所述語音郵件消息的增益控制參數,并配置為通過使用所述 增益控制參數設置用于播放所述語音郵件消息的重放增益來正常化 所述語音郵件消息的所述重放響度。
35. 如權利要求34所述的語音郵件系統(93),其中所述語音郵 件系統包括通信網絡(90)中的處理節點(93),所述處理節點(93)包括 配置成為所述通信網絡的用戶存儲語音郵件消息的一個或多個存儲 器電路,并包括配置作為所述重放處理電路的一個或多個數字邏輯 電路。
全文摘要
一種方法和設備正常化存儲的錄音的重放響度,以避免在相同音量設置中不同錄音之間在感覺到的響度方面不適宜的變化。在示范處理方法中,存儲的錄音經處理以確定其響度。該響度或從中推導的某個值然后用于設置重放增益,該增益用于重放錄音。因此,對于給定音量設置,可對較響的錄音將重放增益設得較低,而對較靜的錄音將其設得較高。在一個或多個示范實施例中,錄音在接收時或至少在其首次重放前某個時間被處理,以便可為它們計算和存儲基于響度的增益補償參數。然后,響應于選擇用于重放的特定錄音,可選擇和使用對應存儲的增益控制參數。
文檔編號H03G3/30GK101099209SQ200580046394
公開日2008年1月2日 申請日期2005年7月22日 優先權日2004年11月16日
發明者E·D·羅姆斯伯格, W·C·伊頓 申請人:索尼愛立信移動通訊股份有限公司