本公開涉及用于頭盔中的聲音再現和有源噪聲控制的系統和方法(一般稱作“系統”)。
背景技術:
遺憾的是,摩托車手的聽力尤其會受到發動機噪聲、風噪聲和頭盔設計的阻礙。諸如摩托車手體驗到的這些高噪聲級可使得在頭盔中收聽音樂或談話不舒服或甚至不可能。此外,相應地要求高強度的語音和音樂信號來滿足收聽體驗的高強度噪聲可對摩托車手的聽力能力具有長期后果。影響摩托車手的噪聲可具有許多源頭,諸如發動機噪聲、道路噪聲、其它車輛噪聲和風噪聲。隨著摩托車的速度增加,通常來說最突出的噪聲源是風噪聲。該效果隨著速度增加而急劇增加。在公路行駛速度下,穿戴傳統頭盔時的噪聲級可容易地超100db。這對于諸如警察等日常摩托車手以及職業摩托車手特別麻煩。為了對抗噪聲,一些摩托車頭盔環繞耳朵區域使用隔音材料。其他摩托車手可選擇使用耳塞來降低噪聲以及防止噪聲誘發的聽力損傷。降低噪聲的另一種方法是嵌入式有源噪聲消除系統,然而所述系統可對語音或音樂具有破壞效果。
技術實現要素:
示例性聲音再現降噪系統包括:頭盔;安置在頭盔中相對位置處的兩個揚聲器;以及安置在所述兩個揚聲器附近的位置處的兩個麥克風。系統還包括耦接至兩個揚聲器的兩個有源噪聲控制模塊。有源噪聲控制模塊被配置來向對應揚聲器供應有用信號,其表示將被再現的聲音,和抗噪信號,其在由對應揚聲器再現時,降低在對應麥克風附近的噪聲。系統還包括連接至有源噪聲控制模塊的上游的音頻信號增強模塊,所述音頻信號增強模塊被配置來接收音頻輸入信號以及對音頻輸入信號進行處理以提供有用信號,以使得所述有用信號為穿戴頭盔的收聽者提供比音頻輸入信號更加逼真的聲音印象。
示例性聲音再現降噪方法包括向對應揚聲器供應有用信號,其表示將被再現的聲音,和抗噪信號,其在由對應揚聲器再現時,降低在對應麥克風附近的噪聲。所述方法還包括接收音頻輸入信號以及對音頻輸入信號進行處理以提供有用信號,以使得所述有用信號為穿戴頭盔的收聽者提供比音頻輸入信號更加逼真的聲音印象。
本領域技術人員將在查閱以下附圖和詳細描述之后了解或更加明白其它系統、方法、特征和優點。
附圖說明
參考以下附圖和描述可更好地理解所述系統。附圖中的組件不一定按比例繪制,而是著重說明本發明的原理。此外,在附圖中,相同參考數字指定全部不同視圖中的對應部分。
圖1是具有有源噪聲控制系統的摩托車頭盔的透視圖;
圖2是說明圖1中示出的頭盔中的信號流的信號流程圖;
圖3是一般反饋型有源降噪系統的信號流程圖,在所述系統中有用信號被供應至揚聲器信號路徑;
圖4是一般反饋型有源降噪系統的信號流程圖,在所述系統中有用信號被供應至麥克風信號路徑;
圖5是一般反饋型有源降噪系統的信號流程圖,在所述系統中有用信號被供應至揚聲器和麥克風信號路徑;
圖6是圖5的有源降噪系統的信號流程圖,在所述系統中有用信號經由頻譜整形濾波器供應至揚聲器路徑。
圖7是圖5的有源降噪系統的信號流程圖,在所述系統中有用信號經由頻譜整形濾波器供應至麥克風路徑;
圖8是圖7的有源降噪系統的信號流程圖,在所述系統中有用信號經由兩個頻譜整形濾波器供應至麥克風路徑;
圖9是圖示具有直達路徑和交叉路徑的立體聲展寬的一般結構的信號流程圖;
圖10示出圖示直達路徑中的濾波器的適當響應特征的實例的幅值頻率圖,以及圖示交叉路徑中的過濾器的適當響應特征的實例的幅值頻率圖;
圖11是包括結合感知音頻編碼器和解碼器一起使用的示例性信號增強器的信號流程圖;
圖12是包括集成到信號增強器中的感知音頻解碼器的實例的信號流程圖;
圖13是信號增強器系統的實例的信號流程圖;并且
圖14是多通道聲音分級模塊的實例的信號流程圖。
具體實施方式
示例性頭盔可包括若干層,所述若干層包括外殼、減震層和舒適層。頭盔的外殼是最外層,并且通常由諸如塑料和纖維復合材料等彈性、防水材料制成。頭盔的減震層是其主要安全層,可由諸如可膨脹聚苯乙烯泡沫等剛性但減震的材料制成。另外,該層可具有隔音和隔熱品質,并且可替代地可被稱作聲學層。最后,頭盔的舒適層可由將會與摩托車手的皮膚接觸的軟材料制成,所述軟材料諸如本領域中已知的棉或其它混紡織物。也可存在其它層,并且上面提及的層中的一些可能被省略或組合。
圖1是摩托車頭盔100的透視圖。頭盔100包括外部外殼101、聲學層102、泡沫層103、舒適層104和任選地無源降噪系統(未圖示)。頭盔100還包括安裝在頭盔100的每一內側上的耳杯105和106,當使用者穿戴頭盔100時使用者的耳朵將位于所述耳杯105和106處。在圖1中應注意的是,僅一個耳杯105是可見的。然而,以虛線示出的相同耳杯106也存在于頭盔100的相對側上。
如圖1中所示,耳杯105(且因此耳杯106)通過隔振懸置107與頭盔100的外殼101隔離。隔振懸置107可由減振材料制成。減振材料可防止外殼振動抵達使用者的耳朵,并且因此可降低使用者將這些振動感知為噪聲的可能性。因此,通過將耳杯105安裝至頭盔的外殼101以外的部分,并且將耳杯105從容易傳遞振動的剛性材料分離,可減低傳遞至耳杯105的噪聲。
每一耳杯105、106包圍例如嵌入耳杯105、106中的揚聲器108、109或者任何其它類型的聲音驅動程序或電聲變換器或一組揚聲器。另外,頭盔100可包括諸如麥克風110和111等聲傳感器,所述聲傳感器感測噪聲并且連同每一耳杯105、106中的揚聲器108和109一起積極地降低或消除的噪聲。麥克風110和111安置在揚聲器108和109的附近(例如,在耳杯105和106中),這意味著在本實例中其與相應揚聲器108、109安置在頭盔100的同一側上,因為揚聲器108和109安置在頭盔100內側的相對位置處。麥克風110和111可與諸如揚聲器108和109等輔助源安置在頭盔100內側的同一曲面處。
揚聲器108和109以及麥克風110和111連接至音頻信號處理模塊112。音頻信號處理模塊112可部分或完全安裝在頭盔100的外殼101內,并且可通過減振材料與外殼101隔離。可替代地,音頻信號處理模塊112部分或完全安置在頭盔100的外側,并且揚聲器108、109和麥克風110、111經由有線或無線連接鏈接至音頻信號處理模塊112。另外,音頻信號處理模塊112不論安置在何處均可經由有線或無線連接鏈接至音頻信號總線系統和/或數據總線系統(二者均未在圖1中示出)。
圖2示出圖1中示出的頭盔100中使用的音頻信號處理模塊112。麥克風110和111向音頻信號處理模塊112提供電氣信號,所述電氣信號表示由麥克風110和111在其相應位置處采擷的聲音。音頻信號處理模塊112對來自麥克風110、111的信號進行處理,并且從所述麥克風110、111產生供應至揚聲器108和109的信號。音頻信號處理模塊112從音頻信號源203接收(例如,立體聲或其它多通道)音頻信號201和202(也稱作有用信號)。示例性音頻信號處理模塊112可包括雙通道音頻增強(子)模塊204,所述模塊204接收音頻信號201和202,并且輸出兩個增強的立體聲信號205和206。增強的立體聲信號205和206各自供應至自動噪聲控制(anc)(子)模塊207、208。anc(子)模塊207和208提供驅動揚聲器108和109的輸出信號209和210,并且從麥克風110和111進一步接收麥克風輸出信號211和212。
現在參考圖3,其是圖示一般反饋型anc模塊300的信號流程圖,可以采用所述模塊300作為圖2中示出的音頻信號處理模塊112中的(子)模塊207和208。在anc模塊300中,也稱作噪聲信號的干擾信號d[n]經由主路徑301傳遞(傳播)至收聽位點,例如收聽者的耳朵。主路徑301具有傳遞特征p(z)。另外,輸入信號v[n]經由次級路徑302從揚聲器108或109傳遞(傳播)至收聽位點。次級路徑302具有傳遞特征s(z)。定位于或定位靠近收聽位點處的麥克風110或111與主路徑一起接收過濾的干擾信號、產生于揚聲器108或109的信號、并且因此來自由次級路徑過濾的揚聲器驅動信號v[n]。麥克風110或111提供表示這些接收的信號的和的麥克風輸出信號y[n](諸如圖2中示出的音頻信號處理模塊112中的麥克風輸出信號211和212)。麥克風輸出信號y[n]作為濾波器輸入信號u[n]供應至anc濾波器303,所述anc濾波器303向加法器304輸出錯誤信號e[n]。可是自適應或非自適應濾波器的anc濾波器303具有傳遞特征w(z)。加法器304還例如使用頻譜整形濾波器(附圖中未示出)接收諸如音樂或語音等任選地預過濾的有用信號x[n]并且將輸入信號v[n]提供至揚聲器108或109。
信號x[n]、y[n]、e[n]、u[n]和v[n]例如在離散時間域中。出于下述考慮,使用其譜表示x(z)、y(z)、e(z)、u(z)和v(z)。從有用信號的角度描述圖3中圖示的系統的微分方程式如下所示:
y(z)=s(z)·v(z)=s(z)·(e(z)+x(z))(1)
e(z)=w(z)·u(z)=w(z)·y(z)(2)
在圖3的系統中,有用信號傳遞特征m(z)=y(z)/x(z)因此為
m(z)=s(z)/(1-w(z)·s(z))(3)
假定w(z)=1,則
假定w(z)=∞,則
如可從方程式(4)至(7)看出,有用信號傳遞特征m(z)當anc濾波器303的傳遞特征w(z)增加時接近0,而次級路徑傳遞函數s(z)保持中性,即處于1左右的等級,即0[db]。為此,必須相應地對有用信號x[n]進行適應,以確保當anc打開或關閉時收聽者同樣地理解有用信號x[n]。另外,有用信號傳遞特征m(z)還取決于次級路徑302的傳遞特征s(z),以便有用信號x[n]的適應也取決于傳遞特征s(z)及其由于時效、溫度、收聽者的變更等產生的波動,以使得“打開”與“關閉”之間的特定差異將明顯。
雖然在圖3中示出的anc模塊300中,有用信號x[n]被供應至連接在揚聲器108或109上游的加法器304處的聲學子系統(揚聲器、房間、麥克風),但是在圖4中示出的anc模塊400中,有用信號x[n]被供應至麥克風110或111處的聲學子系統。因此,在圖4中示出的anc模塊400中,加法器304被省略(例如,可由直接連接進行代替),并且加法器401連接在麥克風110或111的下游,以對例如預過濾的有用信號x[n]和麥克風輸出信號y[n]進行求和。因此,揚聲器輸入信號v[n]是錯誤信號[e],即v[n]=[e],并且濾波器輸入信號u[n]是有用信號x[n]和麥克風輸出信號y[n]的和,即u[n]=x[n]+y[n]。
從有用信號的角度描述圖4中圖示的系統的微分方程式如下所示:
y(z)=s(z)·v(z)=s(z)·e(z)(8)
e(z)=w(z)·u(z)=w(z)·(x(z)+y(z))(9)
在不考慮干擾信號d[n]的情況下,圖4的系統中的有用信號傳遞特征m(z)因此是
m(z)=(w(z)·s(z))/(1-w(z)·s(z))(10)
如可從方程式(11)至(13)看出,有用信號傳遞特征m(z)當開路傳遞特征(w(z)·s(z))增加或降低時接近1,并且當開路傳遞特征(w(z)·s(z))接近0時接近0。為此,必須另外在較高頻譜范圍中對有用信號x[n]進行適應,以確保當anc打開或關閉時收聽者同樣地理解有用信號x[n]。然而,在較高頻譜范圍中的補償相當困難,以使得“打開”與“關閉”之間的特定差異將明顯。另一方面,有用信號傳遞特征m(z)并不取決于次級路徑302的傳遞特征s(z)及其由于時效、溫度、收聽者的變更等產生的波動。
圖5是圖示一般反饋型有源降噪系統的信號流程圖,在所述系統中有用信號被供應至揚聲器和麥克風信號路徑二者。為簡單起見,下面將主路徑301省略,盡管噪聲(干擾信號d[n])仍然存在。確切地說,圖5的系統基于圖3的系統,但是具有額外的減法器501,所述減法器501從麥克風輸出信號y[n]減去有用信號x[n]以形成anc濾波器輸入信號u[n];并且具有加法器502,所述加法器502代替圖3中示出的加法器304并且將有用信號x[n]和錯誤信號e[n]相加。
從有用信號的角度描述圖5中圖示的系統的微分方程式如下所示:
y(z)=s(z)·v(z)=s(z)·(e(z)+x(z))(14)
e(z)=w(z)·u(z)=w(z)·(y(z)-x(z))(15)
圖5的系統中的有用信號傳遞特征m(z)因此是
m(z)=(s(z)-w(z)·s(z))/(1-w(z)·s(z))(16)
可從方程式(17)至(19)看出的是,圖5的系統的特征與圖4的系統的特性類似。唯一的差異在于,有用信號傳遞特征m(z)當開路傳遞特征(w(z)·s(z))接近0時接近s(z)。與圖3的系統一樣,圖5的系統取決于次級路徑302的傳遞特征s(z)及其由于時效、溫度、收聽者的變更等產生的波動。
在圖6中,示出基于圖5的系統的系統,并且所述系統另外包括連接至減法器602的上游以便使用逆次級路徑傳遞函數1/s(z)或傳遞函數1/s(z)的近似法過濾有用信號x[n]的均衡濾波器601。從有用信號的角度描述圖6中圖示的系統的微分方程式如下所示:
y(z)=s(z)·v(z)=s(z)·(e(z)-x(z)/s(z))(20)
e(z)=w(z)·u(z)=w(z)·(y(z)-x(z))(21)
圖6的系統中的有用信號傳遞特征m(z)因此是
m(z)=(1-w(z)·s(z))/(1-w(z)·s(z))=1(22)
如可從方程式(22)看出,麥克風輸出信號y[n]與有用信號x[n]相同,這意味著如果均衡器濾波器正好是次級路徑傳遞特征s(z)的逆,則信號x[n]不會被系統改變。均衡器濾波器601可是用于最優結果的最小相位濾波器,所述最優結果即其理想的最小相位、次級路徑傳遞特征s(z)的逆的實際傳遞特征,并且因此y[n]=x[n]。該配置充當理想線性化電路,即所述配置對由于有用信號從揚聲器108或109傳遞至表示收聽者的耳朵的麥克風110或111而產生的任何退化進行補償。因此,其對次級路徑s(z)對有用信號x[n]的干擾影響進行補償或線性化以使得有用信號抵達如由源頭所提供的收聽者,而不會由于聲音再現降噪頭盔的聲學性質而產生任何不利影響,即y[z]=x[z]。為此,在此種線性化濾波器的幫助下,能夠使得粗劣設計的聲音再現降噪頭盔聽起來像經過完美聲學調整的頭盔,即線性頭盔。
在圖7中,示出基于圖5的系統的系統,并且所述系統另外包括連接至減法器501的上游以便使用次級路徑傳遞函數s(z)過濾有用信號x[n]的次級路徑建模濾波器701。
從有用信號的角度描述圖7中圖示的系統的微分方程式如下所示:
y(z)=s(z)·v(z)=s(z)·(e(z)+x(z))(23)
e(z)=w(z)·u(z)=w(z)·(y(z)-s(z)·x(z))(24)
圖7的系統中的有用信號傳遞特征m(z)因此是
m(z)=s(z)·(1+w(z)·s(z))/(1+w(z)·s(z))=s(z)(25)
從方程式(25)可以看出,當anc系統有源時,有用信號傳遞特征m(z)與次級路徑傳遞特征s(z)相同。當anc系統無源時,有用信號傳遞特征m(z)也與次級路徑傳遞特征s(z)相同。因此,無論降噪是否有源,對于位于靠近麥克風110或111的位置處的收聽者來說,有用信號的聽覺印象是相同的。
anc濾波器303以及濾波器601和701可是具有恒定傳遞特征的固定濾波器或者具有可控傳遞特征的自適應濾波器。在附圖中,濾波器本身的自適應結構由相應塊下方的箭頭指示,并且自適應結構的任選性由虛線指示。
圖7中示出的系統例如在聲音再現降噪頭盔中適用,在所述頭盔中諸如音樂或語音等有用信號在不同噪聲條件下再現,并且收聽者可能夠關掉anc系統,尤其當不存在噪聲時,而不會察覺到anc系統的有源狀態與無源狀態之間的任何可聽到的差異。然而,本文所呈現的系統并不是僅在聲音再現降噪頭盔中適用,而是在需要臨時降噪的所有其它領域中也適用。
圖8示出采用(至少)兩個濾波器801和802(子濾波器)而不是采用如圖7的系統中的單個濾波器701的示例性anc模塊。舉例來說,具有傳遞特征s1(z)的高音衰減坡型濾波器(例如,濾波器801)以及具有傳遞特征s2(z)的高音衰減均衡濾波器(例如,濾波器802),其中s(z)=s1(z)·s2(z)。可替代地,高音提升均衡濾波器可實現為例如濾波器801,和/或高音衰減均衡濾波器可實現為例如濾波器802。如果有用信號傳遞特征m(z)展示出更加復雜的結構,則可采用三個濾波器,例如一個高音衰減坡型濾波器和一個高音提升/衰減濾波器和一個均衡濾波器。所使用的濾波器數量可取決于許多其它方面,諸如成本、濾波器的噪聲特性、聲音再現降噪頭盔的聲學性質、系統的延時、可用于實現系統的空間等。
參考圖9,圖1中示出的音頻信號增強器(子)模塊204可包括立體聲展寬功能。在過去的四十年里錄制的音樂幾乎全是雙通道立體聲格式,所述格式由兩個獨立的音軌組成,一個音軌用于左側通道l且另一個音軌用于右側通道r。兩個音軌意在用于在兩個揚聲器上進行播放,并且所述兩個音軌被混合,以向穿戴頭盔的收聽者提供所需的更加逼真的印象。更加逼真的聲音印象包括:收聽者體驗到的聲音與由聲音源提供的聲音相同或近乎相同,這意味著音頻源與收聽者的耳朵之間的音頻路徑(幾乎)未展示破壞效應。
在許多情況下,有利的是能夠修改至兩個揚聲器的輸入,以使得收聽者隨著聲級擴展超過兩側處的揚聲器位置而察覺到所述聲級。這當收聽者希望在彼此定位相當接近的兩個揚聲器上播放立體聲錄音時特別有用。立體聲展寬處理機制一般通過以下方式運作:從左側輸入引入串音至右側揚聲器以及從右側輸入引入串音至左側揚聲器。沿直達路徑從左側輸入傳輸至左側揚聲器以及從右側輸入傳輸至右側揚聲器的音頻信號在從左側揚聲器和右側揚聲器輸出之前通常也會被修改。
例如,和差處理器可被用作立體聲展寬處理機制,主要通過對差異信號l-r的一部分進行升壓以便使得聲級的最左側和最右側部分顯得更加突出。因此,和差處理器不會提供高空間保真度,因為所述處理器趨向于大大弱化中心圖像。然而,所述處理器非常易于實現,因為其不依賴于準確的頻率選擇性。一些簡單的和差處理器可以甚至使用模擬電子器件實現,無需進行數字信號處理。
另一種類型的立體聲展寬處理機制是基于逆的實施方式,所述實施方式大體上分為兩種偽裝:串音消除網絡和虛擬源成像系統。好的串音消除系統可以使收聽者的一只耳朵聽到聲音,而另一只耳朵處是靜音;而好的虛擬源成像系統可以使得收聽者聽到來自空間中某處距離所述收聽者特定距離的位置的聲音。兩種類型的系統基本上通過在收聽者的耳朵處再現正確的聲壓來運作,并且為了能夠控制收聽者的耳朵處的聲壓,有必要了解人類收聽者的存在對于傳入的聲波的影響。例如,基于逆向的實施方式可設計成基于自由場模型的簡單串音消除網絡,其中不存在來自障礙物、邊界或反射表面對聲音傳播的顯著影響。其它實施方式可使用復雜的數字濾波器設計方法,所述方法也可以補償收聽者的頭部、軀干和耳廓(外耳)對于傳入的聲波的影響。
作為對通常需要基于逆的實施方式的嚴格濾波器設計技術的替代方案,可采用根據實驗和經驗知識的一組合適的濾波器。因此,該實施方式基于表格,所述表格的內容是聽力測試的結果。雖然上面結合安置在房間中的揚聲器描述立體聲展寬功能性,但是下文中將所述功能性應用至安裝在頭盔中的揚聲器。
圖9以框圖形式示出立體聲展寬網絡900的示例性結構,所述結構包括左側揚聲器和右側揚聲器,例如安裝在圖1和圖2中示出的頭盔100中的揚聲器108和109。(模擬或數字)音頻源203具有分別傳輸音頻信號201和202的分開的左側音頻通道l和右側音頻通道r。例如,音頻信號源可提供呈任何格式(例如,mp3)的數字音頻流,并且可以由任何媒體(例如,cd)提供。音頻信號201(左側通道l)由具有傳遞函數hd的濾波器901過濾,在加法器902處被增加至音頻信號202(右側通道r),所述音頻信號202由具有傳遞函數hx的濾波器906過濾并且輸出至揚聲器108。類似地,音頻信號202(右側通道r)由具有傳遞函數hd的濾波器904過濾,在加法器905處被增加至音頻信號201(左側通道l),所述音頻信號201由具有傳遞函數hx的濾波器903過濾并且輸出至揚聲器109。
傳遞函數hd和hx的選擇受到在不降低原始音頻源材料的品質的情況下實現良好空間效應的需要刺激。在本實例中,用于濾波器901、904二者的傳遞函數hd是具有平緩幅值響應的濾波器,因此當引入群延遲時信號輸入的幅值不會改變(應注意,群延遲和延遲可以隨著頻率的改變而改變)。因此,明顯的是,傳遞函數hd容許來自音頻信號源203的相應通道在直達路徑上傳遞通過抵達該通道的相應揚聲器108、109而幅值不存在任何改變。用于濾波器903、906二者的傳遞函數hx是一種濾波器,所述濾波器的幅值響應在大約2khz或以上的頻率下大致為零,并且所述濾波器的幅值響應在低于大約2khz的任何頻率下不大于傳遞函數hd的幅值響應。除此以外,群延遲由濾波器903和906(各自具有傳遞函數hx)引入,所述群延遲大體上比由濾波器901和904(各自具有傳遞函數hd)引入的群延遲更大。
圖10分別示出hd和hx的適當幅值響應的實例。傳遞函數hx的幅值響應被傳遞函數hd的幅值限定在垂直方向上,并且被大約2khz限定在水平方向上。大約2khz以上的頻率的幅值被設計成不受傳遞函數hx影響,因為改變這些大約2khz以上的頻率的幅值會產生不合乎需要的頻譜顯色。
另外地或可替代地,圖1中示出的音頻信號增強器(子)模塊204可包括恢復數據壓縮型音頻信號即增強數據壓縮型音頻信號的功能性。數據壓縮型音頻信號是包含音頻內容的信號,所述信號已經諸如通過感知音頻編碼解碼器經受某種形式的數據壓縮。常見類型的感知音頻編碼解碼器包括mp3、aac、dolbydigital和dts。這些感知音頻編碼解碼器通過丟棄很大一部分的音頻信號來縮減音頻信號的大小。可以將感知音頻編碼解碼器用于降低存儲音頻信號所需要的空間(存儲器)量,或者用于降低傳輸或傳遞音頻信號所需要的帶寬的量。常見的是將音頻信號壓縮90%或更多。感知音頻編碼解碼器可以采用人耳聽覺系統如何感知聲音的模型。以此方式,感知音頻編碼解碼器可以丟棄音頻信號的被視為聽不見或與收聽者對聲音的感知最不相關的那些部分。因此,感知音頻編碼解碼器能夠縮減音頻信號的大小,同時仍然維持剩余信號的相對良好的感知的音頻品質。一般而言,數據壓縮型音頻信號的感知的品質可以取決于數據壓縮型信號的比特率。較低的比特率可以指示原始音頻信號的較大一部分被丟棄,并且因此一般而言數據壓縮型音頻信號的感知的品質可以較差。
存在多種類型的感知音頻編碼解碼器,并且每一類型可以使用一組不同的標準來確定在壓縮過程中原始音頻信號的哪些部分將被丟棄。感知音頻編碼解碼器可以包括編碼和解碼過程。編碼器接收原始音頻信號,并且可以確定信號的哪些部分將被丟棄。編碼器然后可以將剩余信號放置在適合于數據壓縮型存儲和/或傳輸的格式中。解碼器可以接收數據壓縮型音頻信號,將其解碼,并且然后將解碼的音頻信號轉換成適合于音頻播放的格式。在大多數感知音頻編碼解碼器中,可以包括感知模型的使用的編碼過程可以確定數據壓縮型音頻信號的最終品質。在這些情況下,解碼器可以充當格式轉換器,所述格式轉換器將信號從數據壓縮型格式(通常是某種形式的頻域表示法)轉換成適合于音頻播放的格式。
音頻信號增強器模塊可以修改已被被感知音頻編碼解碼器處理的數據壓縮型音頻信號,以使得對可已經在壓縮過程中被丟棄或改變的信號分量和特征進行感知,以在處理的輸出信號中進行恢復。如本文所使用,術語音頻信號可指代表示音頻內容的電氣信號或可聽聲音,除非另有描述。
當音頻信號是使用感知音頻編碼解碼器壓縮的數據時,無法檢索被丟棄的信號分量。然而,音頻信號增強器模塊可以分析數據壓縮型音頻信號中的剩余信號分量,并且生成新的信號分量以感知地大體丟棄的分量。
圖11是包括音頻信號增強器模塊1100的實例的信號流程圖,所述音頻信號增強器模塊1100可用作、用于或結合音頻信號增強器(子)模塊204一起使用。音頻信號增強器模塊1100包括感知音頻信號解碼器1101和音頻信號增強器1102,并且可以在頻域或時域中操作。音頻信號增強器1102可包括取樣器1103(包括域轉換器),所述取樣器1103可接收實時輸入信號x,并且將輸入信號x分成樣本。在頻域中的操作期間,取樣器1103可收集順序時域樣本,采用合適的窗口函數(諸如根-漢寧窗口),并且窗口化樣本被使用諸如fft(快速傅里葉變換)轉換成頻域中的順序塊。類似地,在音頻信號增強器1102中,增強的頻域塊可以由取樣器1104(包括域轉換器)使用逆fft(快速傅里葉逆變換)轉換成時域,并且采用合適的互補窗(諸如,根-漢寧窗口)以產生一批增強的時域樣本。例如通過采用重疊相加或重疊保存,短期頻譜分析可以提供諸如至少50%等預定量的重疊。可替代地,音頻信號增強器1102可以使用時域樣本的順序塊在時域中的操作,并且可以將域轉換器從取樣器1103和1104排除。為了將討論和附圖簡化,省略了對取樣器1103和1104以及時間-頻率和頻率-時間轉換的進一步討論和說明。因此,如本文所描述,順序樣本或一連串樣本可可互換地指代時域樣本的時間序列順序,或者對應于已經被取樣器1103取樣的輸入信號x的時間序列接收的頻域塊的時間序列順序。
在圖11中,音頻信號增強器1102被圖示成結合感知音頻信號解碼器1101一起使用。數據壓縮型音頻比特流q由音頻信號源203供應至數據壓縮型比特流線路1106上的感知音頻信號解碼器1101。感知音頻解碼器1101可對數據壓縮型音頻比特流q進行解碼,以在輸入信號線路1107上產生輸入信號x。輸入信號x可是呈適合于音頻播放的格式的音頻信號。音頻信號增強器1102可操作以將輸入信號x分成一連串樣本,以便增強輸入信號x,從而在輸出信號線路1105上產生輸出信號y。側鏈數據可包含與輸入信號x的處理相關的信息,所述信息諸如對以下的指示:所使用的音頻編碼解碼器的類型、編碼解碼器制造商、比特率、立體聲與聯合立體聲編碼、取樣率、獨特輸入通道的數量、編碼塊大小和歌曲/音軌標識符。在其它實例中,可包括與音頻信號x或編碼/解碼過程有關的任何其它信息作為側鏈數據的一部分。側鏈數據可從側鏈數據線路1108上的感知音頻解碼器1101提供至音頻信號增強器1102。可替代地或除此以外,可包括側鏈數據作為輸入信號x的部分。
圖12是音頻信號增強器1102的實例的信號流程圖,其中感知音頻解碼器1101可以被并入作為音頻信號增強器1102的一部分。因此,音頻信號增強器1102可在數據壓縮型比特流線路1106上接收的數據壓縮型音頻比特流q上直接操作。可替代地,在其它實例中,可將音頻信號增強器1102包括在感知音頻解碼器1101中。在該配置中,音頻信號增強器1102可訪問線路1106上的數據壓縮型音頻比特流q的細節。
圖13是音頻信號增強器1102的實例的信號流程圖。在圖13中,音頻信號增強器1102包括信號處理模塊1300,所述信號處理模塊1300可接收輸入信號線路1107上的輸入信號x。信號處理模塊1300可在對應信號處理線路1310上產生若干個別且獨特的信號處理st1、st2、st3、st4、st5、st6和st7。雖然圖示了七個信號處理,但是在其它實例中,更少或更多數量n個信號處理是可能的。在第一求和塊1321處被加在一起以在線路1323上產生總信號處理stt之前,增益級1315中的處理增益g1、g2、g3、g4、g5、g6和g7可單獨地調整信號處理stn中的每一個的相對能級。在第二求和塊1322處被增加至線路1107上的輸入信號x之前,線路1320上的總處理增益gt可調整線路1323上的總信號處理stt的級別。
信號處理模塊1300可包括一個或多個處理模塊1301、1302、1303、1304、1305、1306和1307,所述模塊在輸入信號x的順序樣本的個別樣本分量上操作,以逐樣本順序地產生有關相應分量中的每一個的信號處理1310。順序樣本的個別樣本分量可與音頻信號的不同特征有關。可替代地或除此以外,信號處理模塊1300可包括額外的或更少的處理模塊1300。圖示的模塊可是獨立的,或者可是形成在各種組合的任何一個中以創建模塊的子模塊。
當嘗試再現來自多個聲音源的聲音時遇到的另一影響是:音頻系統不能再造聲音分級。聲音分級是允許收聽者感知音樂呈現的明顯物理大小和位置的現象。聲級包括深度和寬度的物理性質。這些性質促成例如收聽管弦樂隊的能力,并且能夠分辨不同聲音源(例如,樂器)的相對位置。然而,當對多個聲音源進行錄音時,許多錄音系統無法精確地捕捉聲音分級效果。關于此的一個原因就是許多系統所使用的方法。例如,所述系統通常使用一個或多個麥克風來接收由多個聲音源產生的聲波,并且將所述聲波轉換成電氣音頻信號。當使用一個麥克風時,來自所述聲音源中的每一個的聲波通常被混合(即,彼此疊置)以形成復合信號。當使用多個麥克風時,所述多個音頻信號通常被混合(即,彼此疊置)以形成復合信號。在任何一種情況下,然后將所述復合信號存儲在存儲媒體上。隨后,可以從存儲媒體讀取復合信號,并且對所述復合信號進行再現,以嘗試再造由聲音源產生的原始聲音。然而,信號的混合尤其會限制對多個聲音源的聲音分級進行再造的能力。因此,當將信號混合時,再現的聲音無法精確地再造原始聲音。這就是與聽錄音相比,現場聽管弦樂隊會不同的一個原因。
例如,在一些情況下,復合信號包括兩個分開的通道(例如,左側和右側),以嘗試在空間上將所述復合信號分開。在一些情況下,使用第三個(例如,中心)或三個以上通道(例如,前方和后方),以實現對由多個聲音源產生的原始聲音的更大的空間分離。然而,不論通道的數量是多少,所述系統通常涉及對音頻信號進行混合,以形成一個或多個復合信號。即使是被吹捧為“離散多通道”的系統也將每一通道的離散性建立在“方向性分量”的基礎上。“方向性分量”有助于建立更加席卷性的聲學效果,但是無法解決音頻信號本身內的關鍵精確性損耗。常常使用其它分離技術以嘗試增強聲音的再造。例如,每一揚聲器通常包括多個揚聲器組件,其中每一組件專用于特定頻帶以實現再現的聲音的頻率分布。常見地,所述揚聲器組件包括低音揚聲器或低音部(較低頻率)、中音部(中等頻率)和高音揚聲器(較高頻率)。針對其它特定頻帶的組件也是已知的,并且可使用。當將頻率分布式組件用于多個通道(例如,左側和右側)中的每一個時,輸出信號可以展示出一定程度的空間分布和頻率分布二者,以嘗試再現由多個聲音源產生的聲音。
由將由聲音源產生的聲音或對應音頻信號進行混合產生的另一個問題是,該混合通常要求這些復合聲音或復合音頻信號在相同的揚聲器上進行播放。眾所周知的是,諸如掩蔽等效應妨礙原始聲音的精確再造。例如,當伴隨有更響的聲音時,掩蔽可以呈遞一個聽不到的聲音。例如,當存在聲音放大的音樂時無法聽到交談是掩蔽的實例。當用于掩蔽的聲音具有與被掩蔽的聲音類似的頻率時,掩蔽就特別成問題。其它類型的掩蔽包括揚聲器掩蔽,其當揚聲器紙盆由復合信號而不是對應于單個聲音源的音頻信號驅動時發生。因此,在后一種情況下,揚聲器紙盆將其所有能量用于再現一個隔離的聲音;而在前一種情況下,揚聲器紙盆必須將其能量“分時”以同時再現復合聲音。
圖14是描繪多輸入音頻增強(子)模塊1400的實例的信號流程圖,所述模塊1400具有聲音分級功能性和具有音頻輸入信號l、r、ls、rslrs和rrs的多個輸入通道。可用作、用于或結合音頻增強(子)模塊204一起使用的(子)模塊1400包括六個塊1401至1406。塊1401至1406的基本結構包括和濾波器1407和十字濾波器1408,所述濾波器用于將作為輸入信號l、r、ls、rslrs或rrs輸入的音頻信號變換成在相應濾波器輸出處輸出的直接和間接頭部相關傳遞函數(hrtf)。從和濾波器1407的輸出減去十字濾波器1408的輸出,以提供第一塊輸出信號。通過借助于耳間延遲1409延遲十字濾波器1408的輸出信號來生成其它塊輸出信號。示例性塊1401至1406執行將音頻輸入信號變換成直接和間接hrtf的功能。另外,在將十字濾波器輸出從乘積減去之前,可將來自和濾波器1407的輸出信號乘以例如系數2。這樣產生直接hrtf。由十字濾波器輸出的信號表示間接hrtf。
就和濾波器1407而言,當應用于音頻信號時,所述和濾波器1407可以提供頻譜修正,以使得信號的此種品質對于收聽者的雙耳大致上類似。和濾波器1407也可以消除可能會包括在音頻信號的頻率響應中的不希望的共振和/或不希望的峰化。對于十字濾波器1408,當應用至音頻信號時,所述十字濾波器1408提供頻譜修正,以使得收聽者聽覺上感知信號來自預定的方向或位置。該功能性通過對頭部遮蔽的調整實現。在兩種情況下,可能需要所述修正對于個別收聽者的特定特征而言是特有的。為了滿足此種需要,對和濾波器1407和十字濾波器1408二者進行設計,以使得過濾的音頻信號的頻率響應對于收聽者特定特征敏感度低。在塊1401和1402中,和濾波器具有為“1”的傳遞函數,以使得和濾波器可以被直接連接取代。如已經提及的,塊1401至塊1406還包括針對45度、90度和135度(分別標記成“t45”、“t90”和“t135”)的源角度的耳間延遲1409。在48khz的取樣率下,延遲濾波器1409可以分別具有17個樣本、34個樣本和21個樣本的典型取樣。延遲濾波器1409對聲波在首先抵達一只耳朵后抵達另一只耳朵所需要的時間進行模擬。
模塊1400的其它分量可以將來自一個或多個源的音頻信號變換成雙耳格式,諸如直接和間接hrtf。具體地說,音頻增強(子)模塊1400借助于直接和間接hrtf將來自6通道環繞聲系統的音頻信號變換成由頭盔中的右側揚聲器和左側揚聲器(未圖示)輸出的輸出信號hl和hr。由頭盔中的揚聲器輸出的這些信號將包括6通道環繞聲的一般感知的增強,無不希望的偽像。同樣就頭盔中的揚聲器的每一輸出而言,包括相應的求和操作的集合以對6通道環繞聲的三個輸入對進行求和。六個音頻信號輸入包括左側、右側、左側環繞、右側環繞、左后環繞和右后環繞(分別標記成“l”、“r”、“ls”、“rs”、“lrs”和“rrs”)。圖14還描繪針對45度、90度和135度(分別標記成“hc90”、“hc135”、“hc45”、“hc90”和“hc135”)的源角度的和濾波器和十字濾波器。如上面所指出,和濾波器未參與來自具有45度源角度的源的音頻信號的變換。可替代地,等于恒定值1的和濾波器可添加至圖14中描繪的實施方式,并且類似的輸出將在輸出hl和hr處發生。而且,可替代地,實施方式可為具有諸如30度、80度和145度等其它源角度的源采用其它濾波器。另外,一些實施方式可例如在存儲器中存儲有關不同源角度的各種和濾波器系數和十字濾波器系數,以使得終端使用者可以選擇所述濾波器。在所述實施方式中,收聽者可以對其感知聲音的角度和模擬定位進行調整。可替代地,除了聲音分級之外,例如二維音頻和三維音頻等任何(其它)空間音頻處理也適用。
實施方案的描述已經被呈現用于說明和描述的目的。可根據以上描述執行實施方案的合適的修改和變化形式。所描述的系統具有示例性性質,并且可包括額外元素和/或省略元素。如本申請中所使用,以單數形式闡述并且使用措詞“一個”或“一種”修飾的元素或步驟應理解為不排除多個所述元素或步驟,除非明確指出所述排除。另外,對本公開的“一個實施方案”或“一個實例”的引用并非意在被解釋成排除存在也合并所闡述的特征的額外實施方案。術語“第一”、“第二”和“第三”等僅用于標識,而并非意在對其客體施加數值要求或特定位置次序。信號流程圖可描述一種系統、方法或軟件,所述系統、方法或軟件根據例如硬件、軟件或其組合的實現類型實現所述方法。