基于傳聲器陣列的語音信號處理方法及裝置的制作方法

文檔序號：2823633閱讀：312來源：國知局

專利名稱：基于傳聲器陣列的語音信號處理方法及裝置的制作方法
技術領域：
本發明涉及語音信號處理技術，尤其涉及一種基于傳聲器陣列的語音信號處理方法及裝置。
背景技術：
在會議場所，各種干擾源的存在以及混響等噪音干擾著語音信號，會使語音處理系統的性能急劇下降，因此語音增強技術頗為重要。基于傳聲器陣列的多通道語音增強算法融合了信號的時空域信息，利用噪聲同語音的相關性差異進行消噪，近幾年已經成為多媒體會議、通信、聲控等系統所依賴的重要技術。音質和性能的好壞會嚴重影響音頻會議系統的整體效果與市場競爭力，因此，針對噪聲，目前常通過傳聲器陣列技術實現消噪，這使得音頻會議系統的參與人員徹底擺脫手持傳聲器并定向到傳聲器的束縛，大大提高了音頻會議系統的實用性。對語音信號處理而言，要爭取使進入編碼器的語音音質就比較好如低混響、低噪聲等，傳聲器陣列就是保證語音信號的低混響、低噪聲。公開號為CN101496417A
公開日為2009年7月29日的中國專利申請公開了一種 “語音會議系統”，在不同方向上的多個單向傳聲器拾取的語音采集信號形成多個語音采集束信號，其后，與語音到達方向相對應的語音采集束信號的信號電平變高，語音采集部分選擇信號電平超過設定閾值的語音采集束信號，并將該信號送到通信部分。該技術方案中，超過閾值的語音采集束信號可能有多個，這樣在小房間就會增加混響，使聲音清晰度降低。公開號為US20050195988A
公開日為2005年9月8日的美國專利申請公開了一 ft "System and method for beamforming using a microphone array，，，i亥技術方案是使用傳聲器陣列聚束的系統和方法，其技術方案的實質是設計了一個聚束器，該聚束器首先利用描述傳聲器陣列的特性和結構的參數信息來計算頻域相關的權值矩陣，與一個或多個為傳聲器陣列周圍環境自動生成或計算得到的噪聲模型相結合，來對傳聲器陣列的最優固定波束進行設計，然后，在對傳聲器陣列接收的音頻信號進行頻域聚束處理時，利用此權值矩陣對傳聲器陣列中的每個傳聲器的輸出進行頻域加權。該方法需要根據陣列的特性和結構在頻域計算加權矩陣，以達到形成波束的目的，增加了系統的復雜度，加大了系統的開發難度并且降低了系統的可靠性。

發明內容
有鑒于此，本發明的主要目的在于提供一種基于傳聲器陣列的語音信號處理方法及裝置，利用強指向性傳聲器陣列能將距發言人最近的語音信號進行放大，從而能動態跟蹤發目人。為達到上述目的，本發明的技術方案是這樣實現的—種基于傳聲器陣列的語音信號處理方法，所述傳聲器陣列由兩個以上的指向性傳聲器構成；所述方法包括確定各指向性傳聲器接收的相同幀的語音信號的能量值；
4
根據所述能量值確定所述相同幀的各語音信號的調整參數；根據各語音信號的調整參數確定語音信號中各取樣點信號的權值，將各語音信號中各取樣點信號與各自的權值相乘，并對各語音信號的對應取樣點信號的乘積值進行累加，將累加后的取樣點信號依次輸出。優選地，所述根據所述能量值確定所述相同幀的各語音信號的調整參數，為將所述相同幀的各語音信號的能量值分別與最大的能量值作商；對各商值進行指數調整處理，并作為各語音信號的調整參數。優選地，所述對各商值進行指數調整處理，并作為各語音信號的調整參數，為將各商值的E次方作為各語音信號的調整參數；其中，E為大于等于2小于等于10 的正數。優選地，所述根據各語音信號的調整參數確定語音信號中各取樣點信號的權值，具體按下式計算Wi(n) = AWi(n-l) + (l-A)C；^^, w, (n)為傳聲器i中的當前語音信號幀中第n 個取樣點信號的權值，Wi(n-l)為傳聲器i中的當前語音信號幀中第n-1個取樣點信號的權值八為預先設定的遺忘因子，0< A < 1 ;C為當前語音信號幀的調整參數。優選地，所述根據各語音信號的調整參數確定語音信號中各取樣點信號的權值，為Wi(n) = AWi(n-l) + (l-A)C；^^, w, (n)為傳聲器i中的當前語音信號幀中第n 個取樣點信號的初始權值，Wi(n-1)為傳聲器i中的當前語音信號幀中第個取樣點信號的初始權值；、為預先設定的遺忘因子，0 < A < 1 ;C為當前語音信號幀的調整參數；按下式對&(11)進行處理，將成(功作為傳聲器i中的當前語音信號幀中第n個取
樣點信號的最終權值

其中，max()為取最大值計算。優選地，所述傳聲器陣列為圓形陣列或球形陣列；所述傳聲器陣列中的傳聲器數量為4至16個。一種基于傳聲器陣列的語音信號處理裝置，所述傳聲器陣列由兩個以上的指向性傳聲器構成；所述裝置包括第一確定單元、第二確定單元、計算單元和輸出單元；其中，第一確定單元，用于確定各指向性傳聲器接收的相同幀的語音信號的能量值；第二確定單元，用于根據所述能量值確定所述相同幀的各語音信號的調整參數；計算單元，用于根據各語音信號的調整參數確定語音信號中各取樣點信號的權值，將各語音信號中各取樣點信號與各自的權值相乘，并對各語音信號的對應取樣點信號的乘積值進行累加；輸出單元，用于將累加后的取樣點信號依次輸出。優選地，所述第二確定單元進一步將所述相同幀的各語音信號的能量值分別與最大的能量值作商；并對各商值進行指數調整處理，作為各語音信號的調整參數。優選地，所述第二確定單元進一步將各商值的E次方作為各語音信號的調整參數；其中，E為大于等于2小于等于10的正數。優選地，所述計算單元進一步按下式計算語音信號中各取樣點信號的權值
Wi(n) = AWi(n-l) + (l-A)C；^^, w, (n)為傳聲器i中的當前語音信號幀中第n 個取樣點信號的權值，Wi(n-l)為傳聲器i中的當前語音信號幀中第n-1個取樣點信號的權值八為預先設定的遺忘因子，0< A < 1 ;C為當前語音信號幀的調整參數。優選地，所述計算單元進一步按下述方式計算語音信號中各取樣點信號的權值Wi(n) = AWi(n-l) + (l-A)C；^^, w, (n)為傳聲器i中的當前語音信號幀中第n 個取樣點信號的初始權值，Wi(n-1)為傳聲器i中的當前語音信號幀中第個取樣點信號的初始權值；、為預先設定的遺忘因子，0 < A < 1 ;C為當前語音信號幀的調整參數；按下式對&(11)進行處理，將戌…)作為傳聲器i中的當前語音信號幀中第n個取樣點信號的最終權值
其中，maxO為取最大值計算。優選地，所述傳聲器陣列為圓形陣列或球形陣列；所述傳聲器陣列中的傳聲器數量為3至16個。本發明中，采用N個強指向性傳聲器構成圓形陣列，陣列的拾音覆蓋360度方位；首先對強指向性傳聲器陣列中各傳聲器接收到的語音信號的能量值，通過語音信號的能量值信息，確定出各傳聲器接收到的當前語音幀的語音信號的調整參數，并利用該調整參數計算當前語音幀的各采樣點信號的權值，將所計算出的權值與對應的采樣點信號相乘，對相同位置的采樣點信號的乘積進行累加，并按采樣點的順序依次輸出。本發明利用傳聲器陣列中各傳聲器所接收語音信號的能量值來確定各路語音信號的調整參數，并利用遺忘因子對各采樣點信號進行平滑處理，使得所輸出的語音信號更連貫。本發明計算方式簡單，不需要復雜的計算和電路，具有良好的抗混響和定向拾音功能。

圖1為本發明基于傳聲器陣列的語音信號處理方法的流程圖；圖2為在混響室兩個聲源相互切換發聲時，傳聲器陣列中各傳聲器拾取的語音信號語音幀的歸一化能量變化關系的示意圖；圖3為在混響室兩個聲源相互切換發聲時，傳聲器陣列的輸出信號中各通道語音幀所占的平均權重變化關系的示意圖；圖4為在混響室兩個聲源同時發聲時，傳聲器陣列中各傳聲器拾取的語音信號語音幀的歸一化能量變化關系的示意圖；圖5為在混響室兩個聲源同時發聲時，傳聲器陣列的輸出信號中各通道語音幀所占的平均權重變化關系的示意圖；圖6為在普通房間兩個聲源相互切換發聲時，傳聲器陣列中各傳聲器拾取的語音信號語音幀的歸一化能量變化關系的示意圖；圖7為在普通房間兩個聲源相互切換發聲時，傳聲器陣列的輸出信號中各通道語音幀所占的平均權重變化關系的示意圖；圖8為在普通房間兩個聲源同時發聲時，傳聲器陣列中各傳聲器拾取的語音信號語音幀的歸一化能量變化關系的示意圖；圖9為在普通房間兩個聲源同時發聲時，傳聲器陣列的輸出信號中各通道語音幀所占的平均權重變化關系的示意圖；圖10為本發明基于傳聲器陣列的語音信號處理裝置的組成結構示意圖。
具體實施例方式本發明的基本思想為，采用N個強指向性傳聲器構成圓形陣列，陣列的拾音覆蓋 360度方位；對各傳聲器拾取的信號分幀計算能量，通過能量的比較，保持能量最大通道的語音信號幅度不變，而弱化其它通道的語音信號；語音信號的弱化程度受調整參數的控制；并且，為保證基于能量比較在各通道間進行切換時語音信號平穩自然無切換噪聲，引入平滑機制-遺忘因子，將當前采樣點和以前采樣點的信號相結合來進行切換。為使本發明的目的、技術方案和優點更加清楚明白，以下舉實施例并參照附圖，對本發明進一步詳細說明。本發明的方法中，傳聲器陣列中的傳聲器均為強指向性傳聲器，而非全向性傳聲器。所謂強指向性傳聲器，即該傳聲器能按指向進行語音信號的采集。強指向性傳聲器能有效降低進入各個傳聲器的混響強度；本發明正是利用強指向性傳聲器的指向性拾音特點，利用各傳聲器所拾取的相同語音幀的能量來確定各該相同語音幀中各語音信號中各采樣點信號的權值，從而輸出較佳的語音信號。本發明的傳聲器陣列采用圓周或球面布局，以對各方位的語音信號進行采集。本發明中，傳聲器陣列中的強指向性傳聲器的數量一般為3 至16個，以在設定的圓周或球面上均勻分布，達到各個指向均有相應的傳聲器進行語音采集。圓周或球面的半徑一般為3至20cm，各傳聲器振膜沿圓周或圓球的徑向朝外。基于傳聲器陣列，上述傳聲器陣列中第i(i = 1，2，...，N)個傳聲器接收的第k幀 (幀長為L毫秒)采樣信號如(1)式所示Xi(n) = Xi((k_l)L+j)，j = 1，2，，L (1)圖1為本發明基于傳聲器陣列的語音信號處理方法的流程圖，如圖1所示，本發明基于傳聲器陣列的語音信號處理方法具體包括如下步驟步驟101，計算第i(i = 1，2，. . .，N)個傳聲器接收的第k幀信號的能量。因正對聲源的傳聲器所采集到的語音信號相對來說能量要強，通過語音信號的能量能進行聲源方位的初步判斷；所計算出的語音信號的能量值，同時也作為確定該傳聲器的語音信號處理的權重值的依據，將在以下步驟中對如何確定相應的權重值。第i(i = 1,2,...，N)個傳聲器接收的第k幀信號的能量值￡310如式(2)所示本發明中，用于計算能量的各通道語音幀長度可取為400ms ；通道間自適應切換的系統響應時間取為400ms。上述幀長由處理器的處理速度決定，也可以取其他的長度，如 450ms 或 500ms 等。步驟102，以N個通道的第k幀信號的能量的最大值為基準，對式(2)所確定的能量值進行歸一化處理。本步驟中，歸一化處理即是將各個通道的第k幀信號的能量值轉換到0至1之間的數值，以便于后續處理。歸一化處理方式如式(3)所示，其中￡ i(k)為對 Ejk)的歸一化處理結果。其中，maxO為取最大值計算。步驟103，根據第i(i = 1,2, ...，N)個傳聲器接收的第k幀信號的歸一化能量計算調整參數。確定調整參數的目的是使能量數值大的通道上的語音信號變得更大，而使能量數值小的通道上的語音信號變得更小，并依此拉大能量值較大語音信號與能量值較小語音信號之間的差異，這樣可以更突出聲源方向的信號，抑制其它方向的信號，使聲音更清晰，混響更小。具體的，對于歸一化后的能量值，對其分別進行冪運算。本步驟中，所選用的調整指數值為大于等于2小于等于10的正數。為方便運算及考慮到語音信號的差異量，調整指數一般選用4、5、6。調整參數、(10的確定方式如式(4)所示
(4)其中a稱為調整指數，根據各通道語音幀的能量大小關系調整各通道信號在輸出信號中所占的比重。步驟104，計算陣列輸出信號中第i(i = 1，2，. . .，N)個傳聲器采集的第n個采樣點信號的權值；該權值的變化是根據每個采樣點信號逐步計算得到的，具體的，第n個采樣點信號的權值Wi(n)的確定方式如式(5)所示Wi (n) = A Wi (n-1) + (1-A ) hj (k) (5)其中\為遺忘因子，以平滑切換前后語音幀音量，避免語音信號的忽大忽小，并抑制切換時通道的語音幀能量變化太大所導致的切換噪聲。X為事先設定的參數，X為大于0小于1的數，為保證語音信號的平滑性，\為近于1的數，本發明中可設定\ = 0.9998;入也可設定為其他值，如0. 9996、0. 9992、0. 9990等值。具體取值由用戶希望的平滑性來確定。步驟105，對第i(i = 1,2,.. .，N)個傳聲器采集的信號的每個采樣點的權值按其中的最大值進行歸一化處理。這主要是為了使傳聲器陣列輸出的能量最大通道的信號音量與能量最大的通道傳聲器采集的信號音量相等。對第i (i = 1，2，. . .，N)個傳聲器采集的信號的每個采樣點信號的權值的歸一化處理如式(6)所示其中，maxO為取最大值計算。步驟106，計算傳聲器陣列的輸出采樣點信號，并依次輸出。所輸出的各采樣點信號如式(7)所示
Ns(n) = [ Wj {n)xi {n)
i=l式(7)是將傳聲器陣列中各傳聲器相同幀的語音信號中的各采樣點依次與所確定的對應權值進行相乘，并對各傳聲器的對應采樣點信號進行累加，作為輸出的采樣點信號。本發明中，實際工作中在進入本算法處理前的典型前端處理為，通過傳聲器將語音信號轉化為電信號，經過放大以及模數轉換進入數字信號處理器(DSP，Digital Signal Processor)處理。
8
以下以傳聲器陣列由4個傳聲器沿圓周均勻分布為例，說明各應用環境下語音信號處理結果。其中，圓周的半徑為5cm，遺忘因子\ = 0.9998，調整指數a =5.0。圖2為在混響室兩個聲源相互切換發聲時，傳聲器陣列中各傳聲器拾取的語音信號語音幀的歸一化能量變化關系的示意圖，如圖2所示，示出了在混響室兩個聲源相互切換發聲時，采用本發明方法計算各傳聲器拾取的語音幀的能量后，傳聲器陣列中各傳聲器拾取的語音信號語音幀的歸一化能量變化關系。圖3為在混響室兩個聲源相互切換發聲時，傳聲器陣列的輸出信號中各通道語音幀所占的平均權重變化關系的示意圖，如圖3所示，在混響室兩個聲源相互切換發聲時，采用本發明方法計算各傳聲器拾取的語音幀能量后，傳聲器陣列的輸出信號中各通道語音幀所占的平均權值變化關系，可以看出，本發明能根據各傳聲器拾音的語音幀能量大小而自動切換，并且切換過程自然穩定，各傳聲器拾取的語音信號經過本發明方法處理后，傳聲器陣列的輸出語音信號音質流暢自然，混響大大降低。圖4為在混響室兩個聲源同時發聲時，傳聲器陣列中各傳聲器拾取的語音信號語音幀的歸一化能量變化關系的示意圖，如圖4所示，示出了在混響室兩個聲源同時發聲時，采用本發明方法計算各傳聲器拾取的語音幀能量，傳聲器陣列中各傳聲器拾取的語音信號語音幀的歸一化能量變化關系。圖5為在混響室兩個聲源同時發聲時，傳聲器陣列的輸出信號中各通道語音幀所占的平均權重變化關系的示意圖，如圖5所示，在混響室兩個聲源同時發聲時，采用本發明方法計算各傳聲器拾取的語音幀能量，傳聲器陣列的輸出信號中各通道語音幀所占的平均權重變化關系。可以看出，本發明能根據各傳聲器拾音的語音幀能量大小自動切換，并且切換過程自然穩定，各傳聲器拾取的語音信號經過本發明方法處理后，傳聲器陣列的輸出語音信號音質流暢自然。圖6為在普通房間兩個聲源相互切換發聲時，傳聲器陣列中各傳聲器拾取的語音信號語音幀的歸一化能量變化關系的示意圖，如圖6所示，示出了在普通房間兩個聲源相互切換發聲時，采用本發明方法計算各傳聲器拾取的語音幀能量，傳聲器陣列中各傳聲器拾取的語音信號語音幀的歸一化能量變化關系。圖7為在普通房間兩個聲源相互切換發聲時，傳聲器陣列的輸出信號中各通道語音幀所占的平均權重變化關系的示意圖，如圖7所示，在普通房間兩個聲源相互切換發聲時，采用本發明方法計算各傳聲器拾取的語音幀能量，傳聲器陣列的輸出信號中各通道語音幀所占的平均權重變化關系。可以看出，本發明能根據各傳聲器拾音的語音幀能量大小而自動切換，并且切換過程自然穩定，各傳聲器拾取的語音信號經過本發明方法處理后，傳聲器陣列的輸出語音信號音質流暢自然，混響降低。圖8為在普通房間兩個聲源同時發聲時，傳聲器陣列中各傳聲器拾取的語音信號語音幀的歸一化能量變化關系的示意圖，如圖8所示，在普通房間兩個聲源同時發聲時，采用本發明計算各傳聲器拾取的語音幀能量，傳聲器陣列中各傳聲器拾取的語音信號語音幀的歸一化能量變化關系；圖9為在普通房間兩個聲源同時發聲時，傳聲器陣列的輸出信號中各通道語音幀所占的平均權重變化關系的示意圖，如圖9所示，在普通房間兩個聲源同時發聲時，采用本發明計算各傳聲器拾取的語音幀能量，傳聲器陣列的輸出信號中各通道語音幀所占的平均
9權重變化關系。可以看出，本發明能根據各傳聲器拾音的語音幀能量大小自動切換，并且切換過程自然穩定，各傳聲器拾取的語音信號經過本發明的方法處理后，傳聲器陣列的輸出語音信號音質流暢自然。通過以上步驟處理的語音信號可以以數字信號的方式輸出，也可以數模轉換后模擬信號輸出。圖10為本發明基于傳聲器陣列的語音信號處理裝置的組成結構示意圖，如圖10 所示，所述裝置包括第一確定單元100、第二確定單元101、計算單元102和輸出單元103 ；其中，第一確定單元100，用于確定各指向性傳聲器接收的相同幀的語音信號的能量值；第二確定單元101，用于根據所述能量值確定所述相同幀的各語音信號的調整參數；計算單元102，用于根據各語音信號的調整參數確定語音信號中各取樣點信號的權值，將各語音信號中各取樣點信號與各自的權值相乘，并對各語音信號的對應取樣點信號的乘積值進行累加；輸出單元103，用于將累加后的取樣點信號依次輸出。本發明中，傳聲器陣列由兩個以上的指向性傳聲器構成。上述第二確定單元101進一步將所述相同幀的各語音信號的能量值分別與最大的能量值作商；并對各商值進行指數調整處理，作為各語音信號的調整參數。上述第二確定單元101進一步將各商值的E次方作為各語音信號的調整參數；其中，E為大于等于2小于等于10的正數。上述計算單元102進一步按下式計算語音信號中各取樣點信號的權值Wi(n) = AWi(n-l) + (l-A)C；^^, w, (n)為傳聲器i中的當前語音信號幀中第n 個取樣點信號的權值，Wi(n-l)為傳聲器i中的當前語音信號幀中第n-1個取樣點信號的權值八為預先設定的遺忘因子，0< A < 1 ;C為當前語音信號幀的調整參數。上述計算單元102進一步按下述方式計算語音信號中各取樣點信號的權值Wi(n) = AWi(n-l) + (l-A)C；^^, w, (n)為傳聲器i中的當前語音信號幀中第n 個取樣點信號的初始權值，Wi(n-1)為傳聲器i中的當前語音信號幀中第個取樣點信號的初始權值；、為預先設定的遺忘因子，0 < A < 1 ;C為當前語音信號幀的調整參數；按下式對&(11)進行處理，將成0)作為傳聲器i中的當前語音信號幀中第n個取樣點信號的最終權值上述傳聲器陣列為圓形陣列或球形陣列；所述傳聲器陣列中的傳聲器數量為3至 16個。本領域技術人員應當理解，圖10所示的基于傳聲器陣列的語音信號處理裝置是為實現前述的基于傳聲器陣列的語音信號處理方法而設計的，圖10所示裝置中各處理單元的功能可參照前述方法的描述而理解，各處理單元的功能可通過運行于處理器上的程序而實現，也可通過具體的邏輯電路而實現。
以上所述，僅為本發明的較佳實施例而已，并非用于限定本發明的保護范圍。
權利要求
一種基于傳聲器陣列的語音信號處理方法，其特征在于，所述傳聲器陣列由兩個以上的指向性傳聲器構成；所述方法包括確定各指向性傳聲器接收的相同幀的語音信號的能量值；根據所述能量值確定所述相同幀的各語音信號的調整參數；根據各語音信號的調整參數確定語音信號中各取樣點信號的權值，將各語音信號中各取樣點信號與各自的權值相乘，并對各語音信號的對應取樣點信號的乘積值進行累加，將累加后的取樣點信號依次輸出。
2.根據權利要求1所述的方法，其特征在于，所述根據所述能量值確定所述相同幀的各語音信號的調整參數，為將所述相同幀的各語音信號的能量值分別與最大的能量值作商；對各商值進行指數調整處理，并作為各語音信號的調整參數。
3.根據權利要求2所述的方法，其特征在于，所述對各商值進行指數調整處理，并作為各語音信號的調整參數，為將各商值的E次方作為各語音信號的調整參數；其中，E為大于等于2小于等于10的正數。
4.根據權利要求1所述的方法，其特征在于，所述根據各語音信號的調整參數確定語音信號中各取樣點信號的權值，具體按下式計算Wi (n) = XWi(n-l) + (l-X)C;其中，Wi(n)為傳聲器i中的當前語音信號幀中第η個取樣點信號的權值，Wi(H-I)為傳聲器i中的當前語音信號幀中第n-1個取樣點信號的權值； λ為預先設定的遺忘因子，0 < λ < 1 ；C為當前語音信號幀的調整參數。
5.根據權利要求1所述的方法，其特征在于，所述根據各語音信號的調整參數確定語音信號中各取樣點信號的權值，為Wi (n) = XWi(n-l) + (l-X)C;其中，Wi(n)為傳聲器i中的當前語音信號幀中第η個取樣點信號的初始權值，Wi (n-1)為傳聲器i中的當前語音信號幀中第n-1個取樣點信號的初始權值；λ為預先設定的遺忘因子，0 < λ < 1 ;C為當前語音信號幀的調整參數；按下式對Wi (η)進行處理，并將戌(《)作為傳聲器i中的當前語音信號幀中第η個取樣點信號的最終權值 Wi (η)＝wi(n)/max(w1(n),w2(n),……wn(n))，其中，maxO為取最大值計算。
6.根據權利要求1至5任一項所述的方法，其特征在于，所述傳聲器陣列為圓形陣列或球形陣列；所述傳聲器陣列中的傳聲器數量為3至16個。
7.一種基于傳聲器陣列的語音信號處理裝置，其特征在于，所述傳聲器陣列由兩個以上的指向性傳聲器構成；所述裝置包括第一確定單元、第二確定單元、計算單元和輸出單元；其中，第一確定單元，用于確定各指向性傳聲器接收的相同幀的語音信號的能量值；第二確定單元，用于根據所述能量值確定所述相同幀的各語音信號的調整參數；計算單元，用于根據各語音信號的調整參數確定語音信號中各取樣點信號的權值，將各語音信號中各取樣點信號與各自的權值相乘，并對各語音信號的對應取樣點信號的乘積值進行累加；輸出單元，用于將累加后的取樣點信號依次輸出。
8.根據權利要求7所述的裝置，其特征在于，所述第二確定單元進一步將所述相同幀的各語音信號的能量值分別與最大的能量值作商；并對各商值進行指數調整處理，作為各語音信號的調整參數。
9.根據權利要求8所述的裝置，其特征在于，所述第二確定單元進一步將各商值的E次方作為各語音信號的調整參數；其中，E為大于等于2小于等于10的正數。
10.根據權利要求7所述的裝置，其特征在于，所述計算單元進一步按下式計算語音信號中各取樣點信號的權值Wi (n) = XWi(n-l) + (l-X)C;其中，Wi(n)為傳聲器i中的當前語音信號幀中第η個取樣點信號的權值，Wi(H-I)為傳聲器i中的當前語音信號幀中第n-1個取樣點信號的權值； λ為預先設定的遺忘因子，0 < λ < 1 ；C為當前語音信號幀的調整參數。
11.根據權利要求7所述的裝置，其特征在于，所述計算單元進一步按下述方式計算語音信號中各取樣點信號的權值Wi (n) = XWi(n-l) + (l-X)C;其中，Wi(n)為傳聲器i中的當前語音信號幀中第η個取樣點信號的初始權值，Wi (n-1)為傳聲器i中的當前語音信號幀中第n-1個取樣點信號的初始權值；λ為預先設定的遺忘因子，0 < λ < 1 ;C為當前語音信的調整參數；按下式對&(11)進行處理，將成…)作為傳聲器i中的當前語音信號幀中第η個取樣點信號的最終權值
12.根據權利要求7至11任一項所述的裝置，其特征在于，所述傳聲器陣列為圓形陣列或球形陣列；所述傳聲器陣列中的傳聲器數量為3至16個。
全文摘要
本發明公開了一種基于傳聲器陣列的語音信號處理方法，所述傳聲器陣列由兩個以上的指向性傳聲器構成；所述方法包括確定各指向性傳聲器接收的相同幀的語音信號的能量值；根據所述能量值確定所述相同幀的各語音信號的調整參數；根據各語音信號的調整參數確定語音信號中各取樣點信號的權值，將各語音信號中各取樣點信號與各自的權值相乘，并對各語音信號的對應取樣點信號的乘積值進行累加，將累加后的取樣點信號依次輸出。本發明同時公開了一種基于傳聲器陣列的語音信號處理裝置。本發明計算方式簡單，不需要復雜的計算和電路，具有良好的抗混響和定向拾音功能。
文檔編號G10L21/0216GK101867853SQ201010197159
公開日2010年10月20日申請日期2010年6月8日優先權日2010年6月8日
發明者何宏森, 袁浩, 邱小軍, 黃志宏申請人:中興通訊股份有限公司

完整全部詳細技術資料下載