一種語音通話方法及裝置制造方法
【專利摘要】本發明公開了一種語音通話方法,所述方法包括:接收通話語音X(t),并對所述語音X(t)進行去噪,得到去噪后的語音X0(t);確定所述去噪后的語音X0(t)的幅度均值小于存儲的原語音Y(t)的幅度均值時,對所述去噪后的語音X0(t)進行增強后輸出。本發明同時還公開了一種語音通話裝置。采用本發明的技術方案,能夠在不允許大聲講話的場合中也能進行清晰的通話。
【專利說明】一種語音通話方法及裝置
【技術領域】
[0001]本發明涉及移動通信領域的語音識別技術,尤其涉及了一種在周圍環境不允許用戶大聲講話的場合中的語音通話方法及裝置。
【背景技術】
[0002]隨著移動通信技術的不斷發展,移動終端如手機等已經成為人們日常生活中不可缺少的通信設備,其最主要的作用就是進行通話,人們通過通話來增強和聯絡感情。但是,用戶在通話時經常會受到周圍環境的影響,在某些環境中接到電話后不能大聲講話,只能通過很小的聲音來表達意思,比如在看電影、開會等場合,這樣,對方可能無法聽清楚用戶的聲音,影響雙方交流。
[0003]目前,一般的移動終端在通話時,都只是通過麥克風將聲音接收并傳輸給對方,但在不方便大聲講話的場合中接到電話的用戶在接電話時只能低頭小聲說,同時還伴有其他聲音,如開會時演講者的聲音、看電影時電影屏幕的聲音等,這樣,如果直接將聲音傳輸給對方就會使對方不好進行辨認,影響通話質量;因此,亟需一種語音通話方法來保證這種安靜場合的通話效果。
【發明內容】
[0004]有鑒于此,本發明實施例的主要目的在于提供一種語音通話方法及裝置,能夠在周圍環境不允許用戶大聲講話的場合中也能進行清晰地通話。
[0005]為達到上述目的,本發明的技術方案是這樣實現的:
[0006]本發明提供了一種語音通話方法,所述方法包括:接收通話語音X(t),并對所述語音x(t)進行去噪,得到去噪后的語音XtlU);確定所述去噪后的語音XtlU)的幅度均值小于存儲的原語音Y(t)的幅度均值時,對所述去噪后的語音XtlU)進行增強后輸出。
[0007]上述方案中,所述方法還包括:存儲原語音Y(t),并提取所述原語音Y(t)的幅度均值。
[0008]上述方案中,所述對所述語音X(t)進行去噪,包括:分別對所述語音x(t)和存儲的原語音Y(t)進行快速傅里葉變換,得到所述語音的頻域信號X(W)和所述原語音的頻域信號Y(W);根據所述語音的頻域信號X(W)和所述原語音的頻域信號Y(W),確定所述語音中噪聲的頻域信號;將所述語音的頻域信號X(W)與所述噪聲的頻域信號進行卷積,確定所述去噪后的語音的頻域信號;對所述去燥后的語音的頻域信號進行逆快速傅里葉變換,得到去噪后的語音Xo (t)。
[0009]上述方案中,所述對所述去噪后的語音進行增強為:根據所述原語音Y(t)的幅度均值對所述去噪后的語音Xtl(t)進行增強,包括:確定所述去噪后的語音XtlU)的當前幅度均值;根據所述原語音Y(t)的原幅度均值和所述當前幅度均值確定語音增強系數η ;根據所述語音增強系數η對所述去噪后的語音Xtl (t)進行增強。
[0010]上述方案中,所述方法還包括:確定所述去噪后的語音XtlU)的幅度均值大于等于所述原語音Y(t)的幅度均值時,將所述去噪后的語音Xtl(t)直接輸出。
[0011]本發明還提供了一種語音通話裝置,所述裝置包括接收單元、去噪單元、處理單元和輸出單元;其中,所述接收單元,用于接收通話語音X(t);所述去噪單元,用于對所述語音x(t)進行去噪,得到去噪后的語音XtlU);所述處理單元,用于確定所述去噪后的語音X0ω的幅度均值小于存儲的原語音Y(t)的幅度均值時,對所述去噪后的當前語音XtlU)進行增強;所述輸出單元,用于對增強后的語音進行輸出。
[0012]上述方案中,所述裝置還包括:存儲單元和提取單元;其中,所述存儲單元,用于存儲原語音Y(t);所述提取單元,用于提取所述原語音Y(t)的幅度均值。
[0013]上述方案中,所述去噪單元進一步包括第一變換子單元、第一確定子單元、第二確定子單元和第二變換子單元;其中,所述第一變換子單元,用于分別對所述語音X(t)和存儲的原語音Y(t)進行快速傅里葉變換,得到所述語音的頻域信號X(W)和所述原語音的頻域信號Yb);所述第一確定子單元,用于根據所述語音的頻域信號Χ(?)和所述原語音的頻域信號Yb),確定所述語音中噪聲的頻域信號;所述第二確定子單元,用于將所述語音的頻域信號Χ(?)與所述噪聲的頻域信號進行卷積,確定所述去噪后的語音的頻域信號;所述第二變換子單元,用于對去燥后的語音的頻域信號進行逆快速傅里葉變換,得到去噪后的語音\ (t)。
[0014]上述方案中,所述處理單元,進一步用于根據所述原語音Y(t)的幅度均值對所述去噪后的語音Xtl(t)進行增強,具體的,所述處理單元包括第三確定子單元、第四確定子單元和增強子單元,其中:所述第三確定子單元,用于確定所述去噪后的語音Xtl(t)的當前幅度均值;所述第四確定子單元,用于根據所述原語音Y(t)的原幅度均值和所述當前幅度均值確定語音增強系數η ;所述增強子單元,用于根據所述語音增強系數η對所述去噪后的語音XtlU)進行增強。
[0015]上述方案中,所述處理單元還用于:確定所述去噪后的語音XtlU)的幅度均值大于等于所述原語音Y(t)的幅度均值時,觸發所述輸出單元;對應的,所述輸出單元,還用于將所述去噪后的語音Xtl (t)直接輸出。
[0016]本發明實施例提供的語音通話方法及裝置,接收通話語音X(t)后,先對所述語音x(t)進行去噪,得到去噪后的語音XtlU);再在確定所述去噪后的語音XtlU)的幅度均值小于存儲的原語音Y(t)的幅度均值時,對所述去噪后的語音XtlU)進行增強后輸出;如此,能夠使用戶在不方便大聲說話的場合下仍然能夠得到較好的通話效果,同時,還能將周圍的雜音進行有效去除,接聽的對方不會再受聽不清的困擾,另外也不會影響到周圍的人。
【專利附圖】
【附圖說明】
[0017]圖1為本發明實施例語音通話方法的實現流程示意圖;
[0018]圖2為本發明實施例中對所述去噪后的語音進行增強的一種實現流程示意圖;
[0019]圖3為本發明實施例語音通話裝置的組成結構示意圖;
[0020]圖4為圖3中去噪單元的組成結構示意圖;
[0021]圖5為圖3中增強單元的組成結構示意圖。
【具體實施方式】
[0022]本發明實施例的基本思想是:接收通話語音后,先對所述語音進行去噪,得到去噪后的語音;再在確定所述去噪后的語音的幅度均值小于存儲的原語音的幅度均值時,對所述去噪后的語音進行增強后輸出。
[0023]下面結合附圖和具體實施例對本發明的技術方案進一步詳細闡述。
[0024]圖1為本發明實施例語音通話方法的實現流程示意圖,如圖1所示,所述語音通話方法的具體流程如下:
[0025]步驟101,存儲原語音Y(t),并提取所述原語音Y(t)的幅度均值;
[0026]具體的,用戶可以尋找一個沒有噪聲和雜音的安靜場合,打開錄音裝置,錄入一段自己正常說話時的聲音作為原語音Y (t)。
[0027]這里,所述提取原語音Y (t)的幅度均值的目的是:當判斷用戶在通話過程中的語音的幅度均值小于正常說話的原語音的幅度均值時,為了防止對方聽不清楚,可根據原語音的幅度均值對正在通話的語音的幅度均值進行增強,以使對方能夠清楚的聽到用戶的講話。
[0028]其中,所述提取所述原語音Y (t)的幅度均值,本領域的技術人員可以根據各種現有技術來實現,這里不再贅述。
[0029]步驟102,接收通話語音X(t),并對所述語音X(t)進行去噪,得到去噪后的語音X0⑴;
[0030]這里,所述接收通話語音的環境可以是任何場合,尤其是指一些不方便大聲講話的場合,例如:看電影、看歌劇、看話劇、開會、工作等的場合。用戶在這些不方便大聲講話的場合,接到呼入電話或進行呼出電話后不能大聲講話,只能通過很小或低的聲音來表達意思,從而會使對方無法聽清楚用戶的聲音,進而影響雙方交流的場合。
[0031]這里,所述語音X(t)可以是通過麥克風等接收的語音;所述語音X(t)包括:用戶音量很小的聲音和遠大于用戶說話聲音的音量的背景噪聲。
[0032]這里,所述對所述語音X (t)進行去噪,包括:
[0033]步驟1021,分別對所述語音X(t)和存儲的原語音Y(t)進行快速傅里葉變換(FFT7Fast Fourier Transform),得到所述語音的頻域信號X(w)和所述原語音的頻域信號
Y(W);
[0034]步驟1022,根據所述語音的頻域信號X (w)和原語音的頻域信號Y (w),確定所述語音中噪聲的頻域信號;
[0035]具體的,將所述語音的頻域信號X' (w)與原語音的頻域信號Y' (w)相減,得到噪聲的頻域信號;
[0036]步驟1023,將所述語音的頻域信號X(W)與所述噪聲的頻域信號進行卷積,確定所述去噪后的語音的頻域信號;
[0037]步驟1024,對所述去燥后的語音的頻域信號進行逆快速傅里葉變換(IFFT,Inverse Fast Fourier Transform),得到去噪后的語音 X。(t)。
[0038]這里,在分別對所述語音X(t)和存儲的原語音Y(t)進行快速傅里葉變換之前,所述對所述語音進行去噪還包括:分別將所述語音x(t)和所述原語音Y(t)進行加漢明(Hanning)窗處理。
[0039]這里,所述對所述語音X(t)進行去噪是為了去除遠大于用戶聲音的背景噪聲。在現有技術中,對語音需進行去噪的方法有很多,本領域的技術人員可以根據各種現有技術對語音進行去噪。
[0040]步驟103,確定所述去噪后的語音XtlU)的幅度均值小于存儲的原語音Y (t)的幅度均值時,對所述去噪后的語音XtlU)進行增強后輸出。
[0041]這里,所述增強是指對去噪后的語音XtlU)的幅度進行提升,以將用戶語音的音量進行放大,這樣,在不允許大聲說話的場合,通話雙方就可以進行正常清晰的通話。
[0042]優選的,所述對所述去噪后的語音XtlU)進行增強為:根據原語音Y(t)的幅度均值對所述去噪后的語音Xtl (t)進行增強。
[0043]優選的,本發明實施例語音通話方法還包括:確定所述去噪后的語音XtlU)的幅度均值大于等于存儲的原語音Y(t)的幅度均值時,將所述去噪后的語音XtlU)直接輸出。
[0044]圖2為本發明實施例中對所述去噪后的語音進行增強的一種實現流程示意圖,如圖2所示,根據原語音Y(t)的幅度均值對所述去噪后的語音XtlU)進行增強,具體包括以下步驟:
[0045]步驟201,確定所述去噪后的語音X。(t)的當前幅度均值;
[0046]步驟202,根據所述原語音Y (t)的原幅度均值和所述當前幅度均值確定語音增強系數η ;
[0047]具體的,假設存儲的原語音Y(t)的原幅度均值為PY (t) P,假設所述當前幅度均值為PXtl (t) P,用所述PY⑴P除以所述PXtl⑴P得到所述語音增強系數η ;
[0048]步驟203,根據所述語音增強系數η對所述去噪后的語音Xtl (t)進行增強。
[0049]具體的,將所述去噪后的語音XtlU)乘以所述語音增強系數n,得到用戶正常說話時音量的語音數據;在實際的應用過程中,本發明實施例中還應包括:將對所述去噪后的語音XtlU)進行增強后得到的正常語音從數字信號轉化為模擬信號后進行輸出,相應的,在通過麥克風等接收含有噪聲的語音x(t)時,還應該將所述X(t)轉化為數字信號,這里,所述模擬信號轉數字信號,以及數字信號轉模擬信號,本領域的技術人員均可以采用各種現有技術來實現,這里不再贅述。
[0050]圖3為本發明實施例語音通話裝置的組成結構示意圖,如圖3所示,本發明實施例語音通話裝置,包括接收單元31、去噪單元32、處理單元33和輸出單元34 ;
[0051]所述接收單元31,用于接收通話語音X(t);
[0052]所述去噪單元32,用于對所述語音X(t)進行去噪,得到去噪后的語音XtlU);
[0053]所述處理單元33,用于確定所述去噪后的語音XtlU)的幅度均值小于存儲的原語音Y(t)的幅度均值時,對所述去噪后的語音XtlU)進行增強;
[0054]所述輸出單元34,用于對增強后的語音進行輸出。
[0055]優選的,所述裝置還包括:存儲單元和提取單元;其中,所述存儲單元,用于存儲原語音Y(t);所述提取單元,用于提取所述原語音的幅度均值。
[0056]優選的,所述處理單元33還用于:確定所述去噪后的語音XtlU)的幅度均值大于等于所述原語音Y(t)的幅度均值時,觸發所述輸出單元34 ;相應的,所述輸出單元34,還用于將所述去噪后的語音XtlU)直接輸出。
[0057]優選的,所述處理單元33對所述去噪后的語音XtlU)進行增強為:根據所述原語音Y(t)的幅度均值對所述去噪后的語音XtlU)進行增強。
[0058]圖4為圖3中去噪單元的組成結構示意圖,如圖4所示,所述去噪單元32進一步包括第一變換子單元41、第一確定子單元42、第二確定子單元43和第二變換子單元44 ;其中,
[0059]所述第一變換子單元41,用于分別對所述語音X(t)和存儲的原語音Y(t)進行快速傅里葉變換,得到所述語音的頻域信號X(W)和所述原語音的頻域信號Y(W);
[0060]所述第一確定子單元42,用于根據所述語音的頻域信號X(W)和所述原語音的頻域信號Y(W),確定所述語音中噪聲的頻域信號;
[0061]所述第二確定子單元43,用于將語音的頻域信號X(W)與所述噪聲的頻域信號進行卷積,確定所述去噪后的語音的頻域信號;
[0062]所述第二變換子單元44,用于對去燥后的語音的頻域信號進行逆快速傅里葉變換,得到去噪后的語音XtlU)。
[0063]圖5為圖3中處理單元的組成結構示意圖,如圖5所示,所述處理單元33進一步包括第三確定子單元51、第四確定子單元52和增強子單元53,其中:
[0064]所述第三確定子單元51,用于確定所述去噪后的語音XtlU)的當前幅度均值;
[0065]所述第四確定子單元52,用于根據所述原語音Y(t)的原幅度均值和所述當前幅度均值確定語音增強系數η;
[0066]所述增強子單元53,用于根據所述語音增強系數η對所述去噪后的語音XtlU)進行增強。
[0067]本發明實施例在具體實現的過程中,還可以相應的設置為一種通話模式,當用戶進入不方便說話的場合時,便可以打開所述通話模式,這時,當用戶有電話需要呼出或者有電話需要呼入時,就可以執行本發明實施例語音通話方法的處理流程。與現有技術相比,采用語音識別技術對用戶的聲音進行識別,將語音中的噪聲過濾掉,然后放大輸出到對方,使得用戶在小聲說話的情況下,對方仍能夠得到較好的通話效果,同時將周圍的雜音進行有效去除,不用再受對方聽不清的困擾,同時也不會影響到周圍的人。
[0068]本領域的技術人員應當理解,圖4至圖5所示的語音通話裝置中的各處理單元、子單元以及模塊的實現功能可參照前述語音通話方法的相關描述而理解。本領域技術人員還應當理解,圖4至圖5所示的語音通話裝置中各處理單元、子單元以及模塊可通過所述移動終端的處理器而實現,也可通過具體的邏輯電路而實現。
[0069]以上所述,僅為本發明的較佳實施例而已,并非用于限定本發明的保護范圍。
【權利要求】
1.一種語音通話方法,其特征在于,所述方法包括: 接收通話語音X(t),并對所述語音X(t)進行去噪,得到去噪后的語音XtlU); 確定所述去噪后的語音Xtl(t)的幅度均值小于存儲的原語音Y(t)的幅度均值時,對所述去噪后的語音XtlU)進行增強后輸出。
2.根據權利要求1所述的方法,其特征在于,所述方法還包括:存儲原語音Y(t),并提取所述原語音Y(t)的幅度均值。
3.根據權利要求1所述的方法,其特征在于,所述對所述語音X(t)進行去噪,包括: 分別對所述語音x(t)和存儲的原語音Y(t)進行快速傅里葉變換,得到所述語音的頻域信號X(W)和所述原語音的頻域信號Y(W); 根據所述語音的頻域信號X(W)和所述原語音的頻域信號Y(W),確定所述語音中噪聲的頻域信號; 將所述語音的頻域信號X(W)與所述噪聲的頻域信號進行卷積,確定所述去噪后的語音的頻域信號; 對所述去燥后的語音的頻域信號進行逆快速傅里葉變換,得到去噪后的語音XtlU)。
4.根據權利要求1所述的方法,其特征在于,所述對所述去噪后的語音進行增強為:根據所述原語音Y(t)的幅度均值對所述去噪后的語音XtlU)進行增強,包括: 確定所述去噪后的語音Xtl(t)的當前幅度均值; 根據所述原語音Y(t)的原幅度均值和所述當前幅度均值確定語音增強系數η ; 根據所述語音增強系數η對所述去噪后的語音XtlU)進行增強。
5.根據權利要求1至4任一項所述的方法,其特征在于,所述方法還包括:確定所述去噪后的語音Xtl(t)的幅度均值大于等于所述原語音Y(t)的幅度均值時,將所述去噪后的語音Xc)(t)直接輸出。
6.一種語音通話裝置,其特征在于,所述裝置包括接收單元、去噪單元、處理單元和輸出單元;其中, 所述接收單元,用于接收通話語音x(t); 所述去噪單元,用于對所述語音x(t)進行去噪,得到去噪后的語音XtlU); 所述處理單元,用于確定所述去噪后的語音XtlU)的幅度均值小于存儲的原語音Y(t)的幅度均值時,對所述去噪后的當前語音Xtl (t)進行增強; 所述輸出單元,用于對增強后的語音進行輸出。
7.根據權利要求6所述的裝置,其特征在于,所述裝置還包括:存儲單元和提取單元;其中, 所述存儲單元,用于存儲原語音Y(t); 所述提取單元,用于提取所述原語音Y(t)的幅度均值。
8.根據權利要求6所述的裝置,其特征在于,所述去噪單元進一步包括第一變換子單元、第一確定子單元、第二確定子單元和第二變換子單元;其中, 所述第一變換子單元,用于分別對所述語音X(t)和存儲的原語音Y(t)進行快速傅里葉變換,得到所述語音的頻域信號X(W)和所述原語音的頻域信號Y(w); 所述第一確定子單元,用于根據所述語音的頻域信號X(W)和所述原語音的頻域信號Y(w),確定所述語音中噪聲的頻域信號; 所述第二確定子單元,用于將所述語音的頻域信號X(W)與所述噪聲的頻域信號進行卷積,確定所述去噪后的語音的頻域信號; 所述第二變換子單元,用于對去燥后的語音的頻域信號進行逆快速傅里葉變換,得到去噪后的語音Xo (t)。
9.根據權利要求6所述的裝置,其特征在于,所述處理單元,進一步用于根據所述原語音Y(t)的幅度均值對所述去噪后的語音XtlU)進行增強,具體的,所述處理單元包括第三確定子單元、第四確定子單元和增強子單元,其中: 所述第三確定子單元,用于確定所述去噪后的語音Xtl (t)的當前幅度均值; 所述第四確定子單元,用于根據所述原語音Y(t)的原幅度均值和所述當前幅度均值確定語音增強系數η ; 所述增強子單元,用于根據所述語音增強系數η對所述去噪后的語音XtlU)進行增強。
10.根據權利要求6至9任一項所述的裝置,其特征在于,所述處理單元還用于:確定所述去噪后的語音Xtl(t)的幅度均值大于等于所述原語音Y(t)的幅度均值時,觸發所述輸出單元; 對應的,所述輸出單元,還用于將所述去噪后的語音Xtl (t)直接輸出。
【文檔編號】G10L21/0208GK104427068SQ201310404931
【公開日】2015年3月18日 申請日期:2013年9月6日 優先權日:2013年9月6日
【發明者】康健超 申請人:中興通訊股份有限公司