麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種小型說話人情感識別系統(tǒng)的制作方法

文檔序號:2828100閱讀:483來源:國知局
一種小型說話人情感識別系統(tǒng)的制作方法
【專利摘要】一種小型說話人情感識別系統(tǒng),首先建立了一個小型的情感語音庫,將其中一部分語音做訓練樣本,用于構建參考模板;另一部分做測試樣本,用于后續(xù)的情感識別實驗,然后對已獲得語音庫中的語音進行預處理,對預處理之后的語音信號進行情感參數的提取工作,情感參數包括基音頻率、共振峰、梅爾頻率倒譜系數及其相關統(tǒng)計參數。之后是進行語音情感識別實驗,將訓練語音的情感參數用基于支持向量機的情感分類器進行分類,之后再用其對測試語音進行預測,判斷其屬于何種情感。
【專利說明】一種小型說話人情感識別系統(tǒng)

【技術領域】
[0001]本發(fā)明涉及的是一種語音情感識別系統(tǒng),特別涉及一種小型說話人情感識別系統(tǒng)。
[0002]

【背景技術】
語音是人與人之間交流的重要手段,聲音是信息的載體,人們可以通過聲音來獲得其中的信息,其中自然包括情感信息。語音是人類相互交流的一種重要工具,也是傳遞情感的一種重要媒介。語音信號所包含的不止是文字信息,同時還夾雜著人的情感。同樣是一句話,其中可以包含不同的情感,而情感不同,那么這句話的意思就有可能發(fā)生變化,如果計算機無法從操作者的語音中獲得其情感,那么就不可能達到最佳的交流效果,甚至有可能會對操作者的意思產生誤解,從而產生誤動作,給操作者帶來不便。
[0003]語音信號處理是一個重要的研究領域,至今已有很長的研究歷史,而語音信號的情感研究則是一個新興領域,但它是一個綜合了多類學科的研究課題。其中主要包含了生理學、心理學、以及信號處理等重要學科。同時該課題的研究成果一語音情感識別系統(tǒng)具有相當寬廣的應用前景,具體可以應用在:
1、遠程網絡教學,在遠程網絡教學系統(tǒng)中可以加入情感識別系統(tǒng),通過判斷學習者的情感表達是否得體,可以讓學習者更好的提高帶有豐富情感的朗讀能力。
[0004]2、用于刑偵領域,情感識別系統(tǒng)可以制作成一個測謊儀,利用其推斷測試者的語言真實程度。隨著技術的不斷提高,可以不斷完善測謊儀的功能并將其用于現實中,因此情感識別系統(tǒng)對于刑偵領域來說也具有相當重要的實際意義。
[0005]3、娛樂游戲,目前大多數游戲都是通過文字來傳達信息,而如果在游戲中加語音的情感識別及表達則可以豐富信息的傳遞方式,同時也更能吸引玩家。通過這種新穎的方式可以在一定程度上緩解玩家在游戲過程中的疲勞度,玩家也能同時獲得聽覺與視覺上的享受,增加了游戲的可玩程度。
[0006]


【發(fā)明內容】

本發(fā)明的目的是提供一種利用一個小型的情感語音庫利用其作為語音做訓練樣本,用于構建參考模板,對每種情感的識別率進行統(tǒng)計的人情感識別系統(tǒng)。
[0007]本發(fā)明的目的是這樣實現的:本發(fā)明的第一步工作是在閱讀了國內外大量資料的基礎上建立了一個小型的情感語音庫,將其中一部分語音做訓練樣本,用于構建參考模板;另一部分做測試樣本,用于后續(xù)的情感識別實驗。第二步是對已獲得語音庫中的語音進行預處理,其步驟主要包括預加重、加窗分幀以及語音端點檢測。第三步是對預處理之后的語音信號進行情感參數的提取工作,情感參數包括基音頻率、共振峰、梅爾頻率倒譜系數及其相關統(tǒng)計參數。用軟件對參數的提取進行仿真實驗,得到不同情感類型的各個參數的分布范圍,并對結果進行簡要的分析。第四步是進行語音情感識別實驗,將訓練語音的情感參數用基于支持向量機的情感分類器進行分類,之后再用其對測試語音進行預測,判斷其屬于何種情感。實驗之后對每種情感的識別率進行統(tǒng)計,對最終的統(tǒng)計結果進行分析。最后,為整個系統(tǒng)設計了一個簡單的人機界面,該界面可以完成輸入測試語音、顯示系統(tǒng)對該語音的識別結果以及對結果進行清空的功能。
[0008]自己錄制一個小規(guī)模的漢語情感語音庫,庫中語音的情感分為四類:喜悅、憤怒、悲傷、驚奇。錄制者為6人均為男生,每人對4個語音文本分別用4種情感進行朗讀,每種情感朗讀4遍,總共獲得384個樣本作為實驗用情感語音庫。采用SVM的方法對情感進行分類,其中SVM采用“一對一”方法來解決多分類的問題。最后分別用語音的韻律特征包括基音及共振峰的相關參數、語音特征MFCC相關參數及兩者結合作為情感特征做了識別,并對識別結果進行了分析對比。實驗中,在用全部11個參數進行識別時,最終所得到的4種情感的平均識別率為79.15%,悲傷的識別率最高為83.3%。同時發(fā)現,喜悅與憤怒這兩種情感之間最容易發(fā)生誤識別現象。

【專利附圖】

【附圖說明】
[0009]圖1為語首情感識別流程圖。

【具體實施方式】
[0010]下面結合附圖舉例對本發(fā)明做更詳細地描述:
實施例1
結合圖1,圖1為語音情感識別流程圖。1、情感語音庫的獲取。由于目前語音情感識別都是針對他國語言而言的,漢語在這方面的研究則開展的相對較少,找不到一個專門用于情感識別的漢語情感語音庫。因此進行識別研究之前的準備工就是自己錄制一個小規(guī)模的漢語的情感語音庫,然后基于該語音庫進行后續(xù)研究。2、語音信號的預處理。由于語音信號的特點,對于語音庫中的語音信號并不能直接提取其中的情感特征參數,必須先進行一步前端處理,包括預加重、加窗分幀及端點檢測。3、情感特征參數的提取。預處理之后則是提取信號中的情感特征參數,其中主要包括兩種類別,一類是聲學特征參數,包括12階MFCC參數和共振峰參數。另一類是韻律特征參數,包括語音的基音頻率,短時能量,平均過零率等參數。并在此基礎上進行了細化,最終選取了基音頻率平均值、最大值、最小值,第一共振峰平均值、最大值,以及MFCC的第10個、11個、12個參數作為情感特征參數。4、情感分類器的設計。本發(fā)明采用了基于支持向量機(Support Vector Machine)的語音情感分類器的設計,由于目前的svm都只適用于二分類,而如果要實現多分類,則需要在每兩個樣本間設計一個svm,在需要對未知樣本進行分類時,則要通過投票來最終確定其類別。這就是所謂的“一對一”法。
【權利要求】
1.一種小型說話人情感識別系統(tǒng),其特征在于:本發(fā)明的第一步工作是在閱讀了國內外大量資料的基礎上建立了一個小型的情感語音庫,將其中一部分語音做訓練樣本,用于構建參考模板;另一部分做測試樣本,用于后續(xù)的情感識別實驗;第二步是對已獲得語音庫中的語音進行預處理,其步驟主要包括:預加重、加窗分幀以及語音端點檢測;第三步是對預處理之后的語音信號進行情感參數的提取工作,情感參數包括基音頻率、共振峰、梅爾頻率倒譜系數及其相關統(tǒng)計參數;用軟件對參數的提取進行仿真實驗,得到不同情感類型的各個參數的分布范圍,并對結果進行簡要的分析;第四步是進行語音情感識別實驗,將訓練語音的情感參數用基于支持向量機的情感分類器進行分類,之后再用其對測試語音進行預測,判斷其屬于何種情感;實驗之后對每種情感的識別率進行統(tǒng)計,對最終的統(tǒng)計結果進行分析;最后,為整個系統(tǒng)設計了一個簡單的人機界面,該界面可以完成輸入測試語音、顯示系統(tǒng)對該語音的識別結果以及對結果進行清空的功能。
2.根據權利要求1所述的一種小型說話人情感識別系統(tǒng),其特征在于:錄制一個小規(guī)模的漢語情感語音庫,庫中語音的情感分為四類:喜悅、憤怒、悲傷、驚奇;采用3穩(wěn)的方法對情感進行分類,其中3穩(wěn)采用“一對一”方法來解決多分類的問題;最后分別用語音的韻律特征包括基音及共振峰的相關參數、語音特征即⑶相關參數及兩者結合作為情感特征做識別。
【文檔編號】G10L25/63GK104464756SQ201410750977
【公開日】2015年3月25日 申請日期:2014年12月10日 優(yōu)先權日:2014年12月10日
【發(fā)明者】馮秀霞 申請人:黑龍江真美廣播通訊器材有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 定结县| 阿拉善左旗| 遂宁市| 固安县| 聂荣县| 盐城市| 武清区| 沧州市| 文昌市| 莎车县| 西华县| 博乐市| 泗洪县| 蓬溪县| 平塘县| 大城县| 凤城市| 彭泽县| 登封市| 北流市| 册亨县| 太保市| 海阳市| 凤山县| 江口县| 延安市| 南涧| 翁牛特旗| 永新县| 安乡县| 惠东县| 富顺县| 长宁县| 天等县| 仙居县| 玉环县| 佛学| 基隆市| 合肥市| 济阳县| 九龙县|