專利名稱:根據聲音確定人緊張狀態的方法和實現所述方法的裝置的制作方法
技術領域:
本發明涉及分析人對語言測試的心理生理反應的方法和裝置。本發明可以用于醫學 目的和司法實踐中,并且還適用于作決定的日常活動。
背景技術:
各種用來參數化表露緊張的聲音信號的方法和裝置是眾所周知的。公開號為 WO0062279
公開日為2000年10月19日的國際申請公開了一種確定人的下意識反應 的裝置和方法。該裝置包括連接各種聲源如電話、麥克風或者互聯網的模數轉換器,聲 音頻譜分析儀,展現聲音結果的演示儀如擴音器或者以圖表、圖形或某些圖示形式展示 視覺結果的顯示器。該方法包括對模擬聲音段進行數字化計算、分析已計算的數值、展 示說話人模擬聲音中的興奮,并指示它們以便追蹤所展示的興奮。該已知方法的缺點在 于不足以精確分析特定測試結果;不能保證對特定測試者的響應進行真實辨別;不能 對正在回答問題的測試者的誠實性作出可靠性的結論,因而需要通過改變問題的形式來 重復證實。
公開號為WO 952021
公開日為1995年7月27日的國際申請公開了一種控制人 的情緒狀態的方法和裝置。該控制情緒狀態的方法包括檢測人的聲振動、過濾所檢測的 振動并接收剩余信號、比較剩余信號以獲得結果、歸納一致的前后剩余信號以便評估聲 振動、展示超過聲振動的評估、確定說話者一些情緒狀態的指示。該控制情緒狀態的裝 置包括聲音檢測器;反向和反向濾波器;剩余信號之間關系的互相關器;最大程度地 重疊前后信號以便評估聲振動的積分器;以及處理和測量受測興奮成分、積累、確定和 分析人的情緒狀態的處理器。上述方法的缺點是不能確定所使用數據和數據處理過程 是否適中,作出的決定帶有主觀性,因為使用大量共享的統計方法來對受試者是否誠實 作出決定,這增加了對受測者不誠實的有可能的無理指控的錯誤風險。
公開號為WO 99223
公開日為1999年5月6日的國際申請披露了對選作原型 (prototype)的人類語言的情感成分進行自動分類的裝置和方法。該裝置包含用于接收、 記錄和分析聲音信號的單元,用于對聲音信號頻譜特性進行測量、計算和分類的單元, 以及用于顯示緊張狀態結果的單元。該方法包括接收、記錄和分析聲音信號,以便在展示至少一個特征的特性時,建立其重要性和數值;測量、計算和分類位于至少兩個計 算窗口的計時中的聲音信號頻譜特征,其中所述窗口用來統計處理、不誠實聲音 (insincerely sounded)的頻譜掃描、分類及顯示緊張狀態結果。上述裝置的缺點是,增 加了對各種干擾的敏感性,不足以適當選擇和處理分離頻譜的初始參數,因而降低了所 獲結果的可靠性。
發明內容
本發明要解決的技術問題是,通過從聲音的頻譜特征中選擇最有關的初始參數,以 及通過使用最合適的模型處理這種初始參數,以便基于本發明的通用累加參數計算緊張 值,來增加根據人的聲音的頻譜特征確定人的緊張狀態結果的可靠性和準確性。
本發明提出一種根據聲音確定一個人緊張狀態的方法,包括如下步驟接收一定時 間間隔的聲音信號;計算所接收聲音信號的頻譜特征;根據所計算的頻譜特征確定緊張 狀態的級別;以及顯示所確定的緊張狀態的結果。本發明的新特征是當計算頻譜特征 時,計算所接收的聲音信號頻譜的至少四個參數基頻、頻譜強度、頻譜中值和頻譜寬 度;當確定緊張狀態的級別時,為四個參數中的每一個計算無量綱歸一化緊張參數,其 中所述無量綱歸一化緊張參數顯示每個頻譜參數的緊張狀態,并且大小為0到1,緊張 狀態的級別被確定為所有被計算的歸一化緊張參數的加權平均值。
為了計算頻譜特征,最好使用重疊的多個聲音信號窗口,其重疊部分至少為串口寬 度的一半。
另外,為了計算,采用聲音信號窗口計算的條件是在采用的聲音信號窗口陣列中, 無聲的聲音信號窗口不超過一個,和/或任意一對有聲聲音信號窗口中的基頻的相對偏差 不超過20%。
當計算每個歸一化緊張參數時,先計算該歸一化緊張參數的緊張因子Z,將其計算 為參數算術平均值與參數當前值之間的相對偏差和參數局部平均值與參數當前值之間 的相對偏差之和,然后將歸一化緊張參數計算為1/ (l+ez)。
在這種情況下,最好把50 — 500赫茲的頻率范圍內頻譜特征的最大值的基頻作為基 頻的當前值。
最好把頻譜強度計算為頻譜特征平方的累加(integral)。 最好把頻譜的中值計算為頻譜特征的加權平均值,其中頻率被用作權重。 最好把頻譜寬度計算為頻譜特征超出預置閾值的最大與最小頻率差值,例如先預置閾值為2-8%,把該閾值下的頻譜特征歸為零。
在確定緊張狀態級別的步驟中,最好將計算出的所有歸一化緊張參數的加權平均值 確定為其算術平均值。
可利用一定范圍內的可見光波的光發射來顯示已確定的緊張狀態結果,其中所發射 光波的波長取決于緊張狀態的級別。
在這種情況下,顯示所確定的緊張狀態級別,使得所發射的光波的波長隨著所確定 的緊張狀態級別值在其可能值范圍內的增減而增減。例如,綠光用于顯示緊張狀態級別 的最小值,黃光用于顯示緊張狀態級別的平均值,紅光用于顯示緊張狀態級別的最大值。
所確定的緊張狀態結果可通過振動顯示,其中,振動頻率取決于所確定的緊張狀態 級別的值。
在這種情況下,顯示所確定的緊張狀態級別,使得振動頻率隨著所確定的緊張狀態 級別值而在其可能值范圍內的增加或減小,而增加或減少直至降至零。例如,振動頻率 可能值中的最小振動頻率或不振動用來顯示緊張狀態的最小值,振動頻率可能值中的平 均振動頻率用來顯示緊張狀態級別的平均值,振動頻率用可能值中的最大振動頻率來顯
示緊張狀態級別的最大值。
另外,本發明提出了一種根據聲音確定人的緊張狀態的裝置,包括接收單元,用 于接收一定時間間隔內的聲音信號;處理單元,用于計算接收到的已轉換為數字形式的 聲音信號頻譜的頻譜特征,并根據所計算的頻譜特征確定紫張狀態的,;顯示單元, 用于顯示所確定的緊張狀態的結果。本發明的新特征是,處理單元能夠根據上述方法計 算接收到的聲音信號的頻譜特征和確定緊張狀態的級別。
顯示單元可以是在可視光波范圍內發光的發光裝置,其中發光光波的波長取決于處
理單元所確定的緊張狀態級別值。例如,當緊張狀態級別具有其可能值中的最小值時, 發光裝置能夠發綠光,當緊張狀態級別具有其可能值中的平均值時,發光裝置發黃光, 當緊張狀態級別具有其可能值中的最大值時,發光裝置發紅光。
顯示單元可以是振動裝置,其中,振動頻率取決于處理單元所確定的緊張狀態級別。 例如,當緊張狀態級別具有可能值中的最小值時,振動裝置能夠用其可能值中的直至零 的最小振動頻率振動,當緊張狀態級別具有可能值中的平均值時,振動裝置能夠用其可 能值中的平均振動頻率振動,當緊張狀態級別具有可能值中的最大值時,振動裝置能夠 用可能值中的最大振動頻率振動。
該裝置的所有單元都可被組合到一個便攜式裝置中,或并入到一個計算機內或一個計算機化裝置內,這些裝置可從以下組中選擇數字錄音電話機;移動電話;數字錄音 攝像機;掌上電腦。
本發明通過實施例結合以下附圖特征詳細描述。
圖l是本發明裝置的示意框圖2是本發明方法的基本步驟的方框簡圖3是本發明的一種實施方式的示意圖。
具體實施例方式
圖1顯示了本發明裝置的示意框圖。
如圖1所示,通過聲音確定人的緊張狀態的裝置1包括接收單元2,用于接收一
定時間間隔的聲音信號;處理單元3,用于計算所接收到的轉換為數字形式的聲音信號 頻譜的頻譜特征,并根據所計算的頻譜特征確定緊張狀態級別;顯示單元4,用于顯示 所確定的緊張狀態的結果。
裝置2-4都可用計算機或計算機化裝置的軟件-硬件來實現。
接收單元2用于按一定時間間隔接收數字形式或模擬形式的聲音采樣信號,模擬形 式的聲音采樣信號隨后被轉換為數字形式,以便在處理單元3中進一步處理聲音信號的 數據。實時聲音信號或存儲在任意已知有形介質中的一定時間間隔內的聲音信號片段可 以用作聲音采樣信號。例如,由計算機聲卡、數字錄音電話和其它裝置轉換成數字形式 的來自麥克風的聲音信號可以用作實時聲音信號,并且經由包括有線、無線的各種廣播 網(電視、無線電)和其它通信網絡接收的聲音信號也可以用作實時聲音信號。為了存 儲聲音信號片段,可以使用任意的磁或光信息介質和基于微處理器的數據存儲裝置。需 要注意的是,可用數字形式或模擬形式將聲音信號片段記錄和存儲到介質上,模擬形式 的聲音信號隨后在接收單元2中被轉換為數字形式。還應注意的是,記錄和存儲在介質 上的聲音信號片段可以是帶有視頻信號的音頻信號,需要時,分離出該音頻信號并將其 轉換成數字形式。任意軟件-硬件裝置,如聲卡、USB端口、無線通信卡(無線的,紅 外線的,藍牙的)、各種磁盤(FD,CD,DVD)盤驅動等可以用作接收單元2,它們能夠 把數字或模擬形式的聲音信號送入計算機或計算化裝置,其中模擬形式的信號隨后被轉 換為數字形式。處理單元3用于計算由接收單元2接收并轉換為數字形式的聲音信號的頻譜譜特 征,并根據所計算的頻譜特征確定緊張狀態的級別。通過使用基于已知計算機或計算機 化裝置的任意軟件-硬件工具的中央處理器以及裝載有實現本發明方法的獨立裝置,可 以實施處理單元3。
圖2示出了由處理單元3處理的本發明方法的基本步驟310 — 380的方框簡圖,下 面對其進行描述。
開始前,將所有在前接收和計算的聲音信號的數據和頻譜特征的參數復位(步驟 310)。首先,處理單元3接收來自接收單元2的數字形式的聲音信號數據塊(步驟320)。 通過利用任意公知方法獲取聲音信號的頻譜特征,來處理所收到的數據塊(步驟330)
在長期研究過程中,本申請人發現頻譜的以下四個初始參數(即從頻譜直接計算得 出的參數)是最有關的參數基音頻率或基頻(FTF),頻譜強度,頻譜中值,頻譜寬度。 也就是說,這四個參數足以用來確定緊張狀態的級別,所得結果的精確度超過95%,下 面將進一步說明。
當執行步驟340時,依據已獲得的頻譜特征算出上述四個頻譜參數。 當根據在前記錄和存儲的聲音采樣信號的數據進行計算時,利用相互重疊一半寬度 的窗口執行計算。這樣,每個時間計數屬于兩個計算窗口。然而,當根據實時數據計算 時,計算是通過最后的短時間間隔完成的。
假如聲音信號的音量足以認為該信號是重要的,則將50-500赫茲范圍內將具有最 大頻譜特征的頻率作為FTF的當前值。但是,應當指出,當根據存儲的采樣信號計算時, 當不存在一個以上的無聲窗口與以前的和更早以前的(采樣信號)時,采用一個窗口計 算,而且,任意一對有聲窗口的FTF的相對偏差不超過20%。當在實時模式計算時, 可以忽略該項。
當計算頻譜強度時,通常采用強度是頻譜特征平方的累加這樣一個被普遍接受的概念。
頻譜中值這樣計算成為相應頻率的頻譜特征值的乘積之和除以頻譜特征值之和。 考慮到頻譜特征可以被存儲為陣列,可以采用陣列索引代替頻率,并且推導出的商隨后 可以變為積分索引,所以可以采用頻率的相應值。換句話說,頻譜中值是頻譜特征的加 權平均值,其中頻率是權重。
為了計算頻譜寬度,需要給出一些閾值,此閾值下的頻譜特征被有條件地認為是零 (在這種情況下,基于統計,閾值取5%)。頻譜特征超過該閾值的最大與最小頻率之間的差值取作頻譜寬度。
此外,當存儲裝置(RAM)具有基于某些在前數據塊的用于頻譜四個初始參數的先 前計算數據時,更新該先前數據(步驟350)。
此外,當執行步驟360時,根據頻譜四個初始參數的更新值,利用下式計算滿足四 個初始參數之每個的四個緊張因子
Z = (M-P)/M + (L —P)/L,
其中 M是相應初始參數的算術平均值
L是相應初始參數的局部平均值
p是相應初始參數的當前值
而且,局部平均值按以下方式計算
當只有一個數據時,假設I^P,因為僅有的一個數據無法比較。
如果有邊界數據,則意味著初始參數僅僅有在前值以及僅僅有后續值,在實時模式 計算時經常出現這種情況,當沒有任何的后續值(這可以理解)時,按下式進行計算
L = (2'P + P0Ut)/3,
其中,P。ut是具有邊界值的參數的相鄰值(例如,在前值)。
如果有內部數據,則意味著初始參數的先前值和隨后值兩者都存在,此時按下式進
行計算
L = (P—+2.P + P+)/4, 其中, P-是參數的在前值 P+是參數的后續值
這樣,執行步驟360后,得出四個無量綱(dimensionless)的緊張因子,用于在步 驟370開始時,按下式計算四個無無量綱歸一化緊張參數,以便用頻譜的相關參數顯示 緊張狀態
緊張值=1/(1+62).
得出的歸一化緊張值通常在0到1之間,并且當緊張因子接近正無窮大值時,歸一 化緊張值接近零,或當緊張因子接近負無窮大值時,歸一化緊張值趨于l。所以,歸一 化緊張因子隨著緊張因子的增加而單調減小。原則上,四個歸一化緊張值之每個都可以 被使用,以便根據該無量綱參數的值辨別緊張狀態的級別,然而,為了增加結果的準確 性,當執行步驟370時,計算累加的無量綱參數緊張值z,這使得緊張和緊張狀態級別 更精確地顯示為所得的四個歸一化緊張參數的加權平均值。正如研究所證明的那樣,在這種情況下算術平均值可作為加權平均值使用。
此外,當執行步驟380時,顯示單元4輸出處理單元3的計算結果的命令就形成了 。 這樣做時,命令本身取決于計算的累加緊張值2;。此時,由于緊張值z在0到l之間,當 緊張值Z約等于零時,就命令顯示單元4顯示不存在緊張,而當緊張值j;約等于1時,就 命令顯示單元4顯示存在強烈緊張,當緊張值z是中間值時,就命令顯示單元4顯示與 該緊張值i;成比例的緊張狀態。
此外,處理單元3從接收單元2接收數字形式的聲音信號數據塊,若接收到,則對 該數據塊重復執行步驟320 — 380。
顯示單元4用于顯示處理單元3接收的緊張狀態結果,它通過直接顯示緊張值£和 通過顯示對應于緊張值2:或緊張值^;的某些值區間的各種信號,來顯示緊張狀態的當前級 別。在此,顯示單元4可以是內置的任何能夠把結果顯示為圖形、光或其它信息的外圍 裝置。另一例子將說明顯示各種信號的一些實施方式。
圖3給出了本發明一個實施例的示意圖,是一個利用聲音的便攜式緊張測試儀,它 可作為一個小裝飾品或一個掛件。
在該實施例中,便攜式緊張檢測器1包括基于微處理器實現的上述單元2-4,在此 情況下,接收單元2包括麥克風5,顯示單元包括三色光板和振動器7,三色光板具有 紅、黃、綠三個發光二極管6,發光二極管像交通信號燈排列,振動器7由壓電元件實 現,類似于普通移動電話中使用的用于振動呼叫或振動音調的振動器。單元2-4按照與 上述方式相同的方式工作,并且具有可以結合使用或單獨使用的顯示所獲得的結果的兩 個實施例。
在僅利用發光顯示的實施例中,發光二極管6之一的發光依賴于由處理單元3按下 述方式計算的緊張值S的當前值。當緊張值2=0,0-0,3時,綠色發光二極管發光,表示緊 張狀態(包括興奮)不存在或很小,這證明由麥克風5獲取的話語足夠誠實。當總緊張 值Z二0,3-0,7時,黃色發光二極管發光,表示緊張狀態不存在或很小,這證明由麥克風 5獲取的話語興奮,也就是,話語的誠實性值得可疑。當緊張值s^0,7-l,0時,紅色發 光二極管發光,表示緊張狀態值很大,這證明由麥克風5獲取的話語的興奮級別最大, 也就是,該話語很可能不誠實。如此類似于交通信號燈的燈光信號,容易被使用者識別。
在利用振動顯示的實施例中,當緊張值z小于O,l時振動器7不振動,當緊張值z二 0.1時,振動器7就以它的可能的頻率之中的最小頻率振動;振動頻率隨著緊張值j;的增 加而成比例增加,當緊張值j;約為1或等于1時,振動頻率達到最大。顯而易見的是,從軟件的角度看本發明提出的裝置很簡單,并可與公知的處理聲音 信號的計算機化裝置結合,比如這些計算機化裝置可以是數字錄音電話機,移動電話, 數字錄音攝像機,掌上電腦。
給出的例子僅僅用來說明本發明的一些實施例,而不是用來限制權利要求表述的的 法律保護范圍,也就是說,本領域的專業人員很容易采用其它的步驟用于本發明的其它 實施例。
權利要求
1.一種根據聲音確定人的緊張狀態的方法,包括如下步驟接收一定時間間隔內的聲音信號;計算所接收聲音的頻譜特征;根據所計算的頻譜特征確定緊張狀態的級別;以及顯示所確定的緊張狀態的結果;其特征在于,當計算頻譜特征時,計算所接收聲音信號的頻譜的至少四個參數基頻,頻譜強度,頻譜中值,頻譜寬度;當確定緊張狀態的級別時,為所述四個參數之每個計算無量綱歸一化緊張參數,其中所述無量綱標準化緊張參數顯示頻譜每個參數的緊張狀態并在0至1之間,緊張狀態的級別被確定為所有被計算的歸一化進展參數的加權平均值。
2. 根據權利要求1所述的方法,其中,至少其一半窗口寬度重疊的聲音信號窗口用于計算頻譜特征。
3. 根據權利要求2所述的方法,其中,聲音信號窗口用于計算的條件是在所采用的聲音信號窗口陣列中,無聲聲音信號窗口不超過一個。
4. 根據權利要求2所述的方法,其中,聲音信號窗口用于計算的條件是任意一對有聲聲音信號窗口中的基頻的相對偏差不超過20% 。
5. 根據權利要求l的方法,其中,當計算每個歸一化緊張參數時,先計算該歸一化緊張參數的緊張因子Z,將其計算為該參數算術平均值與該參數當前值之間的相對偏差和該參數局部平均值與該參數當前值之間的相對偏差之和,然后將歸一化緊張參數計算為1/(l+ez)。
6. 根據權利要求5所述的方法,其中,把50-500赫茲頻率范圍的頻譜特征的最大值的基頻作為基頻的當前值。
7. 根據權利要求1所述的方法,其中,把頻譜強度計算為頻譜特征平方的累加(integral)。
8. 根據權利要求1所述的方法,其中,把頻譜的中值計算為頻譜特征的加權平均值,其中頻率被用作權重。
9. 根據權利要求1所述的方法,其中,把頻譜的寬度計算為頻譜特征超過預置閾值的最大與最小頻率的差值。
10. 根據權利要求9所述的方法,其中,當計算頻譜寬度時,閾值被預置為2-8%,該閾值之下的頻譜特征被認為是零。
11. 根據權利要求1的所述方法,其中,所有被計算的歸一化緊張參數的加權平均值被確定為其算術平均值。1
12. 根據權利要求l-ll所述的方法,其中,用可見光波范圍內的發光顯示所確定的緊張狀態的結果,其中發出的光波波長取決于緊張狀態級別的值。
13. 根據權利要求12所述的方法,其中,顯示所確定的緊張狀態級別,使發射的光波波長隨著所確定的緊張狀態級別值在其可能值范圍內的增減而增減。
14. 根據權利要求13所述的方法,其中,綠光用于顯示緊張狀態級別的最小值,黃光用于顯示緊張狀態級別的平均值,紅光用于顯示緊張狀態級別的最大值
15. 根據權利要求1-11所述的方法,其中,所確定的緊張狀態結果用振動顯示,其中的振動頻率取決于所確定的緊張狀態的級別的值。
16. 根據權利要求15所述的方法,其中,顯示已確定的緊張狀態級別,使振動頻率隨著所確定的緊張狀態級別值在其可能值范圍內增加或降低而增加或降低直至降為零。
17. 根據權利要求16所述的方法,其中,使用振動頻率的可能值中最小振動頻率或不振動來顯示緊張狀態級別的最小值,用振動頻率可能值中的平均振動頻率來顯示緊張狀態級別的平均值,用振動頻率可能值中的最大振動頻率來顯示緊張狀態級別的最大值。
18. —種根據聲音確定人緊張狀態的裝置,包括接收單元,用于接收一定時間間隔內的聲音信號;處理單元,用于計算所接收的已轉換為數字形式的聲音信號的頻譜特征,并根據所計算的頻譜特征確定緊張狀態的級別;顯示單元,用于顯示所確定的緊張狀態的結果,其中處理單元能夠計算所接收的聲音信號的頻譜的頻譜特征,并用權利要求1-11之一的方法,根據所計算的頻譜特征確定緊張狀態的級別。
19. 根據權利要求18所述的裝置,其中,顯示單元是在可視光波范圍內發光的發光裝置,其中發射的光波的波長取決于處理單元所確定的緊張狀態級別的值。
20. 根據權利要求19的裝置,其中,當緊張狀態級別具有其可能值中的最小值時,發光裝置可能發綠光,當緊張狀態級別具有其可能值中的平均值時,發光裝置發黃光,當緊張狀態級別具有其可能值中的最大值時,發光裝置發紅光。
21. 根據權利要求18的裝置,其中,顯示單元是振動裝置,其中振動頻率取決于處理單元所確定的緊張狀態級別。
22. 根據權利要求21所述的裝置,其中,當緊張狀態級別具有可能值中的最小值時,振動裝置能夠用可能值中的直至零的最小振動頻率振動,當緊張狀態級別具有可能值中的平均值時,振動裝置能夠用其可能值中的平均振動頻率振動,當緊張狀態級別具有可能值中的最大值時,振動裝置能夠用其可能值中的最大振動頻率振動。
23. 根據權利要求21所述的裝置,其中,該裝置的所有單元都被組合到單個便攜式裝置中。
24. 根據權利要求21的裝置,其中,該裝置的所有單元都被并入到計算機或計算機化裝置內。
25.根據權利要求24的裝置,其中,該計算機化裝置可從以下組中選取數字錄音電話機;蜂窩電話;數字錄音攝像機;掌上電腦。
全文摘要
本發明涉及分析人對語言測試的心理生理反應的方法和裝置。本發明的裝置(1)用于實現本發明的確定緊張狀態的方法,該裝置包括用于接收諸如來自麥克風(5)的聲音信號的接收單元;處理單元,用于根據基于頻譜特征的一個無量綱參數確定緊張狀態的級別,該頻譜特征例如是頻譜的基頻、強度、中值和寬度;用于顯示緊張狀態的顯示單元,例如包括發光裝置(6)或振動產生裝置(7),其中光波的波長或振動頻率取決于緊張狀態的級別。
文檔編號G10L17/00GK101517636SQ200680056026
公開日2009年8月26日 申請日期2006年10月3日 優先權日2006年10月3日
發明者安德烈·耶夫根尼耶維奇·納茲德拉堅科 申請人:安德烈·耶夫根尼耶維奇·納茲德拉堅科