麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

基于語音混合信息特征協同優選判別的帕金森癥檢測裝置的制作方法

文檔序號:11252363閱讀:702來源:國知局
基于語音混合信息特征協同優選判別的帕金森癥檢測裝置的制造方法

本發明涉及電子醫療器械,具體涉及到一種基于語音混合信息特征協同優選判別的帕金森癥檢測裝置。



背景技術:

帕金森癥是一種多發于中老年的漸進性中樞神經系統變性疾病,又稱巴金森氏癥或柏金遜癥,多在60歲以后發病。在帕金森癥患者中,有50%~80%的病例起病隱襲,早期難以察覺而常被忽視,因此容易造成漏診。但該病一旦形成將對患者生活造成影響。在發病早期,患者主要表現為功能障礙,如手指震顫、語音障礙和發音困難等。有研究表明語言功能性障礙是早期帕金森癥的典型癥狀之一,有超過90%的帕金森癥患者出現聲帶損傷,并伴隨有大腦語言功能區病變。研究還表明,檢測語言功能性障礙并能對其進行分級可以通過提取帕金森癥病人語音語言學參數,并進行模式識別分類的方式。因此,檢測語言障礙將有助于實現高準確性的帕金森病早期診斷。

目前基于語音的帕金森病診斷的主流研究方法是:先提取語音特征,然后采用機器學習方法對其進行分析,實現分類。這些特征類型是通過語言病理學家先驗知識獲取的。其中包括了聲帶振動的基音頻率、頻率微擾、幅度微擾、諧波信噪比等。little等人最早利用基于核方法的支持向量機分類器對受試者的語音信號進行分類,revett等人建立粗糙集對帕金森病數據進行特征選擇,pei-fangguo等人利用遺傳算法進行了特征選擇分析,saker等人使用統計學中的集中趨勢和離差矩陣進行特征分析。上述這些研究取得了一定的分類診斷效果,大都是對特征進行優選分析或者轉換,其缺陷是:

(1)現有研究大多處于理論研究階段,產品化較少;

(2)現有的各種分類算法,在分類器訓練時難以避免誤差嚴重的樣本對分類器的誤導。



技術實現要素:

為了解決上述問題,本發明提供一種基于語音混合信息特征協同優選判別的帕金森癥檢測裝置,一方面將現有的研究算法產品化,另一方面,在分類器訓練時,通過樣本特征進行權值篩選,有效提高帕金森癥的真的準確性。

為實現上述目的,本發明所采用的具體技術方案如下:

一種基于語音混合信息特征協同優選判別的帕金森癥檢測裝置,其關鍵在于包括:信號采集器、處理器以及結果輸出模塊;

所述信號采集器:用于獲取診斷對象的語音信息;

所述處理器:包括用于提取語音特征的特征提取模塊以及預先訓練好的分類器,通過所述分類器判斷診斷對象是否屬于帕金森癥患者;

所述結果輸出模塊:用于輸出分類器的判斷結果。

進一步地,所述處理器中的分類器按以下步驟進行預先訓練:

s1:提取樣本數據集,首先選擇m個受試者,受試者中包括帕金森患者和健康者,利用信號采集器分別采集每個受試者n個語音片段,每個語音片段采集至少一種發音內容,包括連續元音字母發音、數字發音、單詞發音和短語句發音,通過特征提取模塊從每個語音片段中提取k個特征參數,從而構成樣本數據集,m、n、k均為正整數;

s2:特征集變換,將同一受試者中n個語音片段所對應的k個特征參數擴展為一個n*k維的特征矩陣,然后采用留一法交叉驗證,將樣本數據集分為訓練樣本集和測試樣本集,訓練樣本對應的測試樣本集來自于不同的受試者;

s3:權重計算和特征重構,基于訓練樣本集,采用relief算法計算混合特征的權重,基于其權重大小,構造閾值,進行特征選擇,從而得到優選后的混合特征子集;

s4:分類器訓練和測試,通過步驟s3獲得重構后的訓練樣本集與測試樣本集;設計分類器并重新對其進行訓練和測試,直到分類結果達到預設指標,訓練完成得到最終的分類器。

采用上述的技術方案,通過權重值對訓練樣本集進行篩選,對訓練樣本集進行了優選,從而可以提取出與帕金森癥相關性大的樣本數據,從而用分類器進行分類的時候,提高了分類準確性,從而提高了帕金森癥的診斷準確率。

進一步地,所述分類器為線性svm分類器、knn分類器或rf分類器。

進一步地,所述分類器為多核svm分類器。

進一步地,根據步驟s3優選后的混合特征子集,從診斷對象中提取對應的語音片段,并采集對應的特征參數,構成特征向量,輸入最終的分類器中進行分類判別,輸出測試結果。

進一步地,所述分類器采用類準確率、靈敏度以及特異度三項指標來評價其是否滿足預設條件,其中:

1)類準確率

2)靈敏度

3)特異度

其中,tp為真陽性,tn為真陰性,fp為假陽性,fn為假陰性。

進一步地,步驟s1提取樣本數據集時,選擇40個受試者,包括20個帕金森病患者,其中6個女性,14個男性,20個健康者,其中10個女性,10個男性,每個受試者分別采集到26個語音片段,然后針對每個語音片段提取出26個特征參數。

進一步地,還設置有語音引導裝置,該語音引導裝置用于輸出預設的語音片段,引導測試對象發音。通過增設語音引導裝置,將標準的語音片段預設到設備中,通過播放標準語音片段引導測試對象發音,使其臨床應用更加方便。

本發明的顯著效果是:

本發明將基于語音數據實現帕金森病診斷的方法進行了產品化實現,在分類器訓練時,通過relief算法對語音段樣本進行了優選,使得分類器的分類準確率,靈敏度及特異度均有提高,設備的臨床應用性強。

附圖說明

圖1為本發明實施例提供的原來框圖;

圖2為本發明實施例中分類器訓練的方法流程圖;

圖3為基于relief算法計算所得各個特征的權值關系圖;

圖4為所選特征數量與分類準確率的關系圖。

具體實施方式

為了使本發明要解決的技術問題、技術方案和優點更加清楚,下面將結合附圖及具體實施例進行詳細描述。

如圖1所示,本實施例提供一種基于語音混合信息特征協同優選判別的帕金森癥檢測裝置,信號采集器、處理器、存儲器、結果輸出模塊以及語音引導裝置,

所述信號采集器:通常包括麥克風和音頻信號采集模塊,用于獲取診斷對象的語音信息;

所述處理器:包括用于提取語音特征的特征提取模塊以及預先訓練好的分類器,通過所述分類器判斷診斷對象是否屬于帕金森癥患者;

所示存儲器:用于存儲訓練樣本、測試樣本以及預設的語音片段;

所述結果輸出模塊:設為顯示器輸出或語音播報輸出,用于輸出分類器的判斷結果;

所述語音引導裝置:用于輸出預設的語音片段,引導測試對象發音。

在本實施例中,語音引導裝置可以省略,臨床診斷時由醫務人員口頭引導,對應的存儲器中可以不用預先存儲語音片段,但是設置語音引導裝置后,設備的智能性和臨床應用性更強,診斷時可以直接由設備預先播報標準發音的語音片段,診斷對象跟讀設備的發音,使得語音信號采集更加標準化。

同時,如果處理器中的分類器已經訓練好,不用重復訓練的情況下,存儲器中的訓練樣本和測試樣本可以省略,設備中直接加載訓練好的分類器即可滿足分類要求,由此以來,本發明的另一實施方式是,不設置單獨的存儲器,處理器自帶存儲功能,用于存儲已經訓練好的分類器以及對應的特征提取算法。

如圖2所示,基于上述裝置,本發明的另一改進點在于所述處理器中的分類器訓練方式不同,在本實施例中按照以下方式進行:

s1:提取樣本數據集

本例中首先選擇40個受試者,包括20個帕金森病患者,其中6個女性,14個男性,20個健康者,其中10個女性,10個男性,利用信號采集器分別采集每個受試者26個語音片段,然后針對每個語音片段提取出26個特征參數。

采集過程中每個語音片段采集至少一種發音內容,包括連續元音字母發音、數字發音、單詞發音和短語句發音。

s2:特征集變換,將同一受試者中26個語音片段所對應的26個特征參數擴展為一個26*26維的特征矩陣,然后采用留一法交叉驗證,將樣本數據集分為訓練樣本集和測試樣本集,訓練樣本對應的測試樣本集來自于不同的受試者;

s3:權重計算和特征重構,基于訓練樣本集,采用relief算法計算混合特征的權重,基于其權重大小,構造閾值,進行特征選擇,從而得到優選后的混合特征子集;

relief算法最早由kira提出,最初局限于兩類數據的分類問題。relief算法是一種特征權重算法(featureweightingalgorithms),根據各個特征和類別的相關性賦予特征不同的權重,權重小于某個閾值的特征將被移除。relief算法中特征和類別的相關性是基于特征對近距離樣本的區分能力。算法從訓練集d中隨機選擇一個樣本r,然后從和r同類的樣本中尋找最近鄰樣本h,稱為nearhit,從和r不同類的樣本中尋找最近鄰樣本m,稱為nearmiss,然后根據以下規則更新每個特征的權重:如果r和nearhit在某個特征上的距離小于r和nearmiss上的距離,則說明該特征對區分同類和不同類的最近鄰是有益的,則增加該特征的權重;反之,如果r和nearhit在某個特征的距離大于r和nearmiss上的距離,說明該特征對區分同類和不同類的最近鄰起負面作用,則降低該特征的權重。以上過程重復m次,最后得到各特征的平均權重。特征的權重越大,表示該特征的分類能力越強,反之,表示該特征分類能力越弱。relief算法的運行時間隨著樣本的抽樣次數m和原始特征個數n的增加線性增加,因而運行效率非常高。

s4:分類器訓練和測試,通過步驟s3獲得重構后的訓練樣本集與測試樣本集;設計分類器并重新對其進行訓練和測試,直到分類結果達到預設指標,訓練完成得到最終的分類器。

本實施例所選擇的分類器為多核svm分類器,包括一個線性核函數和一個高斯核函數,作為同等替換,也可以選擇單獨的線性svm分類器、knn分類器或rf分類器。

本例中選定的線性核函數為:高斯核函數為:且多核svm分類器的核函數為:k(x,xi)=0.8k1(x,xi)+0.2k2(x,xi);

在具體實施時,分類器采用類準確率、靈敏度以及特異度三項指標來評價其是否滿足預設條件,其中:

1)類準確率

2)靈敏度

3)特異度

其中,tp為真陽性,tn為真陰性,fp為假陽性,fn為假陰性。

當分類器訓練達到預設標準后,利用訓練好的分類器對測試對象進行診斷,從診斷對象中提取對應的語音片段,并采集對應的特征參數,構成特征向量,輸入最終的分類器中進行分類判別,便可輸出測試結果。

在具體實施時,步驟s1中的樣本數據集也可以從現有的帕金森病數據庫中直接提取,比如選用little教授創建的數據集或sakar教授于2013年創建的training_data數據集,從而簡化訓練樣本和測試樣本信息的采集。

為進一步理解本發明的技術效果,接下來通過列舉具體數據做進一步說明。

本例中合并26個語音段的語音特征,形成676個新特征,組成混合特征集。

如圖3所示為混合特征權重圖。各特征權重值為所有受試者采用留一法交叉驗證后,每個受試者特征權重值線性疊加所得,橫坐標為語音段序號,縱坐標為特征序號。

權重值大的色塊的分布區域相對較為集中且數量較少,絕大部分色塊的權重值較小。可以發現,基于同樣的特征和不同語音段,權重差別較大。以a,b兩處色塊區域為例,其所處的特征序號為7和17。相對于第1-5個語音段來說,這兩個特征非常有效。但對于第6-9個語音段來說,這兩個特征非常差。這說明,定量分析不同語音段和特征的相互關系非常重要。結合這兩個特征和第1-5個語音段可以發現,它們的組合形成的特征權重非常大,這說明它們之間具有很明顯的協同效應。第1-5個語音段對應的是‘a’,‘o’,‘u’,‘1’,‘2’,第7個特征和第17個特征的含義分別是振幅微擾‘shimmer’及基音周期標準差‘standarddeviation’。根據語音學原理可以發現,當發這5個語音的時候,需要較好的穩定性,而振幅微擾和周期標準差能夠較好的表征(評估)發音的穩定性。由于帕金森病人存在發音障礙,當其在發這5個語音段時,難以保持較好的穩定性,因此這兩個特征就能夠在此時,精確的識別其帕金森病狀態,從而實現準確分類。

圖4為采用relief加權算法優選后混合特征數量與分類準確率的關系圖,混合特征按權重大小排序后,取前n個特征來進行分類識別,得到分類準確率。橫坐標為優選后混合特征數目,縱坐標為分類準確率。

由圖4可以看出,當混合特征達到20左右以后,分類準確率迅速上升到70%以上。當所選特征數目=363時,分類準確率達到最大,為82.5%。設比例系數k=所選特征數目/特征總數,k=1/2,準確率為80%;k=1/4,準確率80%;k=1/6,準確率為70%;k=1/8,準確率65%。可以看出混合特征數量與分類準確率關系比較明確,但大多數情況下,分類準確率變化都比較平穩。

進一步地,本發明與參考文獻sakarbe,isenkulme,sakarco,etal.collectionandanalysisofaparkinsonspeechdatasetwithmultipletypesofsoundrecordings.[j].ieeejournalofbiomedical&healthinformatics,2013,17(4):828-834所提出的算法進行了對比,具體如表1所示。

上述參考文獻中較好的分類結果是基于svm(線性和徑向基核函數)。因此,為了公平比較,本發明與其分別進行比較。此外,該表中仍然包含了上述參考文獻的分類準確率結果。

從該表可以發現,相較于現有方法,本發明取得了較為明顯的改進效果。在準確率上,本發明從67.5%提高到82.5%,改進了22%;在靈敏度上,本發明仍然保持了現有方法的最高水平80%;在特異度上,本發明從65%提高到85%,改進了30.8%。相較于參考文獻的結果,本發明從52%提高到82.5%,改進了58.6%,由此可見,其效果非常明顯,分類準確率,靈敏度及特異度均有顯著提高。

表1本發明分類結果對比

最后需要說明的是,上述描述為本發明的優選實施例,本領域的普通技術人員在本發明的啟示下,在不違背本發明宗旨及權利要求的前提下,可以做出多種類似的表示,這樣的變換均落入本發明的保護范圍之內。

當前第1頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 茌平县| 镇安县| 高陵县| 天峻县| 馆陶县| 香港 | 伽师县| 平舆县| 新密市| 台中县| 民权县| 阜城县| 惠来县| 沽源县| 通许县| 荔浦县| 吉木萨尔县| 重庆市| 锦州市| 邵东县| 朔州市| 安吉县| 手游| 宁津县| 陆良县| 竹北市| 中阳县| 寻乌县| 澄迈县| 浦县| 新邵县| 广昌县| 临沂市| 明水县| 安溪县| 汝城县| 进贤县| 五原县| 罗城| 体育| 浑源县|