麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種基于Fisher分類器組的連續型數據預處理方法與流程

文檔序號:12365740閱讀:437來源:國知局
本發明屬于數據處理
技術領域
,尤其涉及一種基于Fisher分類器組的連續型數據預處理方法。
背景技術
:隨著人工智能技術的不斷發展,模擬人類嗅覺感知過程的人工嗅覺系統應運而生,該系統由“氣體傳感器陣列”和“模式識別”兩大部分構成。其中,“氣體傳感器陣列”由多種具有廣譜響應的氣體傳感器組成,對各種氣體產生不同的“響應圖譜”;“模式識別”部分則利用合適的數學模型對“響應圖譜”進行判別,為保證識別結果的準確性與魯棒性,通常需要在圖譜數據進入“模式識別”方法之前進行“數據預處理”。當前的人工嗅覺系統“數據預處理”方法主要包括主成分分析(PCA)、獨立分量分析(ICA)、時頻變換、歸一化處理等。PCA以多維信號相關性作為判斷準則,在降維過程中盡可能多地保留有用信息;ICA則以信號獨立性為判斷依據,對信號進行分解與重組,但存在信號分解過程中會損失原始信號中的幅度信息;時頻變換則適用于有效信號與干擾信號頻率特性明顯相異的情況;歸一化處理著重于解決信號幅度差異過大對模式識別方法造成的影響。然而,以上數據預處理方法的處理原則并不以最優分類為目標,即預處理過程中可能將有益于分類的信息剔除而保留某些對分類無用的信息,進而導致:對于同一分類器,往往數據經過預處理后的分類準確率弱于預處理前。因此需要一種以分類準確率為導向的數據預處理方法,保證在不增加分類器復雜度的情況下,獲得較好的分類準確率。技術實現要素:本發明的目的在于提供一種基于Fisher分類器組的連續型數據預處理方法,旨在解決
背景技術
中提及的問題。本發明提供一種基于Fisher分類器的人工嗅覺系統數據預處理方法,該基于Fisher分類器的人工嗅覺系統數據預處理方法為:使用Fisher判別準則生成多個Fisher分類器,組成Fisher分類器組:依據訓練樣本類別,由兩類樣本組成n個訓練子集,利用訓練子集Xn生成n個Fisher判別模型,生成n個Fisher分類器,形成Fisher分類器組;將各樣本原始數據輸入Fisher分類器組獲得輸出,最后將這些輸出結果通過非線性連續函數進行映射,并將映射結果作為數據預處理結果。該基于Fisher分類器組的連續型數據預處理方法包括以下步驟:步驟一、訓練子集選擇與生成:通過獲得若干組觀察數據與所屬類別的信息作為算法模型建立的依據,每一條信息稱為一個訓練樣本,若干訓練樣本組成訓練集;若訓練樣本有k類,k≥2;則依據訓練樣本類別,由兩類樣本組成個訓練子集,訓練子集Xn表示為:Xn={{xi},{xj}};其中,i,j∈{1,2,…,n}且i≠j,{xi}和{xj}分別表示訓練集中第i和第j類樣本的集合;步驟二、Fisher分類器組生成:利用訓練子集Xn生成Fisher判別模型yn=fn(x),步驟如下:1)求Xn中i,j兩類樣本的均值和2)求類內散度矩陣Swn:Swn=Σx∈{xi}(x-xi‾)(x-xi‾)T+Σx∈{xj}(x-xj‾)(x-xj‾)T;]]>其中是的轉置矩陣;3)求類間散度矩陣Sbn:Sbn=|xi‾-xj‾|;]]>4)求投影方向Wn:Wn=Swn-1·Sbn;5)求Fisher判別閾值w0n:w0n=Wn·(xi‾+xj‾);]]>則得訓練子集Xn對應的判別模型:yn=fn(x)=Wn·x-w0n;6)按照步驟1)至步驟5)的方法求出每個訓練子集對應的Fisher判別模型,生成個Fisher分類器,形成Fisher分類器組,則分類器組輸出可表示為:y~={y1,y2,...,yn}={f1(x),...,fk(k-1)2(x)};]]>步驟三、非線性連續型函數映射方法包括:利用非線性連續函數對Fisher分類器組輸出進行映射,令為第n個Fisher分類器輸出的非線性映射且:其中a(a>0)是為增強算法泛化性能而引入的松弛變量;若Fisher分類器組由k個分類器組成,則為數據預處理結果。進一步,使用人工嗅覺系統對測試物質,進行分類識別,人工嗅覺系統由32個氣敏傳感器組成,每種測試物質進行12次采集,每次采集過程中清潔空氣即基線采集時間為3分鐘,被測物進樣時間為3分鐘,清洗時間為4分鐘;每次采集完成后,將第i個傳感器的響應記為Δri:Δri=rigas-ribase;]]>其中為被測物進樣階段第i個傳感器響應的平均值,為基線采集階段第i個傳感器響應的平均值,則每次采集可獲得一個32維的樣本,對于每種物質的樣本,取其中3個作為訓練樣本,剩余為測試樣本,松弛變量取a=5.76。本發明所涉方法優勢在于:1、相較于其它數據預處理方法,利用Fisher分類器組將樣本的類別信息作為先驗知識,使預處理后的數據更易被正確分類;2、利用多個簡單的二分類器進行數據映射,為分類器在多分類場景下提供更多有用信息;3、“非線性連續函數”映射可減小連續空間中奇異值和野值對后續分類器的影響;綜上,本發明所涉方法可提高分類器在多分類識別中的正確率。現有技術中,數據歸一化后,不采用任何預處理方法正確識別率為92.06%,使用PCA方法并取第1和第2主成分作為預處理結果正確識別率為50.79%;本發明提出的方法正確識別率為96.83%。附圖說明圖1是本發明實施例提供的基于Fisher分類器組的連續型數據預處理方法流程圖。具體實施方式為了使本發明的目的、技術方案及優點更加清楚明白,以下結合實施例,對本發明進行進一步詳細說明。應當理解,此處所描述的具體實施例僅僅用以解釋本發明,并不用于限定本發明。下面結合附圖對本發明的應用原理作詳細的描述。如圖1所示:本發明實施例的基于Fisher分類器組的連續型數據預處理方法包括以下步驟:S101:使用Fisher判別準則生成多個Fisher分類器,組成Fisher分類器組:依據訓練樣本類別,由兩類樣本組成n個訓練子集,利用訓練子集Xn生成n個Fisher判別模型,生成n個Fisher分類器,形成Fisher分類器組;S102:將各樣本原始數據輸入Fisher分類器組獲得輸出,最后將這些輸出結果通過非線性連續函數進行映射,并將映射結果作為數據預處理結果。該基于Fisher分類器組的連續型數據預處理方法具體包括以下步驟:步驟一、訓練子集選擇與生成:通過獲得若干組觀察數據與所屬類別的信息作為算法模型建立的依據,每一條信息稱為一個訓練樣本,若干訓練樣本組成訓練集;若訓練樣本有k類,k≥2;則依據訓練樣本類別,由兩類樣本組成個訓練子集,訓練子集Xn表示為:Xn={{xi},{xj}};其中,i,j∈{1,2,…,n}且i≠j,{xi}和{xj}分別表示訓練集中第i和第j類樣本的集合;步驟二、Fisher分類器組生成:利用訓練子集Xn生成Fisher判別模型yn=fn(x),步驟如下:1)求Xn中i,j兩類樣本的均值和2)求類內散度矩陣Swn:Swn=Σx∈{xi}(x-xi‾)(x-xi‾)T+Σx∈{xj}(x-xj‾)(x-xj‾)T;]]>其中是的轉置矩陣;3)求類間散度矩陣Sbn:Sbn=|xi‾-xj‾|;]]>4)求投影方向Wn:Wn=Swn-1·Sbn;5)求Fisher判別閾值w0n:w0n=Wn·(xi‾+xj‾);]]>則得訓練子集Xn對應的判別模型:yn=fn(x)=Wn·x-w0n;6)按照步驟1)至步驟5)的方法求出每個訓練子集對應的Fisher判別模型,生成個Fisher分類器,形成Fisher分類器組,則分類器組輸出可表示為:y~={y1,y2,...,yn}={f1(x),...,fk(k-1)2(x)};]]>步驟三、非線性連續型函數映射方法包括:利用非線性連續函數對Fisher分類器組輸出進行映射,令為第n個Fisher分類器輸出的非線性映射且:其中a(a>0)是為增強算法泛化性能而引入的松弛變量;若Fisher分類器組由k個分類器組成,則為數據預處理結果。下面結合具體實施例對本發明的應用原理作進一步描述。實施例1:使用人工嗅覺系統對七種物質,包括:啤酒、白酒、葡萄酒、綠茶、紅茶、烏龍茶和普洱茶,進行分類識別。人工嗅覺系統由32個氣敏傳感器組成,系統對傳感器陣列響應的采樣速率為1Hz,采樣精度為16bit。每種測試物質進行12次采集,共計84次采集。每次采集過程中清潔空氣(基線)采集時間為3分鐘,被測物進樣時間為3分鐘,清洗時間為4分鐘。每次采集完成后,將第i個傳感器的響應記為Δri:Δri=rigas-ribase;]]>其中為被測物進樣階段第i個傳感器響應的平均值,為基線采集階段第i個傳感器響應的平均值,則每次采集可獲得一個32維的樣本,樣本共計84個。對于每種物質的樣本,取其中3個作為訓練樣本,其余為測試樣本。松弛變量取a=5.76。數據預處理方式有3種:①不采用任何預處理方法;②使用PCA方法并取第1和第2主成分作為預處理結果;③本發明提出的方法;模式識別方法:k近鄰法(k-NN)。數據預處理方法識別正確率無92.06%PCA方法50.79%本專利方法96.83%以上所述僅為本發明的較佳實施例而已,并不用以限制本發明,凡在本發明的精神和原則之內所作的任何修改、等同替換和改進等,均應包含在本發明的保護范圍之內。當前第1頁1 2 3 
當前第1頁1 2 3 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 绥阳县| 广昌县| 拉萨市| 饶阳县| 星子县| 通辽市| 尼勒克县| 汉阴县| 泸州市| 永康市| 南开区| 邻水| 盘锦市| 班戈县| 当阳市| 武清区| 安庆市| 墨竹工卡县| 淮北市| 江门市| 唐山市| 武宁县| 始兴县| 奇台县| 霞浦县| 凤庆县| 体育| 武宁县| 岳阳市| 甘德县| 杭锦后旗| 安康市| 灵丘县| 江都市| 深圳市| 凤凰县| 晴隆县| 英吉沙县| 辉南县| 新昌县| 南京市|