1.一種基于Fisher分類器組的連續(xù)型數(shù)據(jù)預(yù)處理方法,其特征在于,該基于Fisher分類器組的連續(xù)型數(shù)據(jù)預(yù)處理方法為:
使用Fisher判別準(zhǔn)則生成n個(gè)Fisher分類器,組成Fisher分類器組:依據(jù)訓(xùn)練樣本類別,由兩類樣本組成n個(gè)訓(xùn)練子集,利用訓(xùn)練子集Xn生成n個(gè)Fisher判別模型,生成n個(gè)Fisher分類器,形成Fisher分類器組;
將各樣本原始數(shù)據(jù)輸入Fisher分類器組獲得輸出,最后將輸出結(jié)果通過非線性連續(xù)函數(shù)進(jìn)行映射,并將映射結(jié)果作為數(shù)據(jù)預(yù)處理結(jié)果。
2.如權(quán)利要求1所述的基于Fisher分類器組的連續(xù)型數(shù)據(jù)預(yù)處理方法,其特征在于,該基于Fisher分類器組的連續(xù)型數(shù)據(jù)預(yù)處理方法包括以下步驟:
步驟一、訓(xùn)練子集選擇與生成:通過獲得若干組觀察數(shù)據(jù)與所屬類別的信息作為算法模型建立的依據(jù),每一條信息稱為一個(gè)訓(xùn)練樣本,若干訓(xùn)練樣本組成訓(xùn)練集;若訓(xùn)練樣本有k類,k≥2;則依據(jù)訓(xùn)練樣本類別,由兩類樣本組成個(gè)訓(xùn)練子集,訓(xùn)練子集Xn表示為:
Xn={{xi},{xj}};
其中,且i≠j,{xi}和{xj}分別表示訓(xùn)練集中第i和第j類樣本的集合;
步驟二、Fisher分類器組生成:
利用訓(xùn)練子集Xn生成Fisher判別模型yn=fn(x),步驟如下:
1)求Xn中i,j兩類樣本的均值和
2)求類內(nèi)散度矩陣Swn:
其中是
的轉(zhuǎn)置矩陣;
3)求類間散度矩陣Sbn:
4)求投影方向Wn:
Wn=Swn-1·Sbn;
5)求Fisher判別閾值w0n:
則得訓(xùn)練子集Xn對應(yīng)的判別模型:yn=fn(x)=Wn·x-w0n;
6)按照步驟1)至步驟5)的方法求出每個(gè)訓(xùn)練子集對應(yīng)的Fisher判別模型,生成個(gè)Fisher分類器,形成Fisher分類器組,則分類器組輸出
表示為:
步驟三、非線性連續(xù)型函數(shù)映射方法包括:
利用非線性連續(xù)函數(shù)對Fisher分類器組輸出進(jìn)行映射,令
為第n個(gè)Fisher分類器輸出的非線性映射且:
其中a是為增強(qiáng)算法泛化性能而引入的松弛變量,a>0;若Fisher分類器組由k個(gè)分類器組成,則為數(shù)據(jù)預(yù)處理結(jié)果。
3.如權(quán)利要求1所述的基于Fisher分類器組的連續(xù)型數(shù)據(jù)預(yù)處理方法,其特征在于,使用人工嗅覺系統(tǒng)對測試物質(zhì),進(jìn)行分類識別,人工嗅覺系統(tǒng)由32個(gè)氣敏傳感器組成,每種測試物質(zhì)進(jìn)行12次采集,每次采集過程中清潔空氣即基線采集時(shí)間為3分鐘,被測物進(jìn)樣時(shí)間為3分鐘,清洗時(shí)間為4分鐘;
每次采集完成后,將第i個(gè)傳感器的響應(yīng)記為Δri:
其中為被測物進(jìn)樣階段第i個(gè)傳感器響應(yīng)的平均值,
為基線采集階段第i個(gè)傳感器響應(yīng)的平均值,則每次采集獲得32維樣本,對于每種物質(zhì)的樣本,取其中3個(gè)作為訓(xùn)練樣本,剩余為測試樣本,松弛變量取a=5.76。