專利名稱:利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種生鮮乳檢測方法,更具體地,涉及一種利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法。
背景技術(shù):
在生鮮乳中摻加水、糊精、植脂末、三聚氰胺等低成本物質(zhì)以牟取商業(yè)利潤是一種常見的違法行為。現(xiàn)有試紙、色譜檢測方法通常是針對某一特定摻假物進(jìn)行分離分析,因此識別不同摻假物需要經(jīng)過不同的前處理步驟后再分別進(jìn)行判定,比較費時費力。近期有學(xué)者采用商品奶進(jìn)行了若干采用近紅外技術(shù)對摻假牛奶的定性識別或定量分析的研究并取得了良好的結(jié)果。但商品奶經(jīng)過了均質(zhì)、滅菌等處理過程并加有添加劑及助劑等,其性狀和生鮮乳有著較大差異。因此欲探索近紅外技術(shù)對生鮮乳摻假識別的可行性,應(yīng)以生鮮乳為基礎(chǔ),采用接近實際情況的方式配制摻假乳樣品。本專利發(fā)明人曾收集了 2010年6-7月期間上海市以及周邊地區(qū)各個牧場未加工的生鮮乳162個,配制相同數(shù)目含氮量達(dá)標(biāo)、摻水量為1% 20%的含三聚氰胺、尿素、硝酸銨的摻假乳溶液,分別采集生鮮乳樣品和摻假乳樣品的近紅外光譜,通過比較不同光譜預(yù)處理方法及建模方法,確立最佳的近紅外判別模型,結(jié)果表明采用近紅外商業(yè)軟件建立的判別模型對未知乳樣品的判別正確率在40%左右,且無法對模型參量進(jìn)行更新,而采用自開發(fā)的IS-KNN方法(改進(jìn)與簡化的K-最鄰近法)建立的判別模型對已知摻假物類別的摻假乳的判別正確率最高可達(dá)100%,但對含有多種未知摻假物的摻假乳的判別正確率通常在80% 90%,因此,現(xiàn)有方法對于含有多種未知摻假物的摻假乳的判別正確率以及判別模型的參量更新維護還存在可提高的空間。
發(fā)明內(nèi)容
本發(fā)明提出一種利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,以提高對含有多種未知摻假物的摻假乳的判別正確率,并使判別模型參量得到更新維護。為了達(dá)到上述目的,本發(fā)明從監(jiān)控區(qū)域收集未經(jīng)加工的生鮮乳樣品,并以此為基礎(chǔ)采用各種摻假物配制摻假乳樣品,檢測其近紅外光譜,采用支持向量機法(Surprot Vector Machine, SVM)法建立生鮮乳的近紅外判別模型,以實現(xiàn)對摻假乳的快速鑒別,具體步驟如下步驟⑴采集多種生鮮乳樣品和摻假乳樣品的近紅外光譜,對應(yīng)建立生鮮乳譜庫和摻假乳譜庫;步驟(2):利用生鮮乳譜庫和摻假乳譜庫中的近紅外光譜建立判別模型,校正判別模型以得到最優(yōu)判別模型;步驟(3):采集未知是否摻假的未知乳樣品的近紅外光譜,利用最優(yōu)判別模型對未知乳樣品的近紅外光譜進(jìn)行判別,從而得到未知乳樣品的判別結(jié)果;
其中,所述步驟(2)中,采用SVM方法建立判別模型。所述步驟(3)還包括,若未知乳樣品的判別結(jié)果為假,則對該未知乳樣品進(jìn)行確證。所述步驟(3)還包括,若確證結(jié)果為假,則將該未知乳樣品的近紅外光譜加入摻假乳譜庫以更新最優(yōu)判別模型。所述步驟(3)還包括,若確證結(jié)果為真,則將該未知乳樣品的近紅外光譜加入一假陽性譜庫。所述利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,進(jìn)一步包括步驟⑷采集已知是否摻假的已知乳樣品的近紅外光譜,利用最優(yōu)判別模型對已知乳樣品的近紅外光譜進(jìn)行判別,得到已知乳樣品的判別結(jié)果,若已知乳樣品的判別結(jié)果與實際類別一致,則將已知乳樣品的近紅外光譜加入其判別結(jié)果對應(yīng)的譜庫以更新最優(yōu)判別模型。所述利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,進(jìn)一步包括步驟⑷采集已知是否摻假的已知乳樣品的近紅外光譜,利用最優(yōu)判別模型對已知乳樣品的近紅外光譜進(jìn)行判別,得到已知乳樣品的判別結(jié)果,若已知乳樣品的判別結(jié)果與實際類別不一致,則將已知乳樣品的近紅外光譜作為異常樣本保存,當(dāng)異常樣本累積超過預(yù)設(shè)數(shù)目時,將異常樣本加入其實際類別對應(yīng)的譜庫以更新最優(yōu)判別模型。所述生鮮乳譜庫或摻假乳譜庫中每添加一個新的近紅外光譜,則從該譜庫中相應(yīng)地刪除一個采集日期最早的樣品的近紅外光譜。在采集近紅外光譜之前,將生鮮乳樣品、摻假乳樣品、未知乳樣品和/或已知乳樣品在40°C下超聲處理10 20min。所述步驟(2)還包括,采用SVM方法建立判別模型之前,使用T檢驗剔除離群的近紅外光譜。所述步驟⑵還包括,采用SVM方法建立判別模型之前,采用SNV方法、MSC方法或一階導(dǎo)方法對已剔除離群樣本的近紅外光譜集進(jìn)行預(yù)處理。所述步驟(2)還包括,采用留三分之一或四分之一法校正判別模型。所述生鮮乳樣品由從監(jiān)控區(qū)域采集的未經(jīng)加工的生鮮乳制成。所述摻假乳樣品由在所述生鮮乳中添加不同種類或不同濃度的摻假溶液制成。本發(fā)明的利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,采用SVM方法建立判別模型,采用留三分之一或四分之一法校正判別模型以得到最優(yōu)判別模型,對于含有多種未知摻假物的摻假乳的判別正確率得到大幅提高,通過擴充和更新生鮮乳譜庫和摻假乳譜庫中的近紅外光譜,使最優(yōu)判別模型得到更新維護。
圖I所示為本發(fā)明的利用近紅外光譜進(jìn)行牛奶摻假識別的方法的步驟(2)的流程圖;圖2所示為本發(fā)明的利用近紅外光譜進(jìn)行牛奶摻假識別的方法的步驟(3)的流程圖。
具體實施方式
下面結(jié)合附圖詳細(xì)說明本發(fā)明的技術(shù)方案。本發(fā)明的利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,包括如下步驟步驟(I):采集多種生鮮乳樣品和摻假乳樣品的近紅外光譜,對應(yīng)建立生鮮乳譜庫和摻假乳譜庫。通常,可以從監(jiān)控區(qū)域內(nèi)采集未經(jīng)加工的生鮮乳樣品200份左右,掃描其近紅外光譜,建立生鮮乳譜庫;在每份生鮮乳中加入不同類型或不同濃度的摻假溶液,作為摻假乳樣品,掃描其近紅外光譜,建立摻假乳譜庫。由于放置一段時間的生鮮乳樣品可能出現(xiàn)分層、固形物析出、脂肪析出等現(xiàn)象,為了得到均質(zhì)的樣品溶液以保證其近紅外光譜的準(zhǔn)確性,通常在光譜采集之前先將生鮮乳樣品和摻假乳樣品在40°C下超聲處理10 20min,對于未出現(xiàn)分層、固形物析出、脂肪析出等現(xiàn)象的樣品該步驟可省略。步驟(2):利用生鮮乳譜庫和摻假乳譜庫中的近紅外光譜建立判別模型,校正判別模型以得到最優(yōu)判別模型。步驟⑵的流程如圖I所示,主要包括首先,為提高判別正確率,需要剔除明顯異常的近紅外光譜,例如可使用T檢驗剔除離群的近紅外光譜;然后,通過SNV、MSC或一階導(dǎo)方法對剔除離群樣本后的近紅外光譜集進(jìn)行預(yù)處理,以消除信號漂移、噪聲等對光譜的干擾;接下來,采用SVM方法建立判別模型,并采用留三分之一或四分之一法對判別模型進(jìn)行校正,從而得到最優(yōu)判別模型。SVM方法是Cortes和vapnik于1995年首先提出的一種基于統(tǒng)計學(xué)理論的機器學(xué)習(xí)方法,目前已被廣泛用于模式識別、函數(shù)擬合、回歸估計、密度估計、數(shù)據(jù)挖掘、三維識別、 遙感圖像分析和非線性控制等眾多領(lǐng)域。本發(fā)明創(chuàng)造性地將其運用于生鮮乳的摻假識別中。具體步驟如下(I)訓(xùn)練前檢查與空值處理;(2)對由生鮮乳譜庫和摻假乳譜庫中的近紅外光譜組成的建模集做主成分分析, 選取主成分及其載荷向量;(3)從建模集中選取訓(xùn)練集和檢驗集,輪流進(jìn)行訓(xùn)練與檢驗;(4)采用“一對一”方法進(jìn)行訓(xùn)練,共產(chǎn)生η (n-1)/2個分類超平面,其中η為類別數(shù);(5)當(dāng)η > 2時,即用于多類識別問題時,需要對分類超平面引入模糊隸屬函數(shù),建立樣本集的判別函數(shù);(6)統(tǒng)計判別正確率,校正判別模型參量。其中,可從建模集中選取三分之一或四分之一的光譜作為檢驗集,其余光譜作為訓(xùn)練集。例如,假設(shè)建模集中共有S1-S15共15個樣本,每次取其中1/3作為檢測集,第一次SI、S4、S7、S10、S13作為檢測集,其它作為訓(xùn)練集;第二次S2、S5、S8、S1US14作為檢測集,其它作為訓(xùn)練集;第三次33、36、39、312、315作為檢測集,其它作為訓(xùn)練集;如此,每個樣本都可輪流做一次檢驗集。利用訓(xùn)練集建立判別模型,利用檢驗集檢驗該判別模型的判別正確率,從而不斷校正判別模型參量,得到最優(yōu)判別模型。對于完全不同的兩類物質(zhì),采用IS-KNN方法和采用SVM方法建立的判別模型的判別正確率相差并不大,這適用于未知乳樣品中含有已知摻假物的情況,可以針對該具體摻假物進(jìn)行判別。然而在實際檢測中,未知乳樣品中可能含有多種摻假物并且并不預(yù)先知道摻假物的具體成分,這種情況下,由于SVN方法的學(xué)習(xí)功能好,適應(yīng)性寬,其中嵌入的模糊隸屬函數(shù)對判別難以歸類的樣本有優(yōu)勢,因此采用SVM方法建立的判別模型的判別正確率較高,通常在90%以上,其中摻假乳被識別出的正確率更高一些,可達(dá)95%。步驟(3):采集未知是否摻假的未知乳樣品的近紅外光譜,利用最優(yōu)判別模型對未知乳樣品的近紅外光譜進(jìn)行判別,從而得到未知乳樣品的判別結(jié)果。為了得到均質(zhì)的未知乳樣品,以保證其近紅外光譜的準(zhǔn)確性,當(dāng)未知乳樣品出現(xiàn)分層、固形物析出、脂肪析出等現(xiàn)象時,也需首先將該未知乳樣品在40°C下超聲處理10 20min。然后采集未知乳樣品的近紅外光譜,并利用最優(yōu)判別模型進(jìn)行判別,從而得到該未知乳樣品的判別結(jié)果。如圖2所示,若未知生鮮乳樣品的判別結(jié)果為假,則需對該未知乳樣品進(jìn)行確證, 例如采用液相色譜、質(zhì)譜等方法進(jìn)行確證。若確證結(jié)果為假,則可將該未知乳樣品的近紅外光譜加入摻假乳譜庫,從而不斷擴充摻假乳譜庫中的光譜數(shù)量,以便更新和優(yōu)化最優(yōu)判別模型。優(yōu)選地,當(dāng)摻假乳譜庫中每添加一個新的近紅外光譜時,相應(yīng)地從該譜庫中刪除一個采集日期最早的樣品的近紅外光譜,從而維持該譜庫中光譜數(shù)量的穩(wěn)定。若判別結(jié)果為假, 而確證結(jié)果為真,則將該未知乳樣品的近紅外光譜單獨置于一類假陽性譜庫,作為特殊樣本的比對參考。步驟(4):利用已知是否摻假的已知乳樣品的近紅外光譜對最優(yōu)判別模型進(jìn)行更新和維護。由于生鮮乳本身可能隨著季節(jié)等因素變化而存在較大差異,用于生鮮乳摻假識別的最優(yōu)判別模型需要進(jìn)行更新和維護。可定期采集已知是否摻假的已知乳樣品的近紅外光譜,利用最優(yōu)判別模型對已知乳樣品的近紅外光譜進(jìn)行判別,得到已知乳樣品的判別結(jié)果, 若已知乳樣品的判別結(jié)果與實際類別一致,則將已知乳樣品的近紅外光譜加入其判別結(jié)果對應(yīng)的譜庫;若已知乳樣品的判別結(jié)果與實際類別不一致,則將已知乳樣品的近紅外光譜作為異常樣本保存,當(dāng)異常樣本累積超過預(yù)設(shè)數(shù)目時,將異常樣本加入其實際類別對應(yīng)的譜庫,從而更新和優(yōu)化最優(yōu)判別模型。優(yōu)選地,當(dāng)生鮮乳譜庫或摻假乳譜庫中每添加一個新的近紅外光譜時,相應(yīng)地從該譜庫中刪除一個采集日期最早的樣品的近紅外光譜,從而維持該譜庫中光譜數(shù)量的穩(wěn)定。以上所述的,僅為本發(fā)明的較佳實施例,并非用以限定本發(fā)明的范圍,本發(fā)明的上述實施例還可以做出各種變化。即凡是依據(jù)本發(fā)明申請的權(quán)利要求書及說明書內(nèi)容所作的簡單、等效變化與修飾,皆落入本發(fā)明專利的權(quán)利要求保護范圍。
權(quán)利要求
1.一種利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,包括步驟(I):采集多種生鮮乳樣品和摻假乳樣品的近紅外光譜,對應(yīng)建立生鮮乳譜庫和摻假乳譜庫;步驟⑵利用生鮮乳譜庫和摻假乳譜庫中的近紅外光譜建立判別模型,校正判別模型以得到最優(yōu)判別模型;步驟(3):采集未知是否摻假的未知乳樣品的近紅外光譜,利用最優(yōu)判別模型對未知乳樣品的近紅外光譜進(jìn)行判別,從而得到未知乳樣品的判別結(jié)果;其特征在于,所述步驟(2)中,采用SVM方法建立判別模型。
2.如權(quán)利要求I所述的利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,其特征在于,所述步驟(3)還包括,若未知乳樣品的判別結(jié)果為假,則對該未知乳樣品進(jìn)行確證。
3.如權(quán)利要求2所述的利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,其特征在于,所述步驟⑶還包括,若確證結(jié)果為假,則將該未知乳樣品的近紅外光譜加入摻假乳譜庫以更新最優(yōu)判別模型。
4.如權(quán)利要求2所述的利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,其特征在于,所述步驟(3)還包括,若確證結(jié)果為真,則將該未知乳樣品的近紅外光譜加入一假陽性譜庫。
5.如權(quán)利要求3所述的利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,其特征在于,進(jìn)一步包括步驟(4):采集已知是否摻假的已知乳樣品的近紅外光譜,利用最優(yōu)判別模型對已知乳樣品的近紅外光譜進(jìn)行判別,得到已知乳樣品的判別結(jié)果,若已知乳樣品的判別結(jié)果與實際類別一致,則將已知乳樣品的近紅外光譜加入其判別結(jié)果對應(yīng)的譜庫以更新最優(yōu)判別模型。
6.如權(quán)利要求3所述的利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,其特征在于,進(jìn)一步包括步驟(4):采集已知是否摻假的已知乳樣品的近紅外光譜,利用最優(yōu)判別模型對已知乳樣品的近紅外光譜進(jìn)行判別,得到已知乳樣品的判別結(jié)果,若已知乳樣品的判別結(jié)果與實際類別不一致,則將已知乳樣品的近紅外光譜作為異常樣本保存,當(dāng)異常樣本累積超過預(yù)設(shè)數(shù)目時,將異常樣本加入其實際類別對應(yīng)的譜庫以更新最優(yōu)判別模型。
7.如權(quán)利要求5或6所述的利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,其特征在于, 所述生鮮乳譜庫或摻假乳譜庫中每添加一個新的近紅外光譜,則從該譜庫中相應(yīng)地刪除一個采集日期最早的樣品的近紅外光譜。
8.如權(quán)利要求7所述的利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,其特征在于,在采集近紅外光譜之前,將生鮮乳樣品、摻假乳樣品、未知乳樣品和/或已知乳樣品在40°C下超聲處理10 20min。
9.如權(quán)利要求I所述的利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,其特征在于,所述步驟(2)還包括,采用SVM方法建立判別模型之前,使用T檢驗剔除離群的近紅外光譜。
10.如權(quán)利要求9所述的利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,其特征在于,所述步驟(2)還包括,采用SVM方法建立判別模型之前,采用SNV方法、MSC方法或一階導(dǎo)方法對已剔除離群樣本的近紅外光譜集進(jìn)行預(yù)處理。
11.如權(quán)利要求10所述的利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,其特征在于, 所述步驟(2)還包括,采用留三分之一或四分之一法校正判別模型。
12.如權(quán)利要求I所述的利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,其特征在于,所述生鮮乳樣品由從監(jiān)控區(qū)域采集的未經(jīng)加工的生鮮乳制成。
13.如權(quán)利要求12所述的利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,其特征在于, 所述摻假乳樣品由在所述生鮮乳中添加不同種類或不同濃度的摻假溶液制成。
全文摘要
本發(fā)明提供一種利用近紅外光譜進(jìn)行生鮮乳摻假識別的方法,包括步驟(1)采集多種生鮮乳樣品和摻假乳樣品的近紅外光譜,對應(yīng)建立生鮮乳譜庫和摻假乳譜庫;步驟(2)利用生鮮乳譜庫和摻假乳譜庫中的近紅外光譜建立判別模型,校正判別模型以得到最優(yōu)判別模型;步驟(3)采集未知是否摻假的未知乳樣品的近紅外光譜,利用最優(yōu)判別模型對未知乳樣品的近紅外光譜進(jìn)行判別,從而得到未知乳樣品的判別結(jié)果;其中,所述步驟(2)中,采用SVM方法建立判別模型。本發(fā)明的方法對于含有多種未知摻假物的摻假乳的判別正確率得到大幅提高,通過擴充和更新生鮮乳譜庫和摻假乳譜庫中的近紅外光譜,使最優(yōu)判別模型得到更新維護。
文檔編號G01N21/35GK102590128SQ20121000626
公開日2012年7月18日 申請日期2012年1月10日 優(yōu)先權(quán)日2012年1月10日
發(fā)明者嚴(yán)鳳, 倪力軍, 吳劍平, 張文剛, 張立國, 張鑫, 李丹妮, 王蓓, 鐘珍珍, 顧欣, 黃士新 申請人:上海市獸藥飼料檢測所, 華東理工大學(xué)