專利名稱:一種早期肺癌診斷的決策樹模型的制作方法
技術領域:
本發明屬于生物技術領域,是一種可用于診斷早期肺癌的決策樹模型,為肺癌的早期診斷提供了實驗基礎。
背景技術:
肺癌發生于支氣管粘膜上皮,亦稱支氣管癌。近50年來許多國家都報道肺癌的發病率明顯增高,在男性癌瘤病人中,肺癌已居首位,女性發病率也迅速增高,占女性常見惡性腫瘤的第2位或第3位。肺癌起源于支氣管粘膜上皮,癌腫可向支氣管腔內或(和)鄰近的肺組織生長,也可通過淋巴、血行或經支氣管轉移擴散。癌腫的生長速度和轉移擴散的情況與癌腫的組織學類型、分化程度等生物學特性有一定關系。一直被認為是蛋白質組學研究的黃金工具一雙向聚丙烯酰胺凝膠電泳技術 (2D-PAGE)所能檢測到的蛋白質也只是蛋白質組中的一小部分,許多種蛋白質尤其是低分子量蛋白(MW<20kD)不能用此方法析出,需要用先進的技術手段進行蛋白質組學研究。而最近幾年才發展起來的一種新的蛋白質組學研究方法一表面加強激光解析電極飛行時間質譜技術具有特殊的固相層析表面能夠將蛋白質保留在其上,經離子化后用飛行時間質譜儀對其進行檢測,直接從未處理的生物樣品獲取蛋白質組圖譜。利用經過特殊處理的固相支持物制成蛋白質芯片,根據蛋白質物理、化學性質的不同,可以非特異性或特異性地結合各種蛋白質,并在質譜儀中受到激光轟擊,各種結合蛋白質會被激發而形成帶電離子,根據不同電離子在電場中飛行的時間長短,形成強弱不同的質譜峰,進而形成圖譜用于分析。這項技術與2D-PAGE相比,操作簡單,靈敏度高,檢測需要的樣品量少。近年來該技術在差異表達蛋白質組、蛋白質相互作用及疾病檢測方面得到了廣泛的應用,尤其適合于多肽及低分子量蛋白質譜分析。該技術在尋找前列腺、乳腺、卵巢腫瘤等疾病的診斷標記物方面已經取得了較大進展。本發明從決策樹的角度,建立了一種可用于診斷早期肺癌的模型,為肺癌的早期診斷提供了實驗基礎。
發明內容
本發明利用Ciphergen公司的蛋白質芯片飛行時間質譜儀系統,檢測早期肺癌和健康人血清的蛋白質譜,利用軟件分析早期肺癌與正常人血清不同的對照蛋白質組,發現新的早期肺癌相關性蛋白質,制作成決策樹模型,用于診斷早期肺癌。本發明將早期肺癌和健康人血清分別利用Ciphergen公司蛋白質芯片檢測,得到數據利用該公司的Biosystems軟件的Biomarker wizard功能,分別對早期肺癌和正常組樣品的蛋白質波譜進行比較,得出特異的蛋白質圖譜,再根據統計分析發現早期肺癌與正常組有統計學顯著差異的蛋白質峰,并使用MathWorks公司的Matlab 2009a軟件對早期肺癌與對照組差異顯著特異蛋白質進行分析,選取4個質譜峰(分別為m/Z4505,m/Z5689,m/ z7580, m/zll245)時正確率最高,為79%。利用這4個質譜峰建立了早期肺癌與正常人的決策樹模型,利用該模型,將受檢人血清中相應的蛋白質的質荷比與本發明模型逐一進行比對,可為早期肺癌診斷提供輔助指導。決策樹模型的檢測方法如下1.血清處理采集早期肺癌患者術前血和正常對照外周靜脈血后立即放入4°C冰箱保存,備用。 檢測時,融解冰凍血清,離心,取血清樣品加緩沖液,振搖。2.芯片的平衡芯片孔中加入醋酸鈉溶液,平衡芯片2次,每次5min。3.稀釋取血清樣品,加入尿素,振蕩30min,加入醋酸鈉溶液中,混勻稀釋。4.上樣取稀釋后的血清樣品加入平衡好的芯片加樣孔,置芯片于搖床孵育90min。5.樣品洗脫取醋酸鈉溶液加入芯片加樣孔,洗脫2次,每次5min。取去離子水沖洗芯片。6.芯片與蛋白質結合反應取能量吸收劑加入芯片加樣孔,待自然揮發后再重復加吸收劑一次。7.芯片檢測將芯片置于蛋白芯片閱讀機中,用加有標準蛋白質的芯片校正儀器。設置芯片閱讀儀參數,用CipheEgen Pmteinchip 3. 1. 1軟件收集數據。其中縱坐標為蛋白質相對含量,橫坐標為蛋白質質荷比(M/Z)。經過臨床試用,該決策樹模型可以較好地區分早期肺癌和正常對照,該決策樹正確率為79%。
圖1肺癌與正常人鑒別的決策樹模型圖中m/z表示特異蛋白的質荷比,case代表早期肺癌病人,ctrl代表正常人。
具體實施例方式1.材料1. 1檢測血清取受試者靜脈血5ml,在4度冰箱中靜置2小時后離心(4000rpm,5min).取血清, 置低溫冰箱(負80度)或液氮保存,備用。1. 2所需主要試劑與儀器乙酸鈉、乙腈、三氟乙酸、白芥子酸(SPA)均購自上海化學試劑公司。CMW蛋白芯片和蛋白質芯片閱讀機(PBS II型)購自Ciphergen公司。2.方法2. 1芯片的平衡取200ul 50mmol/L pH 4. 0的醋酸鈉(NaAc)溶液加入芯片的加樣孔中,平衡芯片2次,每次5min。2. 2 稀釋取6ul 血清樣品,加入 12ul 9mmol/L尿素,振蕩 30min,加入 222ul 50mmol/LpH 為3. 0的NaAc溶液中,混勻稀釋。2. 3.上樣取稀釋后的血清樣品200ul/孔加入平衡好的芯片加樣孔,置芯片于搖床孵育 90mino2. 4.樣品洗脫取50mmol/L pH 4. 0的NaAc溶液200ul/孔加入芯片加樣孔,洗脫2次,每次5min。 取300ul/孔的去離子水沖洗芯片。2.5.芯片與蛋白質結合反應取能量吸收劑SPA (含飽和白芥子酸溶液與質量分數50%乙腈和0. 15%三氟乙酸)0. 5ul/孔加入芯片加樣孔,待自然揮發后再重復加SPA —次。2. 6.芯片檢測將芯片置于蛋白芯片閱讀機中,用加有AU-in_0ne標準蛋白質的NP20芯片校正儀器至0. 1 %范圍內。芯片閱讀儀參數設置激光強度150,檢測靈敏度7,優化范圍1984. 2 9921u,最高分子量49605u,芯片上的每個點采集130次。用CipheEgen Proteinchip 3. 1. 1 軟件收集數據。其中縱坐標為蛋白質相對含量,橫坐標為蛋白質質荷比(M/Z)。將分析得到的受檢者的血清蛋白波譜根據決策樹模型(圖1)中特異蛋白質質荷比進行比較,以判斷受檢者是否患有早期肺癌(見實施實例)。實驗實例取受檢者血清,經檢驗得到其血清蛋白圖譜,按圖1早期肺癌與正常組鑒別的決策樹模型,觀察蛋白質波峰,先看質荷比M/Z為4505的蛋白質,其波峰強度系數A是否 (3. 16,是則再看M/Z為5689的蛋白質,其波峰強度系數A是否彡1. 18,是則為對照組, 否則為病例組。看質荷比M/Z為4505的蛋白質,其波峰強度系數A > 3. 16時再看M/Z為 11245的蛋白質,其波峰強度系數A是否彡0. 14,是則為對照組,否則最后看M/Z為7580的蛋白質,其波峰強度系數A是否< 31. 25,是則為病例組,否則為對照組。以上是對本發明的描述而非限定,基于本發明思想的其它實施方式,均在本發明的保護范圍之中。
權利要求
1.用于肺癌早期診斷的決策樹模型,其特征在于由蛋白質芯片飛行時間質譜儀系統檢測的血清蛋白質圖譜經過軟件統計分析得到肺癌患者多個特異蛋白質的質荷比(m/z)及其蛋白質波峰強度系數A繪制而成,所說的特異蛋白質的質荷比(m/z)分別為m/z4505,m/ z5689, m/z7580, m/z11245
全文摘要
本發明涉及生物技術領域,是一種可以用于早期肺癌診斷的決策樹模型。本發明運用蛋白質芯片飛行時間質譜系統,檢測正常人及早期肺癌病人的外周血清樣品,找出與肺癌患者差異顯著的特異蛋白質峰,根據各蛋白質峰的質荷比(m/z),采用決策樹算法,建立一個決策樹模型。只要將檢測人血清中相應的蛋白質的m/z與本發明的模型進行分析,就可以初步用于肺癌診斷。其預測準確率為79%。
文檔編號G01N27/64GK102323328SQ20101056169
公開日2012年1月18日 申請日期2010年11月25日 優先權日2010年11月25日
發明者曾華宗 申請人:上海聚類生物科技有限公司