專利名稱:通過pcr模擬和雙s形方程式確定單峰熔解溫度的制作方法
通過PCR模擬和雙S形方程式確定單峰熔解溫度
背景技術(shù):
本發(fā)明一般地涉及到代表寡聚核苷酸熔解特征的數(shù)據(jù)處理,并且更具體地涉及以 熔解曲線數(shù)據(jù)為基礎(chǔ)的確定寡聚核苷酸樣品的熔解溫度的系統(tǒng)和方法。熔解溫度的確定是一種區(qū)分基因型的重要方法。在確定DNA或寡核苷酸熔解溫 度的典型單步、均質(zhì)、封閉管法中,雙鏈特異性DNA染料(例如,SYBRGreen I,分子探針, Eugene, Oregon)或標(biāo)記的寡核苷酸被用于在實(shí)時PCR中監(jiān)測產(chǎn)品的形成(Wittwer CT, et al.,BioTechniques 1997 ;22 130-8)和熔解溫度(Ririe KM, et al.,Anal. Biochem 1997 ;245 :154-60)。通常,使用熱穩(wěn)定酶和至少一對寡核苷酸引物來進(jìn)行擴(kuò)增,該熱穩(wěn)定 酶對于DNA變性溫度是穩(wěn)定的。在某些實(shí)施方案中可使用一個或更多個額外的寡核苷酸 引物(例如用于擴(kuò)增多于一個DNA座位或多于一個基因型)。特別地,均質(zhì)的并且不需 要在擴(kuò)增開始之后添加試劑或?qū)σ苑治鰹槟康牡姆磻?yīng)進(jìn)行物理抽樣的熒光技術(shù)是吸引人 的。示例性的均質(zhì)技術(shù)使用用以定位目標(biāo)區(qū)域的寡核苷酸引物,和用于產(chǎn)生信號的熒光標(biāo) 記或染料。典型的基于PCR的方法使用帶有兩個互相作用的發(fā)色團(tuán)的FRET寡核苷酸探針 (相鄰雜交探針,TaqMan探針,分子信標(biāo),Scorpions),帶有單獨(dú)一個發(fā)色團(tuán)的單寡核苷酸 探針(G-猝滅探針,Crockett, A. 0. and C. T. ffittwer, Anal. Biochem. 2001 ;290 :89_97 和 SimpleProbes, Idaho Technology),以及使用 dsDNA 染料(比如 SYBR Green I)代替共價 熒光標(biāo)記的寡核苷酸探針的技術(shù)。確定寡核苷酸或DNA熔解溫度的典型方法包括擴(kuò)增目的核酸的一部分和隨后確 定擴(kuò)增子的熔解溫度。在后面一步中,待分析樣品的溫度改變(比如提高)通常為一定溫 度范圍內(nèi)部分度數(shù),并測量熒光的改變。在熔點(diǎn)時,DNA的兩條鏈將分開,熒光迅速減弱。相 對熒光單位(RFU)與時間⑴的變化比率(_d(RFU)/dT)被標(biāo)繪在Y軸,與X軸上的溫度相 對。通常,熔解溫度的確定在擴(kuò)增步驟之后直接進(jìn)行。在某些實(shí)施方案中,熔解溫度的確定 可能在擴(kuò)增反應(yīng)過程中就已經(jīng)進(jìn)行了。確定寡核苷酸或DNA熔解溫度,通常在PCR試驗(yàn)以后直接進(jìn)行,是辨別基因型的一 種重要方法。一些方法需要確定多重熔解溫度以從突變基因中鑒定野生型。作為選擇的, 熔解方法能在峰高的基礎(chǔ)上用于單個基因型定量確定基因數(shù)量。例如,最近有文獻(xiàn)報道檢 驗(yàn)KRAS基因可確定哪些患者可能是非小細(xì)胞肺癌治療的候選者。KRAS基因是野生型的患 者將從治療中獲益,然而,如果患者的這一基因突變變異,治療將是毫無益處的。由于這些 治療往往有很大的副作用,確定患者正確的基因型就非常重要。這也可以用于了解目前基 因的數(shù)量。因此,提供準(zhǔn)確、有效的確定DNA樣品的熔解溫度和以峰高為基礎(chǔ)確定基因數(shù)量 的系統(tǒng)和方法是人們所希望獲得的。發(fā)明概述本發(fā)明提供基于熔解曲線數(shù)據(jù)確定寡核苷酸的熔解溫度,Tm的系統(tǒng)和方法。所述 的系統(tǒng)和方法也允許基于峰高的基因數(shù)量的定量確定。按照不同的實(shí)施方式,PCR模擬被用于完成獲得的熔解曲線數(shù)據(jù)集的量化。在某些方面,所述熔解曲線利用水平翻轉(zhuǎn)和水平平移變換。雙S型方程式然后擬合所述數(shù)據(jù)。接 著逆平移和逆水平翻轉(zhuǎn)變換被應(yīng)用到所述方程式中以產(chǎn)生基于方程式的所述熔解曲線數(shù) 據(jù)集的解析。基于方程式的融解曲線的解析被用于確定一階導(dǎo)數(shù)(例如,Tm值)和峰高。按照本發(fā)明的一方面,提供了由以計算機(jī)執(zhí)行的方法用于DNA的熔解溫度,Tm的 確定。所述方法通常包括在處理模塊上運(yùn)行的步驟。所述方法的步驟通常包括接收代表DNA 樣品的熔解曲線的數(shù)據(jù)集,所述的數(shù)據(jù)集包括表示成數(shù)據(jù)值序列{(lYKU)... (Xn_i, Ym),(Xn,Yn)}的復(fù)數(shù)個數(shù)據(jù)點(diǎn),此處的X代表溫度⑴值,Y代表熒光強(qiáng)度值,所述方法還 包括確定擬合所述數(shù)據(jù)集的解析表達(dá)式,以及通過取所述的解析表達(dá)式對X的導(dǎo)數(shù)獲得導(dǎo) 數(shù)曲線。該方法的所述步驟還通常包括對應(yīng)于所述導(dǎo)數(shù)曲線的最大導(dǎo)數(shù)(dY/dX)值的值 X_的確定,以及所述值Xmax的輸出,此處的值X_代表DNA樣品的熔解溫度,Tm。在某些方 面,所述方法還包括對應(yīng)于Tm值的導(dǎo)數(shù)曲線的峰高的確定,以及輸出所述的峰高。在某些 方面,通過將回歸方法應(yīng)用于雙S形函數(shù)來確定所述函數(shù)參數(shù)來計算擬合所述數(shù)據(jù)集的曲 線的逼近來確定所述解析表達(dá)式。在某些方面,回歸方法是Levenberg-Marquardt回歸方 法。在某些實(shí)施方式中,解析表達(dá)式由下列來確定將第一變換應(yīng)用到數(shù)據(jù)集上,如此 導(dǎo)致數(shù)據(jù)值序列{(X1,Y1),(X2,Y2)... (Xn-l,Yn-l), (Xn,Yn)}變成變換的序列{(Xn,Yl), (Xn-1, Y2). . . (X2,Yn-1),(XI,Yn)},并通過將回歸方法應(yīng)用于雙S形函數(shù)來確定所述雙S 形函數(shù)的參數(shù)來計算擬合所述變換的序列的曲線的逼近。這里,在某些方面,回歸方法是 Levenberg-Marquardt回歸方法。另一方面,所述方法還包括將第二變換應(yīng)用到所述雙S形 函數(shù),第二變換與第一變換逆向。如此,在某些方面,第二轉(zhuǎn)變包括(Xl+Xn)-x形式的函數(shù)。在另一種實(shí)施方式,所述方法還包括,在計算之前,將所述的數(shù)據(jù)集或所述變換的 序列的X值改變第一數(shù)量(Xtrans),以便變換的序列從1個單位的值開始。這里,在某些方 面,所述方法還包括在計算以后,將雙S形函數(shù)的X值改變-Xtrans。在該方法另一個方面,確定導(dǎo)數(shù)曲線包括取所述解析表達(dá)式對X的負(fù)導(dǎo)數(shù)。在所 述方法的另一方面,處理模塊整合入計算機(jī)系統(tǒng)或PCR數(shù)據(jù)獲取裝置或系統(tǒng)或熱循環(huán)儀 (例如,動力學(xué)熱循環(huán)儀)。按照本發(fā)明的另一方面,提供了計算機(jī)可讀介質(zhì),該可讀介質(zhì)包括為控制處理器 以確定DNA的熔解溫度,Tm的代碼。所述代碼通常包括接收代表DNA樣品的熔解曲線的數(shù) 據(jù)集的指令,所述的數(shù)據(jù)集包括表示成數(shù)據(jù)值序列KU),(X2,Y2). . (Xn_i,YJ,(Xn,Yn)} 的復(fù)數(shù)個數(shù)據(jù)點(diǎn),此處的X代表溫度(T)值,Y代表熒光強(qiáng)度值,所述代碼還包括確定擬合 所述數(shù)據(jù)集的解析表達(dá)式的指令,以及通過取所述的解析表達(dá)式對X的導(dǎo)數(shù)確定導(dǎo)數(shù)曲線 的指令。所述代碼還通常包括對應(yīng)于所述導(dǎo)數(shù)曲線的最大導(dǎo)數(shù)(dY/dX)值的值X_的確定 的指令,以及所述的X_的輸出指令,此處的值Xmax代表DNA樣品的熔解溫度,Tm。在某些 方面,該代碼還包括對應(yīng)于所述Tm值的導(dǎo)數(shù)曲線的峰高的確定,以及輸出所述的峰高的指 令。在某些方面,通過將回歸方法應(yīng)用于雙S形函數(shù)來確定所述函數(shù)參數(shù)來計算擬合所述 數(shù)據(jù)集的曲線的逼近來確定解析表達(dá)式。在某些方面,回歸方法是Levenberg-Marquardt 回歸方法。在某些實(shí)施方式中,確定解析表達(dá)式的所述指令包括這樣的指令,其將第一變換 應(yīng)用到所述數(shù)據(jù)集,如此導(dǎo)致數(shù)據(jù)值序列{(X1,Y1),(X2,Y2)... (Xn-1, Yn-1), (Xn,Yn)}變成變換的序列{(Xn,Yl), (Xn-1,Y2).,. (X2,Yn_l),(XI,Yn)},并通過將回歸方法應(yīng)用于雙 S形函數(shù)來確定所述雙S形函數(shù)參數(shù)來計算擬合所述變換的序列的曲線的逼近。在這里,在 某些方面,所述的回歸方法是Levenberg-Marquardt回歸方法。另一個方面,計算機(jī)可讀介 質(zhì)還包括將第二變換應(yīng)用到雙S形函數(shù)的指令,第二變換與第一變換逆向。在此,在某些方 面,第二變換包括(Xl+Xn)-x形式的函數(shù)。在另一個實(shí)施方式中,所述的計算機(jī)可讀介質(zhì)還包括,在運(yùn)算之前,將所述的數(shù)據(jù) 集或所述的變換序列的X值改變第一數(shù)量(Xtrans),以便變換序列從1個單位的值開始的 指令。這里,在某些方面,所述的計算機(jī)可讀介質(zhì)還包括在計算以后,將雙S形函數(shù)的X值 改變-Xtrans的指令。在所述的計算機(jī)可讀介質(zhì)的另一個方面,確定導(dǎo)數(shù)曲線包括取所述解析表達(dá)式對 X的負(fù)導(dǎo)數(shù)。在所述的計算機(jī)可讀介質(zhì)的另一方面,處理器整合入計算機(jī)系統(tǒng)或PCR數(shù)據(jù)獲 取裝置或系統(tǒng)之一。按照本發(fā)明的另一個方面,提供了動力學(xué)聚合酶鏈?zhǔn)椒磻?yīng)(PCR)系統(tǒng)。這個PCR 系統(tǒng)通常包括動力學(xué)PCR分析模塊,它產(chǎn)生表示DNA熔解曲線的熔解曲線數(shù)據(jù)集,這一數(shù)據(jù) 集包括表示為數(shù)據(jù)值序列{(X』,(X2,Y2)…I,YJ,(Xn,Yn)}的復(fù)數(shù)個數(shù)據(jù)點(diǎn),此處 的X代表溫度(T)值,Y代表熒光強(qiáng)度值,還有適應(yīng)于處理熔解曲線數(shù)據(jù)集以確定Tm值的 智能模塊。所述智能模塊通常通過確定擬合所述數(shù)據(jù)集的解析表達(dá)式適應(yīng)于確定Tm值,通 過取所述解析表達(dá)式對于X的導(dǎo)數(shù)適應(yīng)于確定導(dǎo)數(shù)曲線,并且適應(yīng)于確定相當(dāng)于所述的導(dǎo) 數(shù)曲線的最大導(dǎo)數(shù)(dY/dX)值的值Xmax。所述的智能模塊通常還適應(yīng)于輸出值Xmax,此處 的值Xmax代表DNA樣品的熔解溫度,Tm。在某些方面,所述的智能模塊包括一個或更多個 處理器。在某些方面,這個智能模塊還適應(yīng)于確定相當(dāng)于Tm值的導(dǎo)數(shù)曲線的峰高和輸出所 述的峰高。在某些方面,所述的解析表達(dá)式通過通過將回歸方法應(yīng)用于雙S形函數(shù)來確定 所述函數(shù)的參數(shù)來計算擬合所述數(shù)據(jù)集的曲線的逼近來確定。在某些方面,所述的回歸方 ^^ Levenberg-Marquardt 回歸;^^去。在某些具體實(shí)施方式
中,所述的解析表達(dá)式通過以下確定將第一變換應(yīng)用到數(shù) 據(jù)集中以導(dǎo)致數(shù)據(jù)值序列{(XI,Yl),(X2,Y2)... (Xn-l,Yn-l), (Xn,Yn)}變成變換的序列 {(Xn,Yl),(Xn-1,Y2).,. (X2,Yn_l),(XI,Yn)},并通過將回歸方法應(yīng)用于雙S形函數(shù)來確 定所述雙S形函數(shù)參數(shù)來計算擬合所述變換的序列的曲線的逼近。這里,在某些方面,所述 的回歸方法是Levenberg-Marquardt回歸方法。另一方面,所述的解析表達(dá)式還通過將第 二變換應(yīng)用到所述雙S形函數(shù)來確定,第二變換與第一變換逆向。在此,在某些方面,第二 變換包括(Xl+Xn)-x形式的函數(shù)。所述的動力學(xué)PCR系統(tǒng)的另一個實(shí)施方式中,智能模塊還適應(yīng)于,在運(yùn)算之前,將 所述的數(shù)據(jù)集或所述的變換的序列的X值改變第一數(shù)量(Xtrans),以便所述變換的序列從 1個單位的值開始。這里,在某些方面,所述的智能模塊還適應(yīng)于,在運(yùn)算以后,將雙S形函 數(shù)的X值改變-Xtrans。在所述動力學(xué)PCR系統(tǒng)的另一個方面,確定導(dǎo)數(shù)曲線包括取所述解析表達(dá)式對X 的負(fù)導(dǎo)數(shù)。參考說明書的剩余部分,包括附圖和權(quán)利要求書,將認(rèn)識到本發(fā)明的其他特征和 優(yōu)勢。本發(fā)明的其他的特征和優(yōu)勢,以及本發(fā)明的各個實(shí)施方式的結(jié)構(gòu)和操作,均在以下關(guān)于附圖詳細(xì)描述。在這些附圖中同樣的引用號代表相同或功能上類似的元件。附圖簡述
圖1顯示了 PCR方法背景中熔解曲線的實(shí)例。圖2顯示了按照一個實(shí)施方式確定熔解溫度的方法。圖3顯示了根據(jù)一個實(shí)施方式利用PCR模擬確定熔解溫度的方法。圖4顯示了將圖1的數(shù)據(jù)集水平倒轉(zhuǎn)變換的結(jié)果。圖5顯示了將圖4的數(shù)據(jù)集水平平移變換的結(jié)果。圖6顯示了擬合圖5中的數(shù)據(jù)的得到的雙S形曲線。圖7顯示了逆向平移變換的結(jié)果。圖8顯示了建立為PCR曲線的熔解曲線。圖9顯示了導(dǎo)出的熔解峰曲線的圖解表示。圖10顯示了一個概括的方框圖的例子,所述的方框圖顯示了可用于實(shí)現(xiàn)本發(fā)明 的方法和系統(tǒng)的軟件和硬件資源之間的關(guān)系。圖11顯示了一個概括的方框圖的例子,所述的方框圖顯示了熱循環(huán)儀裝置和計 算機(jī)系統(tǒng)之間的關(guān)系。發(fā)明詳述本發(fā)明提供用于從熔解曲線數(shù)據(jù)確定DNA的熔解溫度,Tm的系統(tǒng)和方法。所述的 系統(tǒng)和方法也允許基于峰高的基因數(shù)量的定量確定。在圖1中顯示了 PCR方法背景中熔解曲線的實(shí)例。圖1中所示的曲線是一個典型 的熔解曲線圖,它是只有一個基因型存在的情況中的PCR試驗(yàn)之后產(chǎn)生的。在這一曲線中, 熒光強(qiáng)度作為漸增溫度的函數(shù)而降低。如圖1所示,典型的熔解曲線的數(shù)據(jù)可在二維坐標(biāo)系中被表示出來,比如,溫度定 義x軸,積累的多核苷酸的指示劑定義y軸。通常,積累的多核苷酸的指示劑是熒光強(qiáng)度值, 因?yàn)闊晒鈽?biāo)記的使用或許是最廣泛使用的標(biāo)記方案。然而,應(yīng)當(dāng)了解可以使用其他指示劑, 這依賴于使用的特定的標(biāo)記和/或檢測方案。其他有用的積累信號的指示劑的例子包括發(fā) 光強(qiáng)度、化學(xué)發(fā)光強(qiáng)度。生物發(fā)光強(qiáng)度、磷光強(qiáng)度、電荷轉(zhuǎn)移、電壓、電流、功率、能量、溫度、 粘性、光散射、放射性強(qiáng)度、反射率、透光度和吸光度。總的方法概要考慮圖1所示的典型的熔解曲線。我們希望從圖1代表的數(shù)據(jù)獲得一個或更多個 熔解溫度。按照一個實(shí)施方式,參考圖2,確定熔解溫度的方法100可以被簡要地描述。在 步驟110,代表熔解曲線的試驗(yàn)數(shù)據(jù)集被接收或被獲得。圖1顯示了一個繪制的熔解曲線數(shù) 據(jù)集的例子,在圖中熔解曲線的y軸(橫坐標(biāo))和x軸(縱坐標(biāo))分別表示熒光強(qiáng)度和溫 度。獲得的數(shù)據(jù)集包括復(fù)數(shù)個表示為數(shù)據(jù)值序列{(XA),(X2,Y2)…I,YJ,(Xn,Yn)} 的數(shù)據(jù)點(diǎn),此處的X代表溫度(T)值,Y代表熒光強(qiáng)度值。在某些方面,所述的數(shù)據(jù)集應(yīng)該 包括沿著縱軸的連續(xù)的、等距的數(shù)據(jù)。在方法100在智能模塊(例如,一個或更多個執(zhí)行指令的處理器)中被執(zhí)行的情 況下,所述的智能模塊位于例如像熱循環(huán)儀這種PCR裝置中,當(dāng)所述數(shù)據(jù)被收集時所述的 數(shù)據(jù)集可被實(shí)時提供給智能模塊,或可被保存在記憶單元或緩沖器中,并且在實(shí)驗(yàn)完成后 被提供給智能模塊。類似的,所述的數(shù)據(jù)集可被提供給例如臺式計算機(jī)系統(tǒng)或其他計算機(jī)系統(tǒng)這樣的分離系統(tǒng),通過網(wǎng)絡(luò)連接(例如,LAN, VPN,內(nèi)部網(wǎng),因特網(wǎng),等等)或直接連接 (例如,USB或其他直接有線或無線連接)到獲得裝置,或被提供到便攜式介質(zhì),比如CD、 DVD、軟盤等等。在某些方面,所述的數(shù)據(jù)集包括有坐標(biāo)值對(或二維矢量)的數(shù)據(jù)點(diǎn)。至 于熔解數(shù)據(jù),所述的坐標(biāo)值對通常代表溫度和熒光強(qiáng)度值,當(dāng)在二維圖中顯示時,例如,x軸 (縱坐標(biāo))通常表示溫度,y軸(橫坐標(biāo))通常表示熒光強(qiáng)度。在步驟110中,所述的數(shù)據(jù) 集已被接收或被獲得之后,所述的數(shù)據(jù)集可被分析用于確定導(dǎo)數(shù)曲線的熔解溫度和/或峰 高值。在步驟120中,確定擬合所述數(shù)據(jù)集的解析表達(dá)式。在某些方面,如在后面更詳細(xì) 討論的,雙S形類型的方程式擬合所述數(shù)據(jù)集。在某些方面,使用Levenberg-Marquardt回 歸方法以使所述雙S形方程式擬合所述數(shù)據(jù)集,盡管也可以用其他的回歸方法。步驟130 中,通過取所述解析表達(dá)式對X(溫度)的導(dǎo)數(shù)從所述的解析表達(dá)式確定導(dǎo)數(shù)曲線。然后所 述的導(dǎo)數(shù)曲線的峰在步驟140中通過確定相當(dāng)于所述導(dǎo)數(shù)曲線的最大導(dǎo)數(shù)(dY/dX)值的值 Xmax來確定。在某些方面,曲線最大化的標(biāo)準(zhǔn)分析方法,例如,牛頓,梯度,格點(diǎn)搜索,和其他 方法,被用于確定所述導(dǎo)數(shù)曲線的最大值Xmax。值Xmax代表DNA樣品的熔解溫度,Tm。步 驟150中,Tm值和/或峰高值被返回,例如為了顯示或更進(jìn)一步處理。利用與實(shí)施圖2中 分析的系統(tǒng)耦合的顯示裝置,例如監(jiān)視屏或打印機(jī),可產(chǎn)生圖形顯示,或數(shù)據(jù)可被提供到用 于提供到顯示裝置上的分離系統(tǒng)上。圖3顯示了根據(jù)一個實(shí)施方式利用PCR模擬確定熔解溫度的方法200。在這個實(shí) 施例中,所述的熔解曲線數(shù)據(jù)集被變換以類似于PCR曲線的數(shù)據(jù)集(例如,當(dāng)視覺觀察所述 數(shù)據(jù)集時),以利用被設(shè)計來對PCR數(shù)據(jù)進(jìn)行處理和分析的上述算法,由此確定擬合所述熔 解曲線數(shù)據(jù)集的解析方程式。在步驟210中,所述的熔解曲線數(shù)據(jù)集從步驟110中接收或獲得。步驟220到步驟 260,確定擬合所述數(shù)據(jù)集的解析表達(dá)式。在步驟220中,根據(jù)一個實(shí)施方式,應(yīng)用水平倒轉(zhuǎn) 變換到所述數(shù)據(jù)集使溫度值顛倒。例如,應(yīng)用變換使序列{{T^FJ,{T2,F(xiàn)2}, ,HJ}, {Tn, Fn}}變成{{Tn,F(xiàn)J,{!^,F(xiàn)2},. . .,{T2,F(xiàn)n_J,{1\,F(xiàn)j },此處的 T 代表溫度,F(xiàn) 代表熒 光,下標(biāo)代表序列中的順序。圖1中完成的所述數(shù)據(jù)的變換產(chǎn)生了圖4所示的結(jié)果。如圖 4顯示的,這個形狀代表典型的PCR曲線。步驟230中,水平平移變換被應(yīng)用于所述的數(shù)據(jù) 集以便所述數(shù)據(jù)集從X軸的單位1(例如,1攝氏度)開始。用這種方式,所述曲線被移位到 左邊,以便它從1°C開始,以具有PCR曲線的相同特征,使得先前對于PCR發(fā)展而來的解析表 達(dá)式可以容易地應(yīng)用到所述的熔解曲線。圖4的數(shù)據(jù)的這種平移(在本例中平移39. 47C) 的結(jié)果顯示在圖5中。需要認(rèn)識到的是不必進(jìn)行步驟230,并且步驟220和230的順序可以 顛倒。步驟240中,解析方程式擬合圖5的數(shù)據(jù)。在一個實(shí)施方式中,雙S形方程 式擬合數(shù)據(jù)曲線。當(dāng)圖5中的所述曲線有PCR曲線的特征時,先前為擬合雙S形方 程式而發(fā)展的方法能被應(yīng)用到這一數(shù)據(jù)。步驟240中,在一個實(shí)施方式中,具有通過 Levenberg-Marquardt (LM)回歸方法或其他回歸方法來確定的參數(shù)的雙S形函數(shù)被用于獲 得代表所述數(shù)據(jù)集的曲線的逼近。這個LM方法是一個非線性回歸方法;它是一個將非線性 函數(shù)和數(shù)據(jù)集之間的距離的二次方最小化的迭代技術(shù)。所述方法表現(xiàn)為類似于最速下降方 法和高斯_牛頓方法的結(jié)合當(dāng)當(dāng)前的逼近擬合不好時它像最速下降方法(更慢但是更可靠的收斂),但是當(dāng)當(dāng)前的逼近更精確時,它更類似于高斯_牛頓方法(更快但是較少可靠 的收斂)。所述的LM回歸方法被廣泛的用于解決非線性回歸問題。—般地,LM回歸法包括需要各種輸入和提供輸出的算法。一方面,所述的輸入包 括將要處理的數(shù)據(jù)集,用于擬合所述數(shù)據(jù)的函數(shù),和對所述函數(shù)的參數(shù)或變量的初始估計。 所述的輸出包括最小化所述函數(shù)和所述數(shù)據(jù)集之間的距離的所述函數(shù)的一組參數(shù)。按照一個實(shí)施方式,所述的擬合函數(shù)為雙S形形式 (1)選擇這個方程式為所述的擬合函數(shù)是基于它的靈活性和它擬合典型PCR曲線或 其他生長曲線可能采取的不同曲線形狀的能力。本領(lǐng)域技術(shù)人員可理解,需要時可使用上 述擬合函數(shù)或其他擬合函數(shù)的變體,所述的雙S形方程式(1)有7個參數(shù)a,b,c, d,e, f 和g。所述的方程式能被分解成一個定值、一個斜率和一個雙S形的總和。所述的雙S形 本身是兩個S形的相乘。使雙S形方程式擬合PCR數(shù)據(jù)集的方法細(xì)節(jié),包括參數(shù)確定,能從 2006年2月6日提交,公開號為US2007-0143385的US申請系列號11/349,550中找到。圖6中顯示擬合圖5中數(shù)據(jù)的得到的雙S形曲線,所述的雙S形表達(dá)式如方程式 (2)所示 (2)方程式(2)中所示的雙S形表達(dá)式現(xiàn)在必須被變換回未加工的熔解曲線形式。步 驟250中,將相當(dāng)于圖6和方程式(2)的所述的曲線和雙S形表達(dá)式改變在步驟230中改 變的負(fù)數(shù)量。獲得的改變的曲線和雙S形表達(dá)式分別在圖7和方程式3中顯示。 (3)步驟260中,確定和應(yīng)用了用于圖7所示的曲線的逆向水平倒轉(zhuǎn)的函數(shù)。用于逆向 水平倒轉(zhuǎn)的函數(shù)可確定為原始未加工的熔解曲線的χ軸坐標(biāo)值的第一個和最后一個的和 減去χ。例如,假定原始未加工的熔解數(shù)據(jù)是{IT1, FJ,{T2, FJ , ... , ITlriFnJ},{Tn,F(xiàn)j}。 那么所述的逆向水平倒轉(zhuǎn)函數(shù)是( \+Τη)-Χ。至于圖7中的數(shù)據(jù),我們發(fā)現(xiàn)所述逆向函數(shù)為 InvFlip(x) = 125-χ。圖8和方程式4中顯示重新建立所述的原始熔解函數(shù)和曲線 方程式4被確定為ds3(x) = ds2 (InvFlip(X))0 ds3 (χ)和原始未加工熔解數(shù)據(jù) 的迭加的圖在圖8中顯示。可以看出擬合度接近于理想狀態(tài),從而在未加工熔解曲線和PCR 曲線之間建立起所述函數(shù)等價。步驟270中,所述未加工的熔解曲線的函數(shù)形式的負(fù)導(dǎo)數(shù)被確定;所述熔解峰的表示是通過取所述未加工的熔解數(shù)據(jù)的負(fù)導(dǎo)數(shù)來建立的。利用用于未加工的熔解曲線的等 價解析表達(dá)式,所述熔解峰曲線的表達(dá)式推導(dǎo)為方程式5
溶解峰曲線辨論3⑶) αχ(5) 圖9顯示方程式5的圖解表示。步驟280中,所述的熔解溫度,Tm,和/或峰高被確定并返回,例如,為了顯示或進(jìn) 一步的處理。熔解溫度確定為相當(dāng)于熔解峰曲線的最大值的溫度。所述的熔解溫度,Tm能 通過曲線最大化的標(biāo)準(zhǔn)分析方法來獲得,例如,Newton,梯度,格點(diǎn)搜索,以及其他方法。此 處使用的例子中,溫度最大值被確定為Tm = 59. 64,峰高被確定為峰高=0. 655。此處描述的方法論可以通過利用允許多個肘形彎(elbow)的PCR曲線的解析表達(dá) 式擴(kuò)展到具有多個峰的熔解曲線。或者,可以重建步驟以直接把雙S形表達(dá)式應(yīng)用于所述 原始未加工的熔解曲線,以便所述的熔解-PCR模擬不是必須的。建立這樣的步驟的細(xì)節(jié)能 在2006年2月6日提交,公開號為US2007-0143385的US申請系列號11/349,550中找到。應(yīng)理解可通過將未加工數(shù)據(jù)除以下列中的任何一個而使得獲得的峰高值獨(dú)立于 機(jī)器(machine independent)1)平均數(shù)2)中位數(shù)3)范圍(最大-最小)。如果機(jī)器包括多通道(channel),那么每個通道可除以它自己的平均數(shù)或中位數(shù) 或范圍,或者全部通道可以除以單個通道的平均數(shù)/中位數(shù)/范圍,例如通道1和通道2除 以通道1的平均數(shù)/中位數(shù)/范圍。也應(yīng)該理解Tm確定方法能在在計算機(jī)系統(tǒng)的處理器上運(yùn)行的計算機(jī)代碼中實(shí) 現(xiàn)。所述的代碼包括用于控制處理器以實(shí)現(xiàn)Tm確定方法的各個方面和步驟的指令。所述 代碼通常存儲在硬盤、RAM或便攜式介質(zhì)例如CD、DVD等上。類似的,所述方法可在PCR裝 置,例如熱循環(huán)儀,或其他專門裝置,包括執(zhí)行存儲在耦合于所述處理器的記憶單元的指令 的處理器來實(shí)現(xiàn)。包括所述指令的代碼可以通過網(wǎng)絡(luò)連接或直接連接到代碼來源或利用便 攜式介質(zhì)下載到設(shè)備的記憶單元中,如眾所周知的那樣。本領(lǐng)域技術(shù)人員將會理解,本發(fā)明所述的Tm確定方法可以利用各種編程語言來 編碼,例如C,C++, C#, Fortran, VisualBasic,等等,還可以利用應(yīng)用程序,例如提供用于 數(shù)據(jù)可視化和分析的預(yù)打包途徑,函數(shù)和程序的Mathematiea 。另一個有關(guān)后者的例子是 MATLAB 。在某一實(shí)施方式中,按照本發(fā)明的方法可通過利用常規(guī)的個人計算機(jī)系統(tǒng)來實(shí) 現(xiàn),所述的常規(guī)的個人計算機(jī)系統(tǒng)包括但不限于,用于輸入數(shù)據(jù)集的輸入設(shè)備,例如鍵盤、 鼠標(biāo)、等等;用于表示在曲線的區(qū)域內(nèi)具體的目的點(diǎn)的顯示設(shè)備,例如監(jiān)視器;執(zhí)行所述方 法的各個步驟所必須的處理裝置,例如CPU ;網(wǎng)絡(luò)接口,例如調(diào)制解調(diào)器,存儲所述數(shù)據(jù)集 的數(shù)據(jù)存儲裝置,在處理器上運(yùn)行的計算機(jī)代碼,等等。此外,所述方法可能還在例如按照 權(quán)利要求所述的實(shí)施方式的PCR方法中或例如按照權(quán)利要求所述的實(shí)施方式的PCR系統(tǒng)中實(shí)現(xiàn)。圖10-11顯示了按照本發(fā)明所述的系統(tǒng)的例子。圖10顯示解釋可用于實(shí)現(xiàn)本發(fā) 明的方法和系統(tǒng)的軟件和硬件資源之間關(guān)系的總的方框圖。圖11描述的系統(tǒng)包含可定位 于熱循環(huán)儀裝置中的動力學(xué)PCR分析模塊和為計算機(jī)系統(tǒng)的一部分的智能模塊。該數(shù)據(jù)集 (PCR數(shù)據(jù)集)通過網(wǎng)絡(luò)連接或直接連接被從所述的分析模塊傳遞到所述的智能模塊,或反 之亦然。所述的數(shù)據(jù)集,例如,可被按照圖2和3描述的流程圖處理。所述的流程圖可方 便地通過存儲在計算機(jī)系統(tǒng)硬件上的軟件所實(shí)現(xiàn),例如,按照圖10所描述的流程圖。關(guān)于 圖10,計算機(jī)系統(tǒng)(300)可包含接收裝置(310),如用于接收在PCR反應(yīng)期間獲得的熒光數(shù) 據(jù),計算裝置(320),其用于按照本發(fā)明的所述方法處理所述數(shù)據(jù),應(yīng)用裝置(330),其用于 按照所述計算裝置獲得的結(jié)果替代部分所述數(shù)據(jù),以及在計算機(jī)屏幕上顯示所述結(jié)果的顯 示裝置(340)。圖11顯示了熱循環(huán)儀裝置和計算機(jī)系統(tǒng)之間的交互作用。所述的系統(tǒng)包含 可定位于熱循環(huán)儀裝置中的動力學(xué)PCR分析模塊和為計算機(jī)系統(tǒng)一部分的智能模塊。所述 的數(shù)據(jù)集(PCR數(shù)據(jù)集)通過網(wǎng)絡(luò)連接或直接連接被從所述的分析模塊傳遞到所述的智能 模塊,或反之亦然。所述的數(shù)據(jù)集可按照圖10,通過在處理器上運(yùn)行的計算機(jī)代碼處理并存 儲在所述智能模塊的存儲裝置上,以及處理后回傳到所述分析模塊的存儲裝置,此處所述 的修飾過數(shù)據(jù)可在顯示裝置上顯示。本發(fā)明已通過舉例以及按照具體的實(shí)施方式進(jìn)行了描述,但應(yīng)理解本發(fā)明不限于 已公開的實(shí)施方式。相反,它意圖包括各種對于本領(lǐng)域技術(shù)人員是顯而易見的各種修飾和 類似的布置。因此,附加權(quán)利要求的范圍應(yīng)該給予最寬的解釋以便涵蓋所有像這樣的修飾 和類似的布置。
權(quán)利要求
一種確定DNA的熔解溫度,Tm的方法,所述方法包括以下步驟-用至少一對寡核苷酸引物擴(kuò)增DNA的一部分;-將包括所述擴(kuò)增的DNA的樣品的溫度改變一定溫度范圍內(nèi)部分度數(shù),并記錄熒光信號的改變,以建立代表所述擴(kuò)增的DNA樣品的熔解曲線的數(shù)據(jù)集;-利用通過下述的處理模塊從所述數(shù)據(jù)集中確定所述擴(kuò)增的DNA樣品的熔解溫度-接收代表DNA樣品的熔解曲線的所述數(shù)據(jù)集,所述數(shù)據(jù)集包括表示成數(shù)據(jù)值序列{(X1,Y1),(X2,Y2)...(Xn-1,Yn-1),(Xn,Yn)}的復(fù)數(shù)個數(shù)據(jù)點(diǎn),此處的X代表溫度(T)值,Y代表熒光強(qiáng)度值;-確定擬合所述數(shù)據(jù)集的解析表達(dá)式;-通過取所述解析表達(dá)式對X的導(dǎo)數(shù)確定導(dǎo)數(shù)曲線;-確定對應(yīng)于所述導(dǎo)數(shù)曲線的最大導(dǎo)數(shù)(dY/dX)值的值Xmax;以及-輸出值Xmax,此處的值Xmax代表所述DNA樣品的熔解溫度,Tm。
2.權(quán)利要求1所述的方法,還包括-確定對應(yīng)于Tm值的導(dǎo)數(shù)曲線的峰高;以及 -輸出所述的峰高。
3.權(quán)利要求1或2所述的方法,其中所述的解析表達(dá)式通過以下確定-通過將回歸方法應(yīng)用于雙S形函數(shù)來確定所述函數(shù)的參數(shù)來計算擬合所述數(shù)據(jù)集的 曲線的逼近。
4.權(quán)利要求3所述的方法,其中所述的回歸方法是Levenberg-Marquardt回歸方法。
5.權(quán)利要求1至4中的任一項(xiàng)所述的方法,其中所述的解析表達(dá)式通過以下確定-將第一變換應(yīng)用到數(shù)據(jù)集中,如此導(dǎo)致所述數(shù)據(jù)值序列{(XI,Yl),(X2, Y2). . . (Xn-I,Yn-I),(Χη,Υη)}變成變換的序列{(Χη,Υ1),(Χη_1,Υ2)... (Χ2,Υη_1),(XI, Yn)};并且-通過將回歸方法應(yīng)用于雙S形函數(shù)來確定所述雙S形函數(shù)參數(shù)來計算擬合所述變換 的序列的曲線的逼近。
6.權(quán)利要求5所述的方法,其中所述的回歸方法是Levenberg-Marquardt回歸方法。
7.權(quán)利要求5或6所述的方法,還包括將第二變換應(yīng)用到雙S形函數(shù),所述的第二變換 是第一變換的逆向。
8.權(quán)利要求7所述的方法,其中所述的第二變換包括(Xl+XrO-x形式的函數(shù)。
9.權(quán)利要求5至8中的任一項(xiàng)所述的方法,還包括,在計算之前-將所述的數(shù)據(jù)集或所述的變換的序列的X值改變第一數(shù)量(Xtrans),以便所述變換 的序列從1個單位的值開始。
10.權(quán)利要求9所述的方法,還包括,在計算以后,將雙S形函數(shù)的X值改變-Xtrans。
11.權(quán)利要求1至10中任一項(xiàng)所述的方法,其中確定導(dǎo)數(shù)曲線包括取所述解析表達(dá)式 對X的負(fù)導(dǎo)數(shù)。
12.用于確定DNA的熔解溫度,Tm的裝置,包括_用于接收代表來自動力學(xué)熱循環(huán)儀裝置的DNA樣品的熔解曲線的數(shù)據(jù)集的裝置,所 述的數(shù)據(jù)集包括表示成數(shù)據(jù)值序列{(X1J1),(X2, Y2)... (Xlri,Ylri),(Xn, Yn)}的復(fù)數(shù)個數(shù)據(jù) 點(diǎn),此處的X代表溫度(T)值,Y代表熒光強(qiáng)度值;-用于確定擬合所述數(shù)據(jù)集的解析表達(dá)式的裝置; -用于通過取所述解析表達(dá)式對X的導(dǎo)數(shù)確定導(dǎo)數(shù)曲線的裝置; -用于確定對應(yīng)于所述導(dǎo)數(shù)曲線的最大dY/dX值的值Xmax的裝置;和 -用于輸出值Xmax的裝置,此處的值Xmax代表所述DNA樣品的熔解溫度,Tm。
13.動力學(xué)聚合酶鏈?zhǔn)椒磻?yīng)(PCR)系統(tǒng),包括-用于擴(kuò)增DNA的一部分和用于將所述樣品的溫度改變一定溫度范圍內(nèi)部分度數(shù)的熱 循環(huán)儀;-動力學(xué)PCR分析模塊,其記錄和產(chǎn)生代表DNA熔解曲線的熔解曲線數(shù)據(jù)集,所述的數(shù) 據(jù)集包括表示為數(shù)據(jù)值序列KX1J1), (X2, Y2)... (Xn-i,Ylri), (Xn,Yn)}的復(fù)數(shù)個數(shù)據(jù)點(diǎn),此 處的X代表溫度(T)值,Y代表熒光強(qiáng)度值;和-適應(yīng)于通過以下來處理所述熔解曲線數(shù)據(jù)集來確定Tm值的智能模塊 -確定擬合所述的數(shù)據(jù)集的解析表達(dá)式; -通過取所述解析表達(dá)式對X的導(dǎo)數(shù)來確定導(dǎo)數(shù)曲線; -確定對應(yīng)于所述的導(dǎo)數(shù)曲線的最大導(dǎo)數(shù)(dY/dX)值的值Xmax ;以及 -輸出所述值Xmax,此處的值Xmax代表DNA樣品的熔解溫度,Tm。
14.權(quán)利要求13所述的動力學(xué)PCR系統(tǒng),其中所述的智能模塊還適應(yīng)于 -確定對應(yīng)于所述Tm值的所述導(dǎo)數(shù)曲線的峰高;以及-輸出所述的峰高。
15.權(quán)利要求13或14所述的動力學(xué)PCR系統(tǒng),其中所述的解析表達(dá)式通過以下確定 -通過將回歸方法應(yīng)用到雙S形函數(shù)以確定所述函數(shù)的參數(shù)來計算擬合所述數(shù)據(jù)集的曲線的逼近。
全文摘要
用于從熔解曲線數(shù)據(jù)確定DNA的熔解溫度,Tm的系統(tǒng)和方法。所述的系統(tǒng)和方法也允許基于峰高的基因數(shù)量的定量確定。PCR模擬被用于完成獲得的熔解曲線數(shù)據(jù)集的量化。該熔解曲線利用水平翻轉(zhuǎn)和水平平移被變換,并且雙S形方程式然后擬合所述數(shù)據(jù)。逆平移和逆水平翻轉(zhuǎn)變換被應(yīng)用到所述方程式中以產(chǎn)生基于方程式的熔解曲線數(shù)據(jù)集的解析。基于方程式的熔解曲線的解析然后被用于確定一階導(dǎo)數(shù)(例如,Tm值)和峰高。
文檔編號G06F17/17GK101882185SQ20101019487
公開日2010年11月10日 申請日期2010年4月16日 優(yōu)先權(quán)日2009年4月17日
發(fā)明者R·T·庫尼克, T·特恩赫爾 申請人:霍夫曼-拉羅奇有限公司