專利名稱:一種堿基選擇性可控延伸的str序列高通量檢測方法及其檢測試劑的制作方法
技術領域:
本發明一種堿基選擇性可控延伸的STR序列高通量檢測方法及其檢測試劑屬于生物技術中高通量DNA測序領域,特別涉及運用第二代高通量測序技術來進行STR序列的檢測方法。
背景技術:
第二代高通量DNA測序人類基因組計劃和各種模式生物基因組計劃的開展和完成,對當代的生物學研究和醫學研究產生了巨大的影響。人們能夠從基因水平上認識生命現象的差異,疾病發生、發展的規律,以及藥物與生命體的相 互作用。就基因序列分析而言,后基因組時代的重點已由單個物種的全基因組序列測定轉移到了對某一物種在基因組DNA序列層次上個體遺傳差異及物種間遺傳差異的比較。目前,在尋找新的功能基因和疾病相關的突變位點方面,人們仍然主要使用常規的Sanger DNA測序法。這一方法存在通量低和成本高的問題。第一個人類基因組序列測定的費用大約為10億美元,但是盡管目前這一費用已經降低到大約2千萬美元以下,功能基因組的研究進展仍然受限于DNA測序技術。為此,美國Venter基金會在2003年提出了 1000美元人類全基因組測序的研究目標。2004年初,美國國立衛生院投入巨資支持DNA測序新技術的研究。他們的目標是在近年內發展10萬美元的人類全基因組DNA測序技術,并最終減低為I千美元。自從2005年454 Life Sciences公司(2007年該公司被Roche正式收購)推出了454 FLX焦磷酸測序平臺以來,曾推出過3730x1 DNA測序儀的Applied BioSystem (ABI)這家一直占據著測序市場最大份額的公司的領先地位就開始動搖了,因為他們的拳頭產品毛細管陣列電泳測序儀系列遇到了兩個強有力的競爭對手,一個就是羅氏公司(Roche)的454測序儀,另一個就是2006年美國Illumina公司推出的Solexa基因組分析平臺。為此,2007年ABI公司推出了自主研發的SOLiD測序儀。這三個測序平臺即為目前高通量測序平臺的代表。這些平臺共同的特點是極高的測序通量,相對于傳統測序的96道毛細管測序,高通量測序一次實驗可以讀取40萬到400萬條序列。讀取長度根據平臺不同從25bp到450bp,不同的測序平臺在一次實驗中,可以讀取IG到14G不等的堿基數,這樣龐大的測序能力是傳統測序儀所不能比擬的。DNA指紋識別以及STR檢測技術1984年英國萊斯特大學的遺傳學家Jefferys及其合作者首次將分離的人源小衛星DNA用作基因探針,意思是它同人的指紋一樣是每個人所特有的。DNA指紋的圖像在X光膠片中呈一系列條紋,很像商品上的條形碼。DNA指紋圖譜,開創了檢測DNA多態性(生物的不同個體或不同種群在DNA結構上存在著差異)的多種多樣的手段,如RFLP (限制性內切酶酶切片段長度多態性)分析、串聯重復序列分析、RAPD(隨機擴增多態性DNA)分析等等。各種分析方法均以DNA的多態性為基礎,產生具有高度個體特異性的DNA指紋圖譜,由于DNA指紋圖譜具有高度的變異性和穩定的遺傳性,且仍按簡單的孟德爾方式遺傳,成為目前最具吸引力的遺傳標記。它具有如下的特點
I.高度的特異性研究表明,兩個隨機個體具有相同DNA圖形的概率僅3X 10—11 ;如果同時用兩種探針進行比較,兩個個體完全相同的概率小于5X10_19。全世界人口約50億,即5X109。因此,除非是同卵雙生子女,否則幾乎不可能有兩個人的DNA指紋的圖形完全相同。2.穩定的遺傳性DNA是人的遺傳物質,其特征是由父母遺傳的。分析發現,DNA指紋圖譜中幾乎每一條帶紋都能在其雙親之 一的圖譜中找到,這種帶紋符合經典的孟德爾遺傳規律,即雙方的特征平均傳遞50%給子代。3.體細胞穩定性即同一個人的不同組織如血液、肌肉、精液等產生的DNA指紋圖形完全一致。1985年Jefferys博士首先將DNA指紋技術應用于法醫鑒定。1989年該技術獲美國國會批準作為正式法庭物證手段。我國警方利用DNA指紋技術已偵破了數千例疑難案件。DNA指紋技術具有許多傳統法醫檢查方法不具備的優點,如它從四年前的精斑、血跡樣品中,仍能提取出DNA來作分析;如果用線粒體DNA檢查,時間還將延長。此外千年古尸的鑒定,在俄國革命時期被處決沙皇尼古拉的遺骸,以及最近在前南地區的一次意外事故中機毀人亡的已故美國商務部長布朗及其隨行人員的遺骸鑒定,都采用了 DNA指紋技術。此外,它在人類醫學中被用于個體鑒別、確定親緣關系、醫學診斷及尋找與疾病連鎖的遺傳標記;在動物進化學中可用于探明動物種群的起源及進化過程;在物種分類中,可用于區分不同物種,也有區分同一物種不同品系的潛力。在作物的基因定位及育種上也有非常廣泛的應用。短串聯重復序列(short tandem repeat, STR)又稱簡單重復序列(simplesequence repeat, SSR)或微衛星 DNA (microsatellite DNA),由 2 6bp 的核心序列組成,重復次數通常在15 30次。STR廣泛存在于真核生物基因組中。由于STR核心序列的重復次數存在個體間差異,具有高度多態性,因而被作為一種遺傳標記廣泛地應用于植物、動物的種類鑒定中。在人類基因組中,STR分散在人的整個基因組中,平均每15 20kb就存在一個STR基因座,約占人基因組的3%。STR標記還具有多態性豐富、易于檢測等特點,因此被廣泛應用于人類遺傳制圖、基因定位、連鎖分析、親子鑒定、罪犯鑒定和人類遺傳研究等方面,也是DNA指紋檢測中運用最為廣泛的方法。目前對STR序列的檢測普遍采用試劑盒的方法。其基本原理就是利用基因座內等位基因長度的不同以及擴增的基因座之間片段長度范圍的不同,采用高分辨率的毛細管電泳技術進行分離。通常,對于每個基因座中一條引物進行熒光標記,不同的基因座引物標記不同的熒光,結合擴增片段的遷移率和熒光的顏色,應用基因序列分析儀及采用相應的分析軟件可自動化檢出復合擴增的眾多STR基因座的所有信息。可以看出,目前的檢測手段以類似于第一代測序的毛細管電泳法為基礎,檢測的通量較小,并不能滿足同時對海量樣本進行同時檢測的要求。
發明內容
本發明的目的是針對上述不足之處提供一種堿基選擇性可控延伸的STR序列高通量檢測方法及其檢測試劑,是一種基于第二代DNA測序技術的高通量、低成本、快速STR序列檢測方法及其檢測試劑。本發明提出了一種堿基選擇性可控延伸的合成測序技術,大幅度提高了 STR序列的樣本檢測通量,在相同的時間內,相對現有的檢測手段,檢測的樣本數可以達到數個數量級的提升,相應地,單個樣本的檢測成本也得到了大幅度的降低。通過設計對應于第二代測序技術的STR序列的新檢測方法,實現將第二代測序的高通量特點引入到STR序列的檢測技術中,從而使得STR序列檢測技術在身份識別、法醫檢測、案件偵破以及個人基因身份信息采集等重大領域的廣泛應用成為可能。本發明一種堿基選擇性可控延伸的STR序列高通量檢測方法及其檢測試劑是采取以下技術方案實現
一種堿基選擇性可控延伸的STR序列高通量檢測方法的步驟為
(I)基因座的選取和擴增根據不同的檢測需要,選取相應數量的STR序列,作為檢測對象;通過PCR技術,將上述選取的STR序列從人類DNA樣本的相應基因座上擴增出來。所述STR 序列所在的基因座為 ACTBP2、AP0AI1、CYAR04、FABP、F0LP23、GABARB1、PLA2A1、TFIIDA、CD4、CSFlPO、F13A1、F13B、FES/FPS、FGA (FIBRA)、HPRTB、LPL、Penta D、Penta E、SE33、TH01、TPOX、VWA、D1S1656、D2S441、D2S1338、D3S1358、D5S818、D6S1043、D7S820、D8S1179、D10S1248、D12S391、D13S317、D14S1434、D16S539、D18S51、D19S433、D21S11、D22S1045 、DYS19、DYS385 a/b、DYS388 、DYS389 I/II、DYS390、DYS391 、DYS392 、DYS393、DYS434、DYS437 、DYS438 、DYS439、DYS447 、DYS448、DYS456、DYS458、DYS460、DYS464、DYS635、Y-GATA-A4、Y-GATA-A7. I、Y-GATA-A7. 2、Y_GATA_A10、Y-GATA-H4、Amelogenin、D22-GATA198B05等與身份識別相關的基因座中的一種或幾種。選取完需要檢測的STR序列后,根據STR序列中核心序列重復單元的序列信息來選擇相應的檢測堿基位點以及設計多基因座同時檢測的分組檢測方案。(2)檢測芯片上STR序列文庫的制備芯片的每一個反應位點上僅有唯一樣本的同一種STR單鏈序列拷貝。上述STR單鏈序列拷貝可以直接固定于芯片的平面固體基片表面;也可以通過微小球體,間接地先將單鏈序列拷貝固定在微球的表面,然后再將固定完單鏈序列拷貝的微球固定于平面基片的表面。所述的微小球體可選用磁珠或非磁性微珠,其粒徑一般小于等于10微米。STR單鏈序列拷貝采取直接法或是間接法固定在芯片表面,需要依據用于檢測芯片的高通量測序儀各自采用的測序文庫制備類型。(3) STR核心序列重復次數的檢測在延伸反應進行之前,先要讀取出芯片上每個反應位點上的STR序列所屬的樣本信息以及基因座信息;通過雜交的方法,將延伸起始引物和3’端封閉的延伸終止引物結合在檢測芯片中反應位點的單鏈序列上;加入由3種與需檢測堿基不相配對的核苷酸單體和另一種與需檢測堿基配對、帶有可剪切的熒光基團、3’端是可控封閉的核苷酸單體以及DNA聚合酶等構成的檢測試劑,進行延伸反應;上述一次延伸反應完成后檢測微陣列上點陣的熒光信號,然后將熒光剪切并恢復單體3’端的延伸活性;接著繼續加入上述由四種核苷酸單體以及DNA聚合酶等構成的檢測試劑,進行下一輪延伸反應,直到芯片上的所有反應位點均檢測不出熒光信號為止。讀取STR序列的所屬信息時,需要根據芯片上是否具有樣本的分隔性選擇不同的樣本標識和讀取方法。若芯片具有樣本分隔性,檢測時需要用組合熒光法區分序列所屬的基因座,檢測結果需要根據芯片上樣本區域的編號查詢得到樣本的信息。若芯片不具有樣本分隔性,需要引入核酸標識片段來記錄樣本信息以及所屬基因座的信息,檢測時需要進行對核酸標識片段讀取的過程。組合熒光區分STR序列所屬基因座的方法為選擇合適數量的特異性序列片段,將其修飾上若干種熒光,通過這些特異性序列片段和STR序列雜交時產生的不同熒光結果,區分出芯片的各個反應位點上連接的STR序列類型。選擇性延伸方法的目的在于跳過無需檢測的堿基位點。如果當前延伸位點不是需檢測的堿基位點,則延伸反應不會中止,繼續進行;如果當前延伸位點是需要檢測的堿基位點,延伸反應中止。(4)熒光信號的分析通過記錄芯片上STR微陣列的各個反應位點檢測到的熒光出現次數以及熒光強度,確定待檢測基因座的STR核心序列的重復數;通過對同一反應位點在每次延伸反應結果中的熒光強度進行分析,判斷該反應位點上連接的STR序列所在基因座是否具有兩個不同的等位基因,并分析出兩個等位基因STR序列各自的核心序列重復 次數。最終的檢測結果為STR序列所在基因座是否具有兩個不同等位基因,以及STR序列的核心序列重復次數,包括唯一的或者兩種不同的核心序列重復次數。最終得到的檢測結果可以運用到不同的檢測領域,如對Amelogenin基因座的單獨檢測結果可用于未知樣本的性別檢測JtAmelogenin、D18S1364、D12S391、D13S325、D6S1043、D2S1772、D11S2368、D8S1132、D7S3048、D22-GATA198B05 這 10 個基因座的檢測結果可用于親子鑒定,來判斷不同樣本間的生物學親緣性關系J#D3S1358、TH01、D21S11、D18S51、Penta E、D5S818、D13S317、D7S820、D16S539、CSF1P0、Penta D、Amelogenin, vWA、D8S1179、TP0X、FGA、D19S433、D12S391、D6S1043、D2S1338 這 20 個基因座的檢測結果,可以用于DNA指紋檢測技術中來進行個體的身份識別,從而進一步應用于犯罪數據庫建立、法醫檢測、案件偵破以及個人基因身份信息采集等重大領域。所述的一種堿基選擇性可控延伸的STR序列高通量檢測方法的檢測試劑包括延伸單體試劑、DNA聚合酶、延伸引物試劑、反應緩沖液、熒光剪切試劑、延伸恢復試劑、變性液這些檢測過程中各種生化反應進行時需要用到的生化試劑;其中延伸單體試劑包含了四種不同的核苷酸單體dNTP,其中N為A、T、C、G四種堿基中的一個;四種核苷酸單體中的三種與檢測堿基位點不配對的單體為普通核苷酸單體,剩下的一種與檢測堿基位點配對的單體經過如下的修飾單體上標記了可剪切的熒光,且單體的3’端修飾有可控延伸的化學基團;四種核苷酸單體的混合體系作為延伸單體試劑,單獨封裝保存;檢測時使用的DNA聚合酶需要根據實驗設計時測序終止引物的5’端是否修飾有保護基團,選擇相應類型的聚合酶。所述延伸引物試劑、反應緩沖液、熒光剪切試劑、延伸恢復試劑、變性液試劑,均選用生物學實驗中常用的生化試劑。檢測反應前,將足量的相應檢測試劑按照實驗標準要求的比例以及順序加入到反應體系中。本發明有益效果本發明與現有技術相比,具有如下優點
I.本發明的最大優點是發明了一種堿基選擇性可控延伸的合成測序技術,并將其運用在STR序列的檢測中,使得STR序列檢測與第二代高通量測序技術相適應,極大提高了每次可檢測的樣本數量,從而大大降低了檢測的成本以及耗費的時間。現有的技術檢測時采用的是第一代測序使用的毛細管電泳法,每次僅能檢測十數個樣本,而本發明的檢測技術基于第二代高通量測序技術,每次可以檢測數萬甚至于數十萬的樣本,提高了至少3個數量級。檢測通量的提高可以極大促進STR序列檢測技術在身份識別、犯罪數據庫建立、法醫檢測、案件偵破以及個人基因身份信息采集等重大領域的應用。2.本發明在序列檢測的過程中,引入了一對延伸起始引物和延伸終止引物,大大減少了需要檢測的堿基位點數。同時,由于采用了可控延伸的方法,把傳統的對每個位點的逐個測序模式轉變為更加適合STR檢測的跳躍式堿基選擇性檢測模式。這樣,檢測的長度可以很長,且無需將基因座序列片段化,降低了檢測的復雜度。3.本發明采用的檢測方法廣泛適用于現有的第二代商用測序儀器,甚至一些第三代測序儀器(如PacBio RS等),而且它對測序儀的性能要求不高,一般的中低端第二代測序儀器即可完成檢測過程。而且,本發明的應用范圍廣泛,可運用于性別檢測、身份識別、親子鑒定、法醫學檢測等許多生物學檢測領域。
圖I是本發明中STR序列所在的一個基因座不意圖。圖中I表不基因座中擴增ill引物所在位置,2表示基因座上延伸終止引物雜交的位置,3表示基因座的核心序列區域,AGAA為核心序列的重復單元,4表示延伸前引物的雜交位置,5表示擴增后引物的雜交位置。圖2是本發明一種堿基選擇性可控延伸的STR序列高通量檢測方法的一組STR序列所在基因座,分別為D7S820,CSF1P0, D3S1358和D13S317基因座。其中它們的核心序列重復單元中具有相同的單個核苷酸堿基位點,也就是G這個堿基,后續的檢測中,選擇特殊修飾的核苷酸單體dCTP即可對這四個基因座擴增出的STR序列同時進行檢測。圖3是本發明一種堿基選擇性可控延伸的STR序列高通量檢測方法的芯片直接檢測法示意圖。圖中左側為檢測芯片,圖中I表示的是某條STR序列上擴增前引物所在位置的序列,將其5’端加以修飾,與圖中7所示的芯片反應表面上的化學基團發生連接反應,形成圖中6所示的連接基團。圖中2表示延伸終止引物,其3’端封閉,無法繼續延伸。圖中3表示STR序列的核心序列重復區域,需要檢測的就是該區域中核心序列的重復次數。圖中4表示延伸起始引物,檢測的起點就是其3’端。通過在其3’端不斷重復延伸反應、突光檢測、熒光剪切和恢復延伸活性的步驟,檢測出圖中3區域中的核心序列重復次數。圖中5表示的是STR序列上擴增后引物所在位置的序列。圖4是本發明一種堿基選擇性可控延伸的STR序列高通量檢測方法的引入核酸標識片段的磁珠檢測法示意圖。圖中左側為檢測芯片,圖中I表示某條STR序列上擴增前引物所在位置的序列,將其5’端加以修飾,與圖中9所示的磁珠表面上的化學基團發生連接反 應,形成圖中6所示的連接基團。再將磁珠均勻鋪到芯片的流道中,選擇合適的反應條件,將磁珠連接到圖中7所示的芯片反應面上。圖中2表示延伸終止引物,其3’端封閉,無法繼續延伸。圖中3表示STR序列的核心序列重復區域,需要檢測的就是該區域中核心序列的重復次數。圖中4表示延伸起始引物,檢測的起點就是其3’端。通過在其3’端不斷重復延伸反應、熒光檢測、熒光剪切和恢復延伸活性的步驟,檢測出圖中3區域中的核心序列重復次數。圖中8表示的是引入的核酸標識片段,它包含基因座所屬的樣本信息以及基因座種類信息,可以在核心序列重復次數檢測之前進行核酸標識片段信息的讀取。圖中5表示的是STR序列上擴增后引物所在位置的序列。
圖5是本發明一種堿基選擇性可控延伸的STR序列高通量檢測方法的實時檢測圖像結果中的部分區域。圖中每個點位(包括亮點和暗點)代表某一檢測位點上STR序列在該輪檢測中的突光情況。其中較亮的點位表示該反應位點上的STR序列在本輪仍能檢測到突光信號,對核心序列重復次數的計數繼續進行。其中較暗的點位表示由于該STR序列所在基因座包含兩種等位基因,其中對較短的那條STR序列計數已經結束,整體熒光強度值下降;而較長的那條則在繼續計數,仍能檢測到一定量的熒光。而剩下的不發光的點位則需要根據檢測開始時這些點位的熒光信號情況來判斷該點位是失效點位,還是由于該STR序列核心區域較短,已經完成核心序列重復次數計數的有效點位。
具體實施例方式實施例I :利用一種堿基選擇性可控延伸的STR序列高通量檢測方法對Amelogenin基因座的STR序列進行多樣本的高通量性別檢測
利用一種堿基選擇性可控延伸的STR序列高通量檢測方法,檢測步驟為
(I)基因座的選取和擴增將Amelogenin基因座的一對PCR擴增引物,與待測樣本的DNA模板一起加入擴增體系中,控制合適的反應條件,進行PCR反應,得到Amelogenin基因·座的STR序列擴增產物。其中,一對擴增引物中一條的5’端上修飾有可連接的基團。不同的樣本需要在獨立的擴增體系中擴增。(2)檢測芯片上STR序列文庫的制備通過點樣的方式,將不同樣本的Amelogenin基因座擴增產物體系點到檢測芯片反應基面上的分隔區域中。芯片反應基面上修飾有另一種連接基團,控制合適的反應條件,使得擴增產物體系中有連接基團的那條STR序列單鏈與反應基面上的連接基團相結合,完成STR序列的固定。(3) STR核心序列重復次數的檢測
a)在芯片上進行STR序列與相應的延伸起始引物和3’端封閉的延伸終止引物的雜交反應。其中,延伸終止引物的5’端未做任何修飾。b).由于延伸終止引物的5’端未做任何修飾,需使用不帶有5’外切酶活性的kelnow聚合酶進行延伸反應。由于選擇的Amelogenin基因座在不同性別的樣本中具有不同個數的A (腺嘌呤)堿基,所以,可以把A (腺嘌呤)位點作為檢測核苷酸位點。因此,延伸單體試劑中核苷酸單體的組合為未經修飾的dATP、dGTP、dCTP普通核苷酸單體以及如下特殊修飾的dTTP核苷酸單體單體上修飾有可剪切的熒光,且單體3’端修飾有可控延伸的基團,在一定的反應條件下,單體的3’端能夠恢復延伸活性。按照實驗標準的規定,加入相應的其他反應試劑,并控制好合適的反應條件,進行延伸反應。c).檢測并成像記錄芯片上所有檢測位點的熒光信號。d).熒光信號檢測和記錄完成后,依次進行熒光剪切反應和恢復單體3’端的延伸活性反應。e).重復b、C、d步驟,直到芯片上所有檢測位點的熒光信號消失。(4)熒光信號的分析分析各輪熒光圖像中每個熒光位點的熒光出現次數以及強度變化規律,確定熒光位點對應的芯片檢測位點上STR序列的核心序列重復數及其所在的基因座是否具有兩條不同的等位基因。在對Amelogenin基因座進行性別檢測時,如果某個反應點位出現了熒光信號減弱的現象,則表示該位點對應的樣本擴增體系中含有兩條長度不同的STR序列,也就代表該樣本來自于男性;若熒光信號沒有減弱,而是直接消失,說明該位點對應的樣本擴增體系中只有唯一長度的STR序列,樣本來源于女性。
實施例2 :利用一種堿基選擇性可控延伸的STR序列高通量檢測方法對D3S1358、TH01、D18S51、Penta E、D5S818、D13S317、D7S820、D16S539、CSF1P0、Penta D、TPOX、SE33、D8S1179、D21S11、vWA、FGA 16個基因座的STR序列進行樣本分隔的身份識別檢測,文庫制備采用芯片直接制備法
利用一種堿基選擇性可控延伸的STR序列高通量檢測方法,檢測步驟為
(I)基因座的選取和擴增將上述16個基因座相應的一對PCR擴增引物,與待測樣本的DNA模板一起加入擴增體系中,控制合適的反應條件,進行PCR反應,得到基因座的STR序列擴增產物。不同的樣本需要在獨立的擴增體系中擴增。、(2)檢測芯片上STR序列文庫的制備分別將16條STR序列相應的、帶有可連接基團的一側擴增引物,通過點樣的方式,點到檢測芯片反應基面上的分隔區域中。芯片反應基面上修飾有另一種連接基團,控制合適的反應條件,使得引物上的連接基團與反應基面上的連接基團相結合,完成引物的固定。其中一側擴增引物在選擇時需要注意其所在的STR序列單鏈中,是否具有相同的檢測核苷酸位點D3S1358、THOl、D18S51、Penta E、D5S818、D13S317、D7S820、D16S539、CSFlP0、Penta D、TP0X、SE33 這 12 個基因座的核心序列中都包含G (鳥嘌呤)堿基檢測位點,因此可以同組檢測。而0851179、021511、^^、?6八這4個基因座的核心序列包含的是C (胞嘧啶)堿基檢測位點,無法直接與上面的12個基因座直接同時檢測。但是由于DNA雙鏈中的兩條單鏈滿足互補配對的原則,因此D8S1179、D21S11、vWA, FGA基因座擴增出的反義鏈上核心序列檢測位點為G (鳥嘌呤)位點。這樣,在引物選擇時,選擇 D3S1358、THOU D18S51、Penta E、D5S818、D13S317、D7S820、D16S539、CSF1P0、Penta D、TPOX、SE33基因座的正義鏈引物和D8S1179、D21S11、vWA、FGA基因座的反義鏈引物,即可對這16個基因座的STR序列進行同組檢測。芯片與引物的固定完成后,將不同樣本的16個基因座混合擴增體系分別點樣到芯片上的分割區域中,進行雜交反應,讓芯片上的引物捕獲到擴增體系中相應樣本基因座。在將樣本點樣到測序芯片上時,需要對樣本點樣到的區域進行記錄,確保芯片上的分隔區域與樣本編號一一對應。控制合適的反應條件,再次進行擴增反應,將待檢測的基因座擴增到芯片的反應面上。這樣,就完成了檢測芯片上STR序列文庫的制備。(3) STR核心序列重復次數的檢測
a).在選取的16條STR序列中選擇兩段特異性短序列片段,并將其互補短序列片段分別標記上四色熒光,分兩次與STR序列雜交。利用得到的16種熒光組合結果,區分出芯片中所有反應位點上基因座的種類。具體步驟為首先將第一條互補短序列片段與芯片進行雜交反應,雜交完成后檢測四色熒光通道的熒光強度信號,然后切除熒光。再將第二條互補短序列與芯片雜交,雜交完成后檢測四色熒光通道的熒光強度信號。最后,通過變性,去除STR序列上的短序列片段。b).在芯片上進行16條STR序列與各自相應的延伸起始引物和3’端封閉的延伸終止引物的雜交反應。其中,延伸終止引物的5’端未做任何修飾。c).由于延伸終止引物的5’端未做任何修飾,需使用不帶有5’外切酶活性的kelnow聚合酶進行延伸反應。由于選擇的16條STR序列具有相同檢測核苷酸位點G (鳥嘌呤)位點。因此,延伸單體試劑中核苷酸單體的組合為未經修飾的dATP、dGTP、dTTP普通核苷酸單體以及如下特殊修飾的dCTP核苷酸單體單體上修飾有可剪切的熒光,且單體3’端修飾有可控延伸的基團,在一定的反應條件下,單體的3’端能夠恢復延伸活性。按照實驗標準的規定,加入相應的其他反應試劑,并控制好合適的反應條件,進行延伸反應。d).檢測并成像記錄芯片上所有檢測位點的熒光信號。e).熒光信號檢測和記錄完成后,依次進行熒光剪切反應和恢復單體3’端的延伸活性反應。f).重復C、d、e步驟,直到芯片上所有檢測位點的熒光信號消失。(4)熒光信號的分析分析各輪熒光圖像中每個熒光位點的熒光出現次數以及強度變化規律,確定熒光位點對應的芯片檢測位點上STR序列的核心序列重復數及其所在的基因座是否具有兩條不同的等位基因。如檢測結果中某個樣本的D18S51基因座,在前13 輪熒光檢測中,均出現熒光信號,而在第14輪向后,不再檢測出熒光信號。因此得出該樣本的D18S51基因座的兩個等位基因相同,具有13個核心序列重復單元。另一樣本的D8S1179基因座,在前9輪熒光檢測中,均出現較強熒光信號,在10到15輪檢測中,熒光信號強度衰減、但未消失,16輪之后的檢測中,熒光信號完全消失。因此得出結論為該樣本的D8S1179基因座具有兩個不同的等位基因,其核心序列重復單元分別為9和15。同一樣本的上述16個基因座的檢測結果,即可用于對樣本個體的身份識別檢測中。運用本方法對標準樣本進行檢測,檢測結果與試劑盒檢測方法的檢測結果互相對應。實施例3 利用一種堿基選擇性可控延伸的STR序列高通量檢測方法對F13A1、F13B、FES/FPS、HPRTB、LPL、D22S1045、DYS19、DYS385 a/b、DYS388、DYS389 1/11、DYS390、DYS391、DYS392、DYS393、DYS434、DYS437、Y-GATA-H4 這 17 個基因座同時進行混合樣本的檢測,文庫制備采用磁珠制備法
利用一種堿基選擇性可控延伸的STR序列高通量檢測方法,檢測步驟為
(I)基因座的選取和擴增由于是混合樣本體系,需要引入核酸標識片段來區分不同的樣本和不同的基因座。首先在上述17個基因座相應的一對PCR擴增引物上引入相應的核酸標識片段,再將引入了核酸標識片段的擴增引物與待測樣本的DNA模板一起加入擴增體系中,控制合適的反應條件,進行PCR反應,得到基因座的STR序列含核酸標識片段的擴增產物。不同的樣本需要在獨立的擴增體系中擴增。擴增完成后,將每個擴增體系分裝成等量的兩份。(2)檢測芯片上STR序列文庫的制備分別將17條STR序列相應的、帶有可連接基團的一側擴增引物,滴入到表面修飾有另一種連接基團的磁珠濁液中,控制合適的反應條件,使得引物上的連接基團與磁珠表面的的連接基團相結合,完成引物在磁珠上的固定,形成了 17種表面上固定有不同引物序列的磁珠。由于17個基因座各自的檢測堿基位點有所不同,因此需要將上述基因座分兩組進行檢測。由于堿基的互補配對原則,可以將檢測堿基位點為G(鳥嘌呤)位點和C(胞嘧啶)位點的歸為一組,同理,檢測堿基位點為A (腺嘌呤)位點和T (胸腺嘧啶)位點的歸為另一組。這樣,檢測C (胞嘧啶)位點的上述17個基因座為:F13A1、DYS385 a/b、DYS389 1/11、DYS390、DYS391、DYS434、DYS437這7個基因座,其中擴增引物選用反義鏈引物的為F13AI和DYS385 a/b0檢測T (胸腺嘧啶)位點的上述17個基因座為F13B、FES/FPS、HPRTB、LPL、D22S1045、DYS19、DYS388、DYS392、DYS393、Y-GATA-H4 這 10 個基因座,其中擴增引物選用反義鏈引物的為D22S1045、DYS388和DYS392。將17種表面上固定有不同引物序列的磁珠根據上述的分組規則,分為兩組。分別加入到第一步制得的兩份獨立樣本擴增體系中,控制合適的反應條件,再次進行擴增反應,將含核酸標識片段的待檢測的17個基因座STR序列分兩組擴增到磁珠的表面。隨后,將兩組磁珠分別注入測序芯片不同的流道內,均勻鋪開后,再次進行固定反應,將磁珠固定在芯片的反應基面上,至此,基于磁珠的文庫制備完畢。(3) STR核心序列重復次數的檢測
a).按照核酸標識片段的讀取步驟,對芯片每個磁珠上的STR序列進行核酸標識片段的測序,并對照編碼表,讀出每個磁珠位點基因座的類型信息和所屬樣本信息。
b).在芯片流道內分別進行兩組STR序列與各自相應的延伸起始引物和3’端封閉的延伸終止引物的雜交反應。其中,延伸終止引物的5’端修飾有外切保護基團。c).由于延伸終止引物的5’端被保護基團保護,可以使用普通的Taq聚合酶進行延伸反應。由于17條STR序列有兩個不同的檢測核苷酸位點C (胞嘧啶)位點和T (胸腺嘧啶)位點。因此,不同流道內需要加入的延伸單體試劑不同由于檢測位點是C (胞嘧啶)位點,鋪滿固定上 F13A1、DYS385 a/b、DYS389 1/11、DYS390、DYS391、DYS434、DYS437基因座STR序列的磁珠所在的流道中延伸單體試劑的核苷酸單體組合為未經修飾的dATP、dCTP、dTTP普通核苷酸單體以及修飾有可剪切的熒光、3’端修飾有可控延伸基團的dGTP核苷酸單體;由于檢測位點是T (胸腺嘧啶)位點,鋪滿固定上F13B、FES/FPS、HPRTB, LPL、D22S1045、DYS19、DYS388、DYS392、DYS393、Y-GATA-H4 基因座 STR 序列的磁珠所在的流道中延伸單體試劑的核苷酸單體組合為未經修飾的dGTP、dCTP、dTTP普通核苷酸單體以及修飾有可剪切的熒光、3’端修飾有可控延伸基團的dATP核苷酸單體。按照實驗標準的規定,加入相應的其他反應試劑,并控制好合適的反應條件,進行延伸反應。d).檢測并成像記錄芯片上所有檢測位點的熒光信號。e).熒光信號檢測和記錄完成后,依次進行熒光剪切反應和恢復單體3’端的延伸活性反應。f).重復C、d、e步驟,直到芯片上所有檢測位點的熒光信號消失。(4)熒光信號的分析分析各輪熒光圖像中每個熒光位點的熒光出現次數以及強度變化規律,確定熒光位點對應的芯片磁珠位點上STR序列的核心序列重復數及其所在的基因座是否具有兩條不同的等位基因。具體實驗結果與實施例2的結果相類似,不再重復介紹。
權利要求
1.一種堿基選擇性可控延伸的STR序列高通量檢測方法,其特征在于包括如下操作(1)基因座的選取和擴增根據不同的檢測需要,選取相應數量的STR序列,作為檢測對象;通過PCR技術,將上述選取的STR序列從人類DNA樣本的相應基因座上擴增出來;(2)檢測芯片上STR序列文庫的制備芯片的每一個反應位點上僅有唯一樣本的同一種STR單鏈序列拷貝;上述STR單鏈序列拷貝可以直接固定于芯片的平面固體基片表面,也可以通過微小球體,間接地先將單鏈序列拷貝固定在微小球體的表面,然后再將固定完單鏈序列拷貝的微小球體固定于平面基片的表面;(3)STR核心序列重復次數的檢測在延伸反應進行之前,先要讀取出芯片上每個反應位點上的STR序列所屬的樣本信息以及基因座信息,通過雜交的方法,將延伸起始引物和 3’端封閉的延伸終止引物結合在檢測芯片中反應位點的單鏈序列上;加入由延伸單體試劑、DNA聚合酶、延伸引物試劑、反應緩沖液、熒光剪切試劑、延伸恢復試劑、變性液構成的檢測試劑,進行延伸反應;上述一次延伸反應完成后檢測微陣列上點陣的熒光信號,然后將熒光剪切并恢復單體.3’端的延伸活性;接著繼續加入上述由四種核苷酸單體以及DNA聚合酶等構成的檢測試劑,進行下一輪延伸反應,直到芯片上的所有反應位點均檢測不出熒光信號為止;(4)熒光信號的分析通過記錄芯片上STR微陣列的各個反應位點檢測到的熒光出現次數以及熒光強度,確定待檢測基因座的STR核心序列的重復數;通過對同一反應位點在每次延伸反應結果中的熒光強度進行分析,判斷該反應位點上連接的STR序列所在基因座是否具有兩個不同的等位基因,并分析出兩個等位基因STR序列各自的核心序列重復次數。
2.根據權利要求I所述的一種堿基選擇性可控延伸的STR序列高通量檢測方法, 其特征在于步驟(I)中所述作為檢測對象的STR序列所在的基因座為ACTBP2、APOAIU CYAR04、FABP 、F0LP23、GABARB1、PLA2A1、TFIIDA 、CD4、CSF1P0 、F13A1、F13B 、FES/FPS 、 FGA (FIBRA) 、HPRTB、LPL 、Penta D 、Penta E、SE33、THOl、TPOX、VWA、D1S1656、D2S441、 D2S1338 、D3S1358 、D5S818 、D6S1043、D7S820、D8S1179、D10S1248、D12S391 、D13S317、 D14S1434、D16S539、D18S51、D19S433、D21S11、D22S1045、DYS19、DYS385 a/b、DYS388、 DYS389 1/11、DYS390、DYS391、DYS392、DYS393、DYS434、DYS437、DYS438、DYS439、 DYS447、DYS448、DYS456、DYS458、DYS460、DYS464、DYS635、Y-GATA-A4、Y-GATA-A7. I、 Y-GATA-A7. 2、Y-GATA-A10、Y-GATA-H4、Amelogenin、D22_GATA198B05 這些與身份識別檢測相關的基因座中的一種或幾種。
3.根據權利要求I所述的一種堿基選擇性可控延伸的STR序列高通量檢測方法,其特征在于步驟(I)中基因座選取時,可根據STR序列中核心序列重復單元的序列信息來選擇相應的檢測堿基位點以及設計多基因座同時檢測的分組檢測方案。
4.根據權利要求I所述的一種堿基選擇性可控延伸的STR序列高通量檢測方法,其特征在于步驟(2)中所述的STR序列文庫制備時需要將樣本的STR序列拷貝直接或間接地固定在高通量測序儀器的芯片上直接固定為將STR序列的引物通過化學基團間的相互作用直接固定在測序芯片上,間接固定為把樣本引物先固定在微小球體上,再將微小球體固定在測序芯片上。
5.根據權利要求I所述的一種堿基選擇性可控延伸的STR序列高通量檢測方法,其特征在于步驟(3)中所述的讀取STR序列的所屬信息時,需要根據芯片上是否具有樣本的分隔性選擇不同的樣本標識和讀取方法;若芯片具有樣本分隔性,檢測時需要用組合熒光法區分序列所屬的基因座,檢測結果需要根據芯片上樣本區域的編號查詢得到樣本的信息; 若芯片不具有樣本分隔性,需要引入核酸標識片段來記錄樣本信息以及所屬基因座的信息,檢測時需要進行對核酸標識片段讀取的過程。
6.根據權利要求5所述的一種堿基選擇性可控延伸的STR序列高通量檢測方法,其特征在于所述的組合熒光區分序列所屬基因座,其方法為選擇合適數量的特異性序列片段,將其修飾上若干種熒光,通過這些特異性序列片段和STR序列雜交時產生的不同熒光結果,區分出芯片的各個反應位點上連接的STR序列類型。
7.根據權利要求I所述的一種堿基選擇性可控延伸的STR序列高通量檢測方法,其特征在于步驟(3)中所述的延伸反應采用的是選擇性延伸的方法,如果當前延伸位點不是需檢測的堿基位點,則延伸反應不會中止,繼續進行;如果當前延伸位點是需要檢測的堿基位點,延伸反應中止。
8.根據權利要求I所述的一種堿基選擇性可控延伸的STR序列高通量檢測方法,其特征在于步驟(4)中所述的熒光信號分析時需要根據芯片上反應位點在每輪延伸反應結果中的熒光強度信息來判斷樣本中各個STR序列所在基因座的兩個等位基因是否相同;若相同,得到唯一核心序列重復次數結果;若不同,需要分析得出兩個等位基因STR序列各自的核心序列重復次數結果。
9.權利要求I所述的一種堿基選擇性可控延伸的STR序列高通量檢測方法的檢測試齊U,其特征在于步驟(3)中所述的檢 測試劑包括延伸單體試劑、DNA聚合酶、延伸引物試齊IJ、反應緩沖液、熒光剪切試劑、延伸恢復試劑、變性液,這些檢測過程中各種生化反應進行時需要用到的生化試劑;其中的延伸單體試劑包含了四種不同的核苷酸單體dNTP,N為A、 T、C、G四種堿基中的一個;其中三種與檢測堿基位點不配對的單體為普通核苷酸單體,剩下的一種與檢測堿基位點配對的單體經過如下的修飾單體上標記了可剪切的熒光,且單體的3’端修飾有可控延伸的化學基團;四種核苷酸單體的混合體系作為延伸單體試劑,單獨封裝保存;檢測時使用的DNA聚合酶需要根據實驗設計時測序終止引物的5’端是否修飾有保護基團,選擇相應類型的聚合酶。
10.根據權利要求9所述的一種堿基選擇性可控延伸的STR序列高通量檢測方法的檢測試劑,其特征在于所述延伸引物試劑、反應緩沖液、熒光剪切試劑、延伸恢復試劑、變性液試劑,均選用生物學實驗中常用的生化試劑。
全文摘要
本發明一種堿基選擇性可控延伸的STR序列高通量檢測方法及其檢測試劑,將STR序列檢測方法的基本原理與高通量DNA測序技術結合,提供了一種在高通量測序平臺上運行的、對海量STR序列樣本進行檢測的方法以及相應的檢測試劑。根據測序系統相應的文庫制備方法,將待測樣本的STR序列直接或間接固定在檢測芯片上,按照檢測的流程加入合適的檢測試劑,并控制反應的條件,采用堿基選擇性可控延伸的技術方案,檢測樣本所在的各個反應位點發出的熒光強度信號,最終,通過分析檢測全過程中各個檢測位點的熒光信號照片得到海量樣本的檢測結果。本發明的最大優點是極大提高了每次可檢測的樣本數量,從而大大降低了檢測的成本以及耗費的時間。
文檔編號C12Q1/68GK102703595SQ20121019364
公開日2012年10月3日 申請日期2012年6月13日 優先權日2012年6月13日
發明者劉全俊, 李俊吉, 陸祖宏 申請人:東南大學