麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種對目標區域進行測序的方法及試劑盒的制作方法

文檔序號:400372閱讀:401來源:國知局
專利名稱:一種對目標區域進行測序的方法及試劑盒的制作方法
技術領域
本發明涉及基因工程領域,更具體地說,涉及一種對目標區域進行測序的方法及試齊U盒。
背景技術
自從人類基因組核苷酸序列草圖和許多其他基因組草圖問世,以及人類和許多其他生物體基因組草圖中大量單核苷酸多態性(SNP)和小的插入/缺失多態性的發現,人們開始對核酸測定產生興趣。研究表明,某些特定位置的核酸序列變異包含了大量的生物學信息,可能與人類或動植物的某些性狀相關,這些信息將對醫藥和農業等的方方面面產生廣泛的影響。舉例來說,可以預期的是,這個領域的發展有可能實現個性化醫療。目前,對目標區域(特定位置)進行測序的常見方法為Sanger測序法,通過 Sanger測序法能夠對目標區域進行區域檢測,但是Sanger測序法每次只能對一個樣品的某一段區域進行測序,測序成本高,靈敏度低(20% ),且不能得出各突變位點發生變異的精確數據。因此,需要一種能同時對待測樣品的多個目標區域進行區域檢測的新方法,該方法能夠準確得到這些區域的序列信息,包括已知突變和未知突變的各突變位點的變異情況,檢測靈敏度高,還能進一步同時對大量樣品進行檢測。

發明內容
本發明的目的在于提供一種對目標區域進行測序的方法及試劑盒,能同時對待測樣品的多個目標區域進行區域檢測,準確得到這些區域的序列信息,包括已知突變和未知突變的各突變位點的變異情況,檢測靈敏度高,還能進一步同時對大量樣品進行檢測。本發明是這樣實現的,一種對目標區域進行測序的方法,包括以下步驟A.利用特異性引物,對待測樣品中的多個目標區域進行擴增,并基于擴增產物構建測序文庫;B.對測序文庫進行單分子擴增,得到與所述多個目標區域對應的多個單分子擴增產物;C.同時對所述多個單分子擴增產物進行高通量基因測序,得到所述多個目標區域的序列信息。其中,所述步驟A包括以下步驟Al.利用特異性引物,對待測樣品中的多個目標區域進行擴增,得到與所述多個目標區域對應的擴增產物;A2.利用接頭元件,與所述多個目標區域對應的擴增產物進行連接,得到測序文庫;所述接頭元件采用平末端接頭、突出末端接頭、帶莖環結構的接頭和分叉接頭中的至少一種。其中,步驟A2包括以下步驟
A21.對與所述多個目標區域對應的擴增產物進行片段化,得到片段化產物;A22.利用接頭元件,與片段化產物進行連接,構建測序文庫。步驟A所述的目標區域測序文庫的長度無特殊限制,優選為25bp 500bp。更優選為50bp 200bp,更優選為70bp 130bp。其中,所述步驟A22包括以下步驟A221.利用第一接頭與片段化產物的兩端連接,得第一連接產物;A222.環化第一連接產物,得環化產物;A223. II s型限制性內切酶酶切環化產物,得酶切產物; A224.在酶切產物兩端接上第二接頭和第三接頭,得測序文庫。其中,所述步驟A22包括以下步驟Α22Γ .利用第四接頭與片段化產物連接,得第二連接產物;A222’ . II s型限制性內切酶酶切第二連接產物,得帶有第四接頭的酶切片段;A223’ .帶有第四接頭的酶切片段與第五接頭連接,形成測序文庫。其中,步驟A2所述接頭元件中的至少一個接頭包含有第一標簽序列,用于在文庫構建過程中,對不同待測樣品的測序文庫進行標記。所述第一標簽序列,優選為帶有特定堿基序列的核酸分子,其堿基數不限。進一步的,所述第一標簽序列堿基數為3 20,更優選為4 10。其中,步驟A所述的特異性引物與目標區域完全互補或部分互補。進一步的,每個目標區域對應的特異性引物中,至少一條引物與該目標區域部分互補,該部分互補的引物的5’端包含有第二標簽序列,用于在擴增目標區域過程中,對不同待測樣品的目標區域擴增產物進行標記。所述第二標簽序列,優選為帶有特定堿基序列的核酸分子,其堿基數不限。進一步的,所述第二標簽序列堿基數為3 20,更優選為4 10。其中,所述步驟A中同一樣品的各目標區域的擴增,同時進行或部分同時進行或分別獨立進行。其中,步驟B所述的單分子擴增的方法為乳液PCR、橋式PCR中的至少一種。其中,步驟C所述的高通量測序技術為基于聚合酶的合成測序法或基于連接酶的連接測序法。本發明的還提供了一種能夠用于本發明的任一種測序方法的試劑盒,本發明是這樣實現的,一種對目標區域進行測序的試劑盒,包括特異性引物,用于對待測樣品中的多個目標區域進行擴增;接頭元件,用于與擴增產物結合構建測序文庫。其中,所述接頭元件采用平末端接頭、突出末端接頭、帶莖環結構的接頭和分叉接頭中的至少一種。其中,所述接頭元件中的至少一個接頭包含有第一標簽序列,用于在文庫構建過程中,對不同待測樣品的測序文庫進行標記。所述第一標簽序列優選為帶有特定堿基序列的核酸分子,其堿基數不限,優選為3 20。其中,所述的特異性引物與目標區域完全互補或部分互補。進一步的,每個目標區域對應的特異性引物中,至少一條引物與該目標區域部分互補,該部分互補的引物的5’端包含有第二標簽序列,用于在擴增目標區域過程中,對不同待測樣品的目標區域擴增產物進行標記。所述第二標簽序列優選為帶有特定堿基序列的核酸分子,其堿基數不限,優選為3 20,更優選為4 10。 與現有技術相比,本發明的方法及試劑盒通過高通量測序技術對待測樣品的多個目標區域同時進行深度測序,準確得出這些目標區域的序列信息,包括已知突變和未知突變的各突變位點的變異情況,精確得出各樣品的各突變位點發生變異的頻率,檢測靈敏度高,并能進一步對大量樣品同時進行多區域測序。


圖1是本發明一個實施例中的對目標區域進行測序的的方法流程圖;圖2是本發明一個實施例中的單突出末端接頭的接頭示意圖;圖3是本發明一個實施例中的雙突出末端接頭的結構示意圖;圖4是本發明一個實施例中的帶莖環結構的接頭的結構示意圖;圖5是本發明一個實施例中的分叉接頭的結構示意圖;圖6是本發明一個實施例中的T末端分叉接頭的結構示意圖;圖7是本發明另一個實施例中的分叉接頭的結構示意圖;圖8是本發明一個實施例中的雙脫氧分叉接頭的結構示意圖;圖9是本發明一個實施例中利用片段化產物和接頭元件構建測序文庫的方法流程圖;圖10是本發明另一個實施例中利用片段化產物和接頭元件構建測序文庫的方法流程圖;圖11是本發明另一個實施例中利用片段化產物和接頭元件構建測序文庫的方法流程圖。
具體實施例方式為了使本發明的目的、技術方案及優點更加清楚明白,以下結合附圖及實施例,對本發明進行進一步詳細說明。本發明所述的目標區域,為任意基因組上的任意序列,可根據需要進行選擇,包括但不限于基因的內部序列、基因的外部調控區域,所述基因的內部序列,包括但不限于基因的內含子區域、外顯子區域、同時含有內含子與外顯子的區域。圖1示出了本發明的一種對目標區域進行測序的方法流程,該方法包括以下步驟Si.利用特異性引物,對待測樣品中的多個目標區域進行擴增,并基于擴增產物構建測序文庫;S2.對測序文庫進行單分子擴增,得到與所述多個目標區域對應的多個單分子擴增產物;S3.同時對所述多個單分子擴增產物進行高通量基因測序,得到所述多個目標區域的序列信息。本方法通過高通量測序技術對待測樣品的目標區域進行深度測序,該方法能同時對待測樣品的多個目標區域進行檢測,準確得到這些區域的序列信息,包括已知突變和未知突變的各突變位點的變異情況,檢測靈敏度高,能精確得出各樣品的各突變位點發生變異的頻率。此外,通過控制各目標區域擴增產物的大小,可免去了片段化步驟,減少了實驗步驟,提高了實驗效率,降低了成本。通過本方法所得的序列信息,可用于各種科學研究,包括但不限于人群序列分析、 基因功能研究、蛋白功能研究。需要說明的是步驟Sl中所述待測樣品為能提取核酸的任意形式的樣品,包括但不限于全血、 血清、血漿和組織樣品;所述組織樣品包括但不限于石蠟包埋組織、新鮮組織和冰凍切片。步驟Sl所得測序文庫中,存在多種測序文庫分子,對測序文庫進行單分子擴增, 即是指,將測序文庫中的多種文庫分子,以極微量(甚至單分子)的形式在空間上隔離(但這些文庫分子整體上還是屬于同一個反應體系),并且在各自的空間內實現擴增,以提升各種分子在后續測序反應中的信號。現有技術中,Sanger測序技術每次只能對一個樣品的某一段區域進行測序,要實現對多個目標區域的測序,只能是通過多次反應來實現。而在本發明中,測序文庫中的各個分子經過單分子擴增后,每個測序文庫分子均形成單分子拷貝陣列,各單分子拷貝陣列在進行高通量基因測序時處于不同的位置,使得測序引物與單分子拷貝陣列之間的雜交,以及在酶作用下的延伸反應可同時進行,相互之間互不干擾。因此,可以同時對大量的(成百萬上千萬,甚至更多的)單分子拷貝陣列同時進行測序反應,然后通過采集相應的信號, 進而獲得所需的序列信息,且測序的靈敏度較Sanger更高。其中,步驟Sl所述的特異性引物與目標區域完全互補或部分互補。進一步的,每對針對目標區域的引物中,至少一條引物與目標區域部分互補,且該引物的5’端帶有第二標簽序列。該第二標簽序列,用于在擴增目標區域過程中,對不同待測樣品的目標區域擴增產物進行標記。該第二標簽序列,優選為帶有特定序列的核酸分子,其堿基數不限。該第二標簽序列的堿基數優選為3 20,更優選為4 10。此外,所述特異性引物還可帶有其它標記物,包括但不限于生物素標記、多聚組氨酸標記、抗原、抗體,從而使得目標區域擴增產物的純化極為方便。另外,同一待測樣品的不同目標區域的擴增可同時進行或分別獨立進行或部分同時進行。在具體的實驗過程中,可根據需要選用上述任一種方案進行。如果分別對各目標區域進行分別擴增的話,能夠通過測定擴增產物的量來確保步驟Sl中用于構建目標區域測序文庫的目標區域擴增產物的分子數保持一致,不會因為擴增步驟而導致同一待測樣品的不同目標區域拷貝數不同,進而影響后續的測序反應結果。當然,當各目標區域的大小相近,GC含量也相近的時候,通過合理的設計引物,利用多重PCR技術,步驟Sl可對多個目標區域進行同時擴增,且保證各目標區域之間的擴增效率保持基本一致,這樣就能夠有效的提高實驗效率,降低反應的成本。當待測樣品有多個時,不同樣品的目標區域的擴增必須分別進行。在一個實施例中,步驟Sl的具體實現過程是
Sll.利用特異性引物,對待測樣品中的多個目標區域進行擴增,得到與所述多個目標區域對應的擴增產物;S12.利用接頭元件,與所述多個目標區域對應的擴增產物進行連接,得到測序文庫;所述接頭元件采用平末端接頭、突出末端接頭、帶莖環結構的接頭和分叉接頭中的至少一種。需要說明的是步驟Sll中,對同一待測樣品中的多個目標區域的擴增,可同時進行或分別獨立進行或部分同時進行。可根據實際情況,如擴增特異性引物的退火溫度,擴增的目標區域的大小、GC含量,擴增的目標區域的數量等,進行相應的調整。不同待測樣品的目標區域的擴增必須分別進行。步驟S12中,所述接頭元件與擴增產物的連接方式,可以采用多種方式實現,包括接頭元件與擴增產物直接連接,或對擴增產物進行處理之后再進行連接。步驟S12中的接頭元件,用于構建測序文庫,可包括一種或多種接頭。其中,步驟S12所述接頭元件中的至少一個接頭包含有第一標簽序列,該第一標簽序列,用于在文庫構建過程中,對不同待測樣品的測序文庫進行標記。這樣,在分別獲得目標區域測序文庫后,不同的待測樣品的目標區域測序文庫可以混合在同一個反應體系中,進行單分子擴增反應,進而同時進行高通量測序。提高測序反應的效率,降低了樣品檢測的成本。該第一標簽序列優選為帶有特定堿基序列的核酸分子,其堿基數不限。進一步的, 所述第一標簽序列的堿基數為3 20,這樣,每次至少能夠對43個樣品進行同時檢測。在綜合考慮各種情況后,如標簽的特異性、接頭的成本、接頭的長度等,第一標簽序列的堿基數優選為4 10。通過第二標簽和第一標簽的結合,本發明的發明每次能夠檢測至少43X43 個樣品,即4096個樣品。接頭的修飾方式有多種,包括但不限于被生物素化或甲基化,或同時被生物素化和甲基化。在一個實施例中,該接頭被生物素化,并與未生物素化的片段化產物連接,生物素的存在有利于構建的測序文庫的分離純化。在另一個實施例中,該接頭被甲基化,并與未甲基化的片段化產物連接,然后用僅切割甲基化DNA的限制性內切酶消化連接產物,因為只有成功連接的連接產物才能被切割,所以只有成功連接的連接物被切割,從而確保酶切產物的單一性。接頭的結構形式也有多種,包括但不限于平末端接頭、突出末端接頭、帶莖環結構的接頭和分叉接頭。構建測序文庫過程中可以使用一種或多種接頭。其中,突出末端接頭、帶莖環結構的接頭和分叉接頭均能夠有效防止在連接過程中多個接頭自連現象的發生。針對接頭的上述接頭形式,以下將提供多個實施例。在第一實施例中,接頭元件采用平末端接頭,該接頭是雙鏈完全互補的核酸分子。在第二實施例中,接頭元件采用突出末端接頭,該接頭是雙鏈核酸分子,該雙鏈核酸分子至少包括一突出末端。該突出末端的堿基數無具體限制,優選為1 10個堿基。根據該雙鏈核酸分子的結構,突出末端接頭可分成兩類,分別是單突出末端接頭、雙突出末端接頭。如圖2所示的單突出末端接頭,其一端為平末端,另一端為突出末端。其中帶有分叉接頭的單突出末端接頭能夠防止接頭自連。為了防止一端為平末端的單突出末端接頭自連,可對平末端上的3’ OH進行修飾(包括但不限于用氨基封閉羥基),或將平末端上的5’ 磷酸基團去除。如圖3所示的雙突出末端接頭,其含有兩個突出末端,這兩個突出末端可在一條核苷酸鏈上(圖3a)或在不同的核苷酸鏈上(圖北)。當這兩個突出末端在不同的核酸鏈上時,他們相互之間不互補,以防在連接時出現接頭自連。在第三實施例中,接頭元件采用帶莖環結構的接頭,如圖4所示。該接頭為單鏈核酸分子,該單鏈核酸分子包括第一互補配對區1、莖環區2和第二互補配對區3(圖如),第一互補配對區1能夠與第二互補配對區3互補配對,且它們形成的互補配對區包括至少一個限制性內切酶識別位點,而通過該酶切識別位點,特定的酶能夠將莖環區切開或切除,從而將單鏈核酸分子變成雙鏈核酸分子,以便于后續的操作。如圖4b所示,帶莖環結構的接頭還可帶有突出末端4,該突出末端可位于單鏈核酸分子的5’端或3’端。突出末端4的存在能夠進一步的防止接頭自連現象的發生。該突出末端優選為T。在第四實施例中,接頭元件采用分叉接頭,如圖5所示,該接頭是雙鏈核酸分子, 包括互補區和分叉區,所述分叉區的兩條單鏈各包含至少一個擴增引物結合位點。優選的, 所述分叉接頭的互補區包括至少一個限制性內切酶識別位點,該酶切識別位點可以在建庫過程中酶切形成末端,以便于進行后續的操作。該分叉接頭的分叉設計能夠在建庫過程避免多個接頭自連現象的出現;所述分叉區上包含的擴增引物結合位點,可以直接用于結合擴增引物,進行擴增反應其中,所述分叉接頭的分叉區的每條鏈各含有N個核苷酸;優選的,9 < NS 30。 其中,所述分叉接頭的配對區互補配對的核苷酸對數不限;優選的,互補配對的核苷酸對數為7 15,更優選的,互補配對的核苷酸對數為9 13。其中,所述分叉接頭的配對區的3’末端為突出末端或平末端。優選的,所述分叉接頭的配對區的3’末端為突出末端,該突出末端可與所述片段化產物的粘性末端互補配對, 提高了連接效率,以利于構建測序文庫反應的順利進行。優選的,所述分叉接頭為T末端分叉接頭,該接頭的配對區的3’末端為突出末端, 且突出末端最后一個堿基為T ;例如圖6所示的T末端分叉接頭,圖中N為A、T、C、G堿基中的任一種。優選的,所述分叉接頭的配對區的3’末端為突出末端,且突出末端的核苷酸包括通用堿基。其中,突出末端的堿基數無特殊限制,優選為1 4。例如圖7所示的分叉接頭, 圖中N為A、T、C、G堿基中的任一種,X為通用堿基。優選的,所述分叉接頭為雙脫氧接頭,該接頭的配對區的3’末端為平末端,且3’ 末端最后一個核苷酸為帶有雙脫氧堿基的核苷酸;例如圖8所示的雙脫氧分叉接頭,圖中N 為A、T、C、G堿基中的任一種,dd表示該3’末端最后一個核苷酸為帶有雙脫氧堿基的胞嘧啶核苷酸。應當說明的是,上述接頭元件只是部分實施例,并不用以限制本發明的保護范圍。關于步驟S12的實現方式在一個實施例中,步驟S12采用接頭元件與擴增產物直接連接的方式,構建出測序文庫。
在另一個實施例中,當目標區域擴增產物較大時或者需要構建的目標區域測序文庫較小時,則對擴增產物進行片段化處理之后,片段化產物再與接頭元件進行連接,構建測序文庫,如圖9所示,步驟S12包括以下步驟S121.對與所述多個目標區域對應的擴增產物進行片段化,得到片段化產物;S122.利用接頭元件,與片段化產物進行連接,構建測序文庫。通過片段化步驟S121將目標區域擴增產物變成較小的片段化產物,從而有助于對目標區域的進一步深度測序。此外,還可以通過片段化處理,將不同的擴增產物變成長短相似的片段化產物,能夠有助于后續的統一測序。需要說明的是步驟S121中,所述片段化目標區域擴增產物的方法有多種,包括但不限于超聲法、噴霧法、化學剪切法和酶切法。可根據實際情況,采用相適應的方法進行實驗。所述片段化處理之后還可包括片段化產物的分離純化以及末端修飾的步驟。根據測序的片段長度需要,對于片段化得到的核酸片段,進行目的核酸片段的分離純化,分離方法可以采用常用方法,如凝膠電泳、蔗糖梯度或氯化銫梯度沉降、柱層析分離等。根據所使用的片段化方法,對所得的目的核酸片段進一步的末端修飾,包括但不限于磷酸化或去磷酸化、末端補平和末端加A,以便于后續的接頭元件連接。上述目的核酸片段長短不限,優選為25bp 500bp,更優選為30bp 200bp,更優選為40 lOObp。步驟S121所述片段化產物的長度不限,優選為25bp 500bp,更優選為30bp 200bp,更優選為40bp lOObp。在實現對目標區域的測序的前提下,隨著目標區域測序文庫分子中含有的目標區域片段長度的減短,高通量測序技術的對目標區域的測序深度加深;而測序深度越深,即對目標區域的每一個堿基位置的測序次數越多,測序結果越準確, 對樣品中的少量突變的檢測就越靈敏;這樣就能夠有效防止因為樣品中帶有突變的目標區域的比例偏低,而導致該突變的測序信號的絕對值偏低,發生測序結果不準確的現象。為了實現對目標區域測序文庫大小的限制,可在步驟S121或S122之后,對片段化產物或目標區域測序文庫進行分離純化。分離純化的方法有多種,包括但不限于凝膠方法、蔗糖梯度或氯化銫梯度沉降和柱層析分離。可根據實際情況,采用相適應的方法進行實驗。根據上述接頭元件,針對步驟S122,下面將通過多個實施例和附圖對本步驟進行進一步的說明。在本發明的一個實施例中,直接在片段化產物的兩端接上接頭形成測序文庫。所述接頭可采用上述的平末端接頭、突出末端接頭、帶莖環結構的接頭和分叉接頭中的至少一種。在本發明的另一個實施例中,如圖10所示,步驟S122具體可由以下步驟實現S1221.利用第一接頭與片段化產物的兩端連接,得第一連接產物;S1222.環化第一連接產物,得環化產物;S1223. II s型限制性內切酶酶切環化產物,得酶切產物;S1224.在酶切產物兩端接上第二接頭和第三接頭,得測序文庫。在步驟S1221中,所述第一接頭可采用平末端接頭、突出末端接頭、帶莖環結構的接頭和分叉接頭中的一種,所述第一接頭包含有II S型限制性內切酶酶切識別位點;所述的II s型限制性內切酶為切割位點在識別序列之外的限制性內切酶,包括但不限于Acu
I、AlwI、Bbs I、BbV I、Bcc I>BceA I>BciV I>BfuA I、Bmr I、Bpm I>BpuE I、Bsa I>BseM
II、BseRI、Bsg I、BsmA I、BsmB I、BsmF I、BspCN I、BspM I、BspQ I、BtgZ I、Ear I、Eci I、EcoP15 I、Fau I、Fok I、Hga I、Hph I、HpyAV、Mbo II、Mly I、Mme I、Mnl I、NmeAIII、 Ple I、Sap I、SfaN I 禾口 TspDT I,優選為 Acu I、Bsg I、EcoP15 I 或 Mme I。當所述第一接頭為分叉接頭時,該II s型限制性內切酶酶切識別位點位于互補區;當所述第一接頭為帶莖環結構的接頭時,限制性內切酶識別位點與莖環結構之間的距離,較II S型限制性內切酶酶切識別位點與莖環結構之間的距離近。若片段化產物經過末端修復酶修復,以及末端加A反應,所述第一接頭優選為帶T 末端的分叉接頭。若片段化產物只是經過末端修復酶修復,將片段化產物的末端補平,則所述第一接頭優選雙脫氧接頭。在步驟S1222中,環化第一連接產物有多種實現方式。在本發明的一實施例中,步驟S1222包括以下步驟S12221.利用酶切引物對第一連接產物進行擴增,得擴增產物;S12222.對擴增產物進行酶切,使得擴增產物形成粘性末端,并自身環化成環化產物。所述酶切引物的3’端分別與第一連接產物的兩個末端部分互補,5’端均含有限制性內切酶識別位點。經過步驟S12221的擴增形成的擴增產物,其兩個末端均含有限制性內切酶識別位點,然后在相應的酶的作用下,使擴增產物的兩端形成粘性末端,且這兩個粘性末端互補,能夠進行自身環化。在本發明的另一個實施例中,所述第一接頭包含有2個酶切識別位點,其中一個為限制性內切酶識別位點,用于使步驟S1222形成的第一連接產物的兩端在相應的酶的作用下,形成粘性末端,且它們之間互補,能夠進行自身環化。另一個為II s型限制性內切酶酶切識別位點,用于在步驟S1223中,利用識別該酶切位點的酶識別環化產物,進行酶切, 進而得到酶切產物。應當說明,以上兩個實施例僅為本發明中的兩種實現環化第一連接產物的實施方案,對于本發明的保護范圍不做任何具體的限制。在步驟S1223中,利用能夠識別第一接頭上的酶切識別位點,并切割環化產物 (DNA)但不切割第一接頭的酶進行酶切。所述第一接頭上的酶切識別位點包括但不限于 Mme I酶切識別位點、Acu I酶切識別位點、Bsg I酶切識別位點。步驟S1224中,所述第二接頭可為平末端接頭、突出末端接頭、帶莖環結構的接頭和分叉接頭中的一種,可帶有生物素標記。所述第三接頭可為平末端接頭、突出末端接頭、 帶莖環結構的接頭和分叉接頭中的一種。第二接頭與第三接頭可相同或不同。優選的,所述第二接頭和第三接頭相同,均為分叉接頭。更優選的,所述分叉接頭為T末端分叉接頭或雙脫氧分叉接頭。需要特別說明的是,步驟S1222與S1223之間還可包括步驟S1222A 滾環擴增環化產物,得滾環擴增產物。通過步驟S1222A,能夠保證后續的酶切步驟S1223有足夠的原材料。又或者,在步驟S1221與S1222之間還可包括步驟S1221A 利用擴增引物對第一連接產物進行擴增,得擴增產物。所述擴增引物分別與第一連接產物兩端的接頭序列互補。 通過步驟S1221A,能夠保證后續的環化步驟有足夠的原材料。本方案可避免在步驟S1222之后進行滾環擴增,而用步驟S1222之前的步驟 S1221A進行普通的PCR擴增代替,可有效減少后續酶切步驟中,II s型限制性內切酶的用量。其中,所述第一接頭優選為分叉接頭。其中,所述分叉接頭的互補區可包含至少一個酶切識別位點。所述酶切識別位點可為普通的限制性內切酶識別位點,也可為II S型限制性內切酶酶切識別位點。其中,步驟S1221A所述擴增引物優選為生物素化引物,有利于擴增產物的回收純化。其中,步驟S1221A所述擴增引物帶有至少一個特異性酶切識別位點。若擴增引物上所帶的特異性酶切識別位點是尿嘧啶堿基,則步驟S1222中利用尿嘧啶特異性切除試劑進行酶切,然后再進行連接環化。若擴增引物所帶特異性酶切識別位點為限制性內切酶識別位點,則步驟S1222中利用相應的限制性內切酶進行酶切,然后再進行連接環化。在本發明的另一個實施例中,如圖11所示,步驟S122具體可由以下步驟實現S1221’ .利用第四接頭與片段化產物連接,得第二連接產物;S1222’ . II s型限制性內切酶酶切第二連接產物,得帶有第四接頭的酶切片段;S1223’ .帶有第四接頭的酶切片段與第五接頭連接,形成測序文庫。需要說明的是在步驟S1221’中,所述第四接頭可采用平末端接頭、突出末端接頭、帶莖環結構的接頭和分叉接頭中的一種,所述第四接頭包含有II S型限制性內切酶酶切識別位點;當所述第四接頭為分叉接頭時,該Π s型限制性內切酶酶切識別位點位于互補區;當所述第四接頭為帶莖環結構的接頭時,限制性內切酶識別位點與莖環結構之間的距離,較II s型限制性內切酶酶切識別位點與莖環結構之間的距離近。在步驟S1222’中,利用能夠識別第四接頭上的酶切識別位點,并切割環化產物 (DNA)但不切割第四接頭的酶進行酶切。所述第四接頭上的酶切識別位點包括但不限于 Mme I酶切識別位點、Acu I酶切識別位點、Bsg I酶切識別位點。若片段化產物經過末端修復酶修復,以及末端加A反應,所述第四接頭優選為帶T末端的分叉接頭。若片段化產物只是經過末端修復酶修復,則所述第四接頭優選雙脫氧接頭。在步驟S1223’中,所述第五接頭可為平末端接頭、突出末端接頭、帶莖環結構的接頭和分叉接頭中的一種,可帶有生物素標記。在本發明的另一個實施例中,步驟S122具體包括以下步驟S1221”.直接在片段化產物的兩端接上帶莖環結構的接頭,形成帶莖環結構的片段化產物;S1222”.利用限制性內切酶,將帶莖環結構的片段化產物的莖環區切開或切除,從而形成測序文庫。本技術方案利用帶莖環結構的接頭,防止了多個接頭自連現象的發生。當通過上述幾個方案形成的測序文庫的數量過少,不利于后續的單分子擴增步驟時,還可以進行以下步驟利用與目標區域測序文庫兩端的接頭部分互補的引物,以所得的測序文庫為模版進行擴增,得擴增后的測序文庫。該步驟可滿足后續實驗對目標測序文庫的量的要求。其中,步驟S2所述的單分子擴增是指對目標區域測序文庫中的分子,以極微量 (甚至單分子)的形式在空間上隔離(但這些文庫分子整體上還是屬于同一個反應體系), 并且在各自的空間內實現擴增,以提升各種分子在后續測序反應中的信號。所述單分子擴增的方法包括但不限于乳液PCR(Emulsion PCR, EPCR)、橋式PCR。所述EPCR最大的特點是可以形成數目龐大的獨立反應空間以進行DNA擴增。基本過程是在PCR反應前,將包含PCR所有反應成分的水溶液注入到高速旋轉的礦物油表面, 水溶液瞬間形成無數個被礦物油包裹的小水滴。這些小水滴就構成了獨立的PCR反應空間。理想狀態下,每個小水滴只含一個DNA模板(目標區域測序文庫分子)和一個磁珠,磁珠上含有與目標區域測序文庫分子的共有序列(由接頭元件引入)互補的引物,在PCR反應后,磁珠表面就固定有拷貝數目巨大的同來源的DNA模板擴增產物。EPCR的具體步驟可參考PCR amplification from single DNA molecules on magnetic beads in emulsion application for high-throughput screening of transcription factor targets, Takaaki Kojima, Yoshiaki Takei, Miharu Ohtsuka et al, Nucleic Acids Research, 2005, Vol. 33, No. 17 ;Dual primer emulsion PCR for nextgeneration DNA sequencing, Ming Yan Xu, Anthony D.Aragon, Monica R. Mascarenas et al, BioTechniques 48 :409-412(May 2010) ;BEAMing :single-molecule PCR on microparticles in water-in-oil emulsions, Frank Diehl, Meng Li, Yiping He, nature methods, Vol.3, No. 7,July 2006 等。所述橋式PCR的基本原理是,橋式PCR的引物被固定在固相載體上,PCR過程中 PCR擴增產物會被固定在固相載體上,且PCR擴增產物能夠與固相載體上的引物互補配對,成橋狀,然后互補配對的引物以與其成橋的擴增產物為模板進行擴增。通過控制初始模板加入的量,橋式PCR反應完成后,擴增產物在固相載體上以一簇簇的形式存在,且每一簇的擴增產物為同來源的DNA模板擴增產物。其具體的原理和實施方案可參考以下文獻 CN20061009879. X、US6227604。如前所述,現有技術中,Sanger測序技術由于自身的技術限制,每次只能對一個樣品的某一段區域進行測序。為了一次性實現對樣品中多個區域的同時檢測,本發明在測序方法上采取高通量基因測序方法。高通量基因測序相對Sanger測序法檢測序列信息更為方便靈敏,測序文庫中的各個分子經過單分子擴增后,每個測序文庫分子均形成單分子拷貝陣列,各單分子拷貝陣列在進行高通量基因測序時處于不同的位置,使得測序引物與單分子拷貝陣列之間的雜交,以及在酶作用下的延伸反應可同時進行,相互之間互不干擾。因此,可以同時對大量的(成百萬上千萬,甚至更多的)單分子拷貝陣列同時進行測序反應, 然后通過采集相應的信號,進而準確的獲得所需的序列信息,且測序的靈敏度較Sanger更高。尤其是對多個目標區域的擴增產物進行了片段化處理,相當于對相同序列的目標區域分子的每個堿基的測序次數增加了,能夠進一步提高測序的靈敏度。其中,步驟S3所述的高通量測序技術包括但不限于基于聚合酶的合成測序法、 基于連接酶的連接測序法。
基于聚合酶的合成測序法是基于帶可去除標記的核苷酸進行的。在每次合成反應中,每個模板鏈至多只能延伸一次,基于聚合酶的合成測序法的大致流程如下a.測序引物通過互補配對結合在單分子擴增產物共有的已知序列上(該單分子擴增產物固定在引物-固相載體復合物上),在DNA聚合酶的作用下,以帶可去除標記的核苷酸進行單堿基延伸合成反應,收集該次加入核苷酸的標記信號,即可得到與測序引物3’ 最末端堿基互補的單分子擴增產物(固定在引物-固相載體復合物上)的下一位的堿基序列信息。b.切除可去除標記,然后在DNA聚合酶的作用下,以帶可去除標記的核苷酸繼續進行單堿基延伸合成反應,收集加入核苷酸的標記信號,即可得到與測序引物3’末端堿基互補的單分子擴增產物的下兩位的堿基序列信息。重復b步驟,直至不能繼續進行合成反應為止,從而獲得單分子擴增產物的全部序列信息。基于連接酶的連接測序法是均是基于帶熒光標記的寡核苷酸探針進行的。其中一種連接酶的連接測序法是基于在特定位置帶有熒光標記的寡核苷酸探針進行的,該寡核苷酸探針帶有η個堿基,從其5’端數起的第a位帶有熒光標記,其中不同的堿基對應特定的熒光標記,因為該寡核苷酸探針的3’端進行了特定的修飾,寡核苷酸探針之間不能直接相互連接,每次連接反應,每個單分子擴增產物只能連接一個寡核苷酸探針。該連接測序法的大致流程如下A.測序引物通過互補配對結合在單分子擴增產物共有的已知序列上(該單分子擴增產物固定在引物-固相載體復合物上)上,利用上述的寡核苷酸探針,在連接酶的作用下,將核酸探針與上述寡核苷酸鏈連接,然后采集熒光信號,即可得到與單分子擴增產物共有的已知序列的3’末端后第a位堿基序列信息。B.切除寡核苷酸上的熒光標記,在連接酶的作用下,以上述的寡核苷酸探針為原料,繼續進行連接反應,然后采集熒光信號,從而得到單分子擴增產物共有的已知序列的3’ 末端后第加位的堿基序列信息。重復B步驟,直至不能繼續進行連接反應為止,從而獲得單分子擴增產物共有的已知序列的3’末端后第adadada......位的堿基序列信息。然后將測序引物及其所連接的寡核苷酸探針從單分子擴增產物上變性洗脫下來, 換用與之前的測序引物相比3’末端少一個堿基的引物重復上述反應,從而獲得單分子擴增
產物共有的已知序列的3’末端后第『1、加-1、3『1、如-1......位的堿基序列信息。重
復此步驟,最后獲得單分子擴增產物共有的已知序列的3’末端后第a-(a-l)、h-(a-l)、 3a-(a-l)、4a-(a-l)......位的堿基序列信息,從而獲得單鏈擴增產物的全部序列信息。另一種連接酶的連接測序法同樣也是基于帶有熒光標記的寡核苷酸探針進行的, 該寡核苷酸探針帶有η個堿基,分為h(h ^ η)組,同一組寡核苷酸探針的不同熒光標記對應同一特定位置的不同堿基序列,不同組之間的區別在于不同熒光標記對應的特定位置不同,因為該寡核苷酸探針的3’端進行了特定的修飾,寡核苷酸探針之間不能直接相互連接,每次連接反應,每個單分子擴增產物只能連接一個寡核苷酸探針。該連接測序法的大致流程如下a.測序引物通過互補配對結合在單分子擴增產物共有的已知序列上(該單分子擴增產物固定在引物-固相載體復合物上)上,利用上述寡核苷酸探針中的一組(熒光標記對應的堿基位置為x,x < h),在連接酶的作用下,將核酸探針與上述寡核苷酸鏈連接,然后采集熒光信號,即可得到與單鏈擴增產物共有的已知序列的3’末端后第χ位堿基序列信息,將測序引物及其所連接的寡核苷酸探針從單分子擴增產物上變性洗脫下來。b.然后重新將測序引物結合在單分子擴增產物上,換用與a步驟不同的寡核苷酸探針組(熒光標記對應的堿基位置為ι, y ( h),在連接酶的作用下,將核酸探針與上述寡核苷酸鏈連接,然后采集熒光信號,即可得到與單鏈擴增產物共有的已知序列的3’末端后第y位堿基序列信息,將測序引物及其所連接的寡核苷酸探針從單分子擴增產物上變性洗脫下來。c.重復步驟b,直至h組寡核苷酸探針均分別進行過一次連接反應,從而獲得單分子擴增產物共有的已知序列的3’末端后第1、2.......h位的堿基序列信息。換用與之前的測序引物相比3’末端多一個或各通用堿基的引物按上述原理進行反應,能夠延長獲得的單分子擴增產物共有的已知序列的3’末端堿基序列的讀長。這種基于連接酶的連接測序法的原理和具體實施方案可參考CN200710170507. 1。以檢測EGFR基因的外顯子19、21為例,本發明提出一實施例,設計用于擴增EGFR 基因外顯子 19、21 的特異性引物19F(SEQ ID NO :1)、19R(SEQID NO :2)、21F (SEQ ID NO: 3)、21R(SEQ ID NO :4)。一、待測樣品DNA的提取利用市場上常見的核酸提取試劑盒分別提取全血樣品(1至10)、血清樣品(11至 20)、石蠟組織樣品(21至30)的DNA,并分別做上相應的標記。二、目標區域的擴增同一樣品的EGFR基因外顯子19、21的擴增在同一反應體系中進行,反應體系如
下19F(10yM)2μ L ;19R(10yM)2μ L ;21F(10yM)2μ L ;21R(10yM)2μ L ;dNTP(各 2.5mM)4μ L ;待測樣品DNA20ng ;Ex Taq(5U/yL)0. 25 μ L ;IOXEx Taq Buffer5μ L ;ddH20up to 50 μ L。PCR反應條件如下95 °C 3min ;94°C 30s, 58°C 30s,72°C 30s ;重復 25 個循環;72 °C 7min。利用PCR清潔試劑盒,分別對各樣品的擴增產物進行清潔,除去未擴增的引物和 dNTP,回收擴增產物。三、構建目標區域測序文庫
此步驟可有多種實施方案,本發明的一個實施例中,包括以下兩個步驟
1.擴增產物的片段化
利用超聲法進行片段化處理。具體操作為將每個樣品的PCR清潔回收后的擴增產物(約50yL)加入至400yL的TE buffer中,在430W功率條件下超聲如,間隔20s,反復5次,得片段化產物。利用瓊脂賴■凝膠對各樣品的片段化產物進行分離純化,切膠回收大小在40bp至IOObp之間的片段化產物。
2.構建測序文庫
在構建目標區域測序文庫之前,需對切膠回收的片段化產物分別進行末端修飾,以便于接頭元件的連接。在本實施例中,對切膠回收的片段化產物的末端修飾包括磷酸化、末端補平和末端加A反應。
具體實現如下
1)磷酸化以及末端補平反應
體系為
切膠回收的片段化產物20 μ L (約 2000ng);
IOmM dNTP1. 5μ L ;
T4DNA 聚合酶(5U/ μ L)IuL ;
Klenow DNA聚合酶0. 1 μ L ;
Τ4多核苷酸激酶(ιου/μ 0. 5μ L ;
IOm MATP1. 5μ L ;
10ΧΤ4連接酶緩沖液10μ L ;
力口 ddH20 至 100 μ L。
反應條件為20°C孵育20min。反應結束后利用回收試劑盒進行純化回收。
2)末端加A尾
反應體系為
磷酸化以及末端補平后的回收產物 60 μ L(約IOOOng);
Klenow 緩沖液(NEB Buffer2)10μ L ;
IOmM dATP2μ L ;
Klenow 酶(3,to 5,exo minus, 10U/ μ L) 1 μ L ;
力口 (1(1!120至 100 μ L。
反應條件為37°C孵育30min。反應結束后利用純化試劑盒純化回收。
3)連接接頭1
本實施例中,采用如圖6所示的T末端分叉接頭作為接頭1,同一樣品的所使用的T末端分叉接頭相同,不同樣品的T末端分叉接頭不同,區別在于標簽序列不同,不同樣品對應的標簽序列如下表所示。
樣本編號標簽序列樣本編號標簽序列樣本標簽序列1AGCT11GACT21CGAT2AGTC12GATC22CGTA3ATGC13GTCA23CTGA4ATCG14GTAC24CTAG5ACTG15GCAT25CAGT6ACGT16GCTA26CATG7AAGG17ACAC27TGTC8AACC18AGAG28TCTG9TTGG19TCTC29AGAC10TTCC20TGTG30ACAG 在T4連接酶的作用下,上述T末端分叉接頭分別與加A尾后純化回收的產物進行連接,形成帶接頭1的片段。連接體系為加A尾后純化回收的產物50 μ L (約 500ng);
接頭12 μ L (約 3000ng);
IOmM ATP5 μ L ;
T4DNA 連接酶(lOU/μ L)IuL ;
10ΧΤ4連接酶緩沖液10μ L ;
力口 ddH20 至 100 μ L。
反應條件為16°C孵育4h以上。反應結束后利用純化試劑盒純化回收。
4) PCR擴增帶接頭1的片段
擴增體系為
帶接頭1的片段約 300ng ;
IOXEx Taq Buffer100μ L ;
Primer F(100 μ Μ, SEQ ID NO :11)10μ L ;
Primer R(100 μ M,SEQ ID NO :12)10μ L ;
Ex Taq(5U/μ L)7. 5μ L ;
ddH20 up to IOOOyL0
PCR反應條件如下
95 °C 3min ;
94°C 30s, 58°C 30s, 72°C 30s ;重復 25 個循環;
72 °C 7min。
利用PCR清潔試劑盒,分別對各樣品的擴增產物進行清潔,除去未擴增的引物和
dNTP,回收帶接頭1的片段的擴增產物。5)11 s型限制性內切酶酶切利用Acu I酶切回收后的帶接頭1的片段的擴增產物,反應體系如下
17
回收后的帶接頭1的片段的擴增產物10XNEB Buffer 4Acu I (NEB)SAM (3. 2mM)
60μ L(3 5μ g); 8μ L ; 2 μ L(IOU);
50 μ Μ);ddH20 up to 80 μ L。反應條件37°C孵育lh。反應結束后利用純化試劑盒純化回收酶切產物。6)連接接頭2利用如圖7所示的突出末端分叉接頭作為接頭2,與回收的酶切產物進行連接,得測序文庫,連接體系如下回收的酶切產物2yg;接頭2IyL(IOpM);10T4DNA 連接酶(3U/ μ L)1 μ L ;10 X Τ4連接酶緩沖液2 μ L ;力口 ddH20 至 100 μ L。連接條件,14°C孵育池。反應結束后利用純化試劑盒純化回收,然后變性形成單鏈,得測序文庫。四、對目標區域測序文庫進行單分子擴增測定(三)步驟所獲得30個目標區域測序文庫各自的濃度,然后按同等濃度混合,然后進行單分子擴增,得單分子擴增產物,所述單分子擴增的方法可采用EPCR或橋式 PCR。優選為EPCR擴增,單分子擴增引物優選為SEQ ID NO 5和SEQ ID NO :6。五、對單分子擴增產物進行高通量測序所述測序方法可采用基于合成酶的合成測序法,也可采用基于連接酶的連接測序法。對測序結果進行生物信息學分析,即可得到上述30個樣品的EGFR基因的外顯子19和 21的序列信息。分析序列結果可知,除樣品23的EGFR基因的外顯子19發生突變外(序列信息見SEQ ID NO :8,突變率為6.2%),其它樣品的各外顯子均為野生型。應當說明的是,本實施例只是本發明的一個具體實施例,對本發明無任何限定作用,例如EGFR基因的特異性引物可用其他的經過合理設計的引物進行替換;除此之外,本實施例中的多個步驟均可參照前述的方法進行替換,在此不再贅述。針對本發明的對目標區域進行測序的方法的靈敏度,本發明采用下述實施例進行驗證。通過常規設計,構建分別含有EGFR基因外顯子19野生型序列(SEQ IDNO 7)和突變型序列(SEQ ID NO 8)的質粒;含有EGFR基因外顯子21野生型序列(SEQ ID NO 9)和突變型序列(SEQ ID NO: 10)的質粒。然后配制突變率分別為20%、10%、5%、3%、1%、0%的質粒混合液。以含有1000 個拷貝質粒的上述質粒混合液為模板,然后按參照上述實施例的方法進行檢測。檢測結果如下表所示
權利要求
1.一種對目標區域進行測序的方法,其特征在于,包括以下步驟A.利用特異性引物,對待測樣品中的多個目標區域進行擴增,并基于擴增產物構建測序文庫;B.對測序文庫進行單分子擴增,得到與所述多個目標區域對應的多個單分子擴增產物;C.同時對所述多個單分子擴增產物進行高通量基因測序,得到所述多個目標區域的序列信息。
2.根據權利要求1所述的對目標區域進行測序的方法,其特征在于,所述步驟A包括以下步驟Al.利用特異性引物,對待測樣品中的多個目標區域進行擴增,得到與所述多個目標區域對應的擴增產物;A2.利用接頭元件,與所述多個目標區域對應的擴增產物進行連接,得到測序文庫;所述接頭元件采用平末端接頭、突出末端接頭、帶莖環結構的接頭和分叉接頭中的至少一種。
3.根據權利要求2所述的對目標區域進行測序的方法,其特征在于,所述步驟A2包括以下步驟A21.對與所述多個目標區域對應的擴增產物進行片段化,得到片段化產物; A22.利用接頭元件,與所述片段化產物進行連接,構建測序文庫。
4.根據權利要求3所述的對目標區域進行測序的方法,其特征在于,所述步驟A22包括以下步驟A221.利用第一接頭與片段化產物的兩端連接,得第一連接產物; A222.環化第一連接產物,得環化產物; A223. II s型限制性內切酶酶切環化產物,得酶切產物; A224.在酶切產物兩端接上第二接頭和第三接頭,得測序文庫。
5.根據權利要求3所述的對目標區域進行測序的方法,其特征在于,所述步驟A22包括以下步驟Α22Γ .利用第四接頭與片段化產物連接,得第二連接產物;A222’ . II s型限制性內切酶酶切第二連接產物,得帶有第四接頭的酶切片段;A223’ .帶有第四接頭的酶切片段與第五接頭連接,形成測序文庫。
6.根據權利要求2至5任一項所述的對目標區域進行測序的方法,其特征在于,步驟 A2所述的接頭元件中的至少一個接頭包含有第一標簽序列,用于在文庫構建過程中,對不同待測樣品的測序文庫進行標記。
7.根據權利要求1至5任一項所述的對目標區域進行測序的方法,其特征在于,每個目標區域對應的特異性引物中,至少有一條引物與該目標區域部分互補,該部分互補的引物的5,端包含有第二標簽序列,用于在擴增目標區域過程中,對不同待測樣品的目標區域擴增產物進行標記。
8.一種對目標區域進行測序的試劑盒,其特征在于,包括 特異性引物,用于對待測樣品中的多個目標區域進行擴增; 接頭元件,用于與擴增產物結合構建測序文庫。
9.根據權利要求8所述的對目標區域進行測序的試劑盒,其特征在于,所述接頭元件采用平末端接頭、突出末端接頭、帶莖環結構的接頭和分叉接頭中的至少一種。
10.根據權利要求8所述的對目標區域進行測序的試劑盒,其特征在于,所述接頭元件中的至少一個接頭包含有第一標簽序列,用于在文庫構建過程中,對不同待測樣品的測序文庫進行標記。
11.根據權利要求8至10任一項所述的對目標區域進行測序的試劑盒,其特征在于,每個目標區域對應的特異性引物中,至少有一條引物與該目標區域部分互補,該部分互補的引物的5’端包含有第二標簽序列,用于在擴增目標區域過程中,對不同待測樣品的目標區域擴增產物進行標記。
全文摘要
本發明涉及基因工程領域,提供了一種對目標區域進行測序的方法及試劑盒,該方法包括以下步驟A.利用特異性引物,對待測樣品中的多個目標區域進行擴增,并基于擴增產物構建測序文庫;B.對測序文庫進行單分子擴增,得到與所述多個目標區域對應的多個單分子擴增產物;C.同時對所述多個單分子擴增產物進行高通量基因測序,得到所述多個目標區域的序列信息。該方法及其相應的試劑盒利用高通量測序技術對多個目標區域同時進行區域測序,能準確得出這些區域的序列信息,包括已知突變和未知突變位點的變異情況,檢測靈敏度高,并能進一步同時對大量樣品進行檢測。
文檔編號C12Q1/68GK102373288SQ201110391990
公開日2012年3月14日 申請日期2011年11月30日 優先權日2011年11月30日
發明者盛司潼 申請人:盛司潼
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 栾城县| 卓资县| 光泽县| 盐源县| 屏东县| 灵丘县| 南京市| 来安县| 富裕县| 永善县| 泉州市| 松江区| 黎城县| 淮阳县| 潍坊市| 历史| 九龙县| 库车县| 丹江口市| 乃东县| 淮北市| 和政县| 龙岩市| 揭东县| 女性| 穆棱市| 新龙县| 卓尼县| 宁晋县| 寻甸| 开江县| 安徽省| 金沙县| 咸阳市| 永登县| 绵阳市| 吴忠市| 肇州县| 河曲县| 雅江县| 鹤峰县|