相關申請
本申請要求于2013年1月9日提交的美國臨時申請號61/750,682的優先權,其在此通過引用以其整體并入。
背景
存在很多期望從雙鏈DNA(dsDNA)靶分子產生片段化并加標簽的DNA分子文庫的方法和應用。通常,目的是從大的dsDNA分子產生較小的DNA分子(例如,DNA片段),用于用作DNA測序反應中的模板。
目前用于雙鏈DNA的片段化和加標簽用于在下一代測序中使用的很多方法浪費DNA,需要用于片段化的昂貴的設備,并且片段化、加標簽和回收加標簽的DNA片段的過程困難、冗長、費力、耗時、低效、昂貴、需要相對大量的樣品核酸。另外,這些方法中的很多產生加標簽的DNA片段,所述加標簽的DNA片段不完全代表包含于加標簽的DNA片段從其產生的樣品核酸中的序列。因此,本領域需要的是提供當從靶DNA產生加標簽的DNA片段文庫時快速且方便使用的方法,其能容易地應用到核酸分析方法,諸如下一代測序和擴增方法。
概述
本文提供了用于固體支持物上的核酸樣品制備的方法和組合物。所述方法和組合物特別地涉及用于使用固定至固體支持物的轉座子組合物片段化DNA并使DNA加標簽的方法和組合物。本文提供的方法和組合物是有用的,例如,用于產生在下一代測序方法等中使用的加標簽的DNA片段文庫。在一些優選的實施方案中,本發明涉及在固體支持物上從來自任何來源的靶DNA制備線性ssDNA片段,用于基因組、亞基因組、轉錄組、或宏基因組分析,或RNA表達分析,所述靶DNA包括任何感興趣的dsDNA(包括從RNA制備的雙鏈cDNA)。
相應地,本發明提供了制備加標簽的DNA片段的固定的文庫(immobilized library of tagged DNA)的方法,所述方法包括:(a)提供具有轉座體復合物(transposome complex)固定于其上的固體支持物,其中轉座體復合物包含結合至第一多核苷酸的轉座酶,所述第一多核苷酸包含(i)3'部分,所述3'部分包含轉座子末端序列,和(ii)第一標簽,所述第一標簽包含第一標簽域;和(b)在靶DNA藉以被轉座體復合物片段化,并且第一多核苷酸的3'轉座子末端序列藉以轉移至片段的至少一條鏈的5'末端的條件下,將靶DNA施加于固體支持物;從而產生雙鏈片段的固定的文庫,其中至少一條鏈是用第一標簽在5'-加標簽的。在一些實施方案中,轉座體復合物包含第二多核苷酸,所述第二多核苷酸包含與所述轉座子末端序列互補的區域。所述方法還包括(c)提供溶液中的轉座體復合物,并在靶DNA藉以被溶液中的轉座體復合物片段化的條件下使轉座體復合物與固定的片段接觸;從而獲得具有一個末端在溶液中的固定的核酸片段。在一些實施方案中,溶液中的轉座體復合物可包含第二標簽,以使得所述方法產生具有第二標簽的固定的核酸片段,所述第二標簽在溶液中。第一標簽和第二標簽可以是不同的或相同的。
本文還提供了根據以上方法或其他方法制備的具有加標簽的DNA片段的文庫固定于其上的固體支持物。例如,本文提供了具有轉座體復合物固定于其上的固體支持物,其中轉座體復合物包含結合至第一多核苷酸的轉座酶,多核苷酸包含(i)3'部分,所述3'部分包含轉座子末端序列,和(ii)第一標簽,所述第一標簽包含第一標簽域;
本文還提供了產生流通池(flowcell)的方法,包括將多個轉座體復合物固定至固體支持物,所述轉座體復合物包含結合至第一多核苷酸的轉座酶,第一多核苷酸包含(i)3'部分,所述3'部分包含轉座子末端序列,和(ii)第一標簽,所述第一標簽包含第一標簽域。
所述方法還可包括提供具有多個第一多核苷酸固定于其上的固體支持物,以及使固體支持物與轉座酶全酶和第二多核苷酸接觸,所述第二多核苷酸包含與轉座子末端序列互補的區域。在所述方法的一些實施方案中,所述固定包括(a)提供具有擴增引物偶聯至其的固體支持物;(b)使第二多核苷酸與擴增引物之一雜交,所述第二寡核苷酸包含與轉座子末端序列互補的區域,以及與第一標簽互補的區域;(c)使用聚合酶延伸擴增引物以產生包含與第二多核苷酸雜交的第一多核苷酸的雙鏈體,所述第一多核苷酸直接地固定至固體支持物;以及(d)使固體支持物與轉座酶全酶接觸,從而在固體支持物上組裝轉座體復合物。
本文還提供了一種微粒群體,所述微粒群體具有固定至其的轉座體復合物,所述轉座體復合物包含結合至第一多核苷酸的轉座酶和第二多核苷酸;其中第一多核苷酸在其5'末端被固定至微粒的表面并且第二多核苷酸與第一多核苷酸的3'末端雜交;并且其中第一多核苷酸包含:(i)3'部分,所述3'部分包含轉座子末端序列,和(ii)第一標簽,所述第一標簽包含第一標簽域。本文還提供了產生加標簽的DNA片段的固定的文庫的方法,所述方法包括使靶DNA與以上微粒群體接觸以產生固定的加標簽的DNA片段。
本文還提供了產生加標簽的DNA片段文庫的方法,所述加標簽的DNA片段文庫用于索引定向的組裝為較長的序列讀段,所述方法包括:提供具有轉座體復合物固定至其的微粒群體,所述轉座體復合物包含結合至第一多核苷酸的轉座酶和第二多核苷酸,所述第一多核苷酸包含與微粒締合的索引域;將靶DNA施加于微粒群體,從而產生用索引域加標簽的固定的DNA片段。在以上方法的某些實施方案中,第一多核苷酸在其5'末端被固定至微粒的表面并且第二多核苷酸與第一多核苷酸的3'末端雜交;并且其中第一多核苷酸包含:(i)3'部分,所述3'部分包含轉座子末端序列,和(ii)索引域;并且其中微粒群體包括至少多個索引域,并且其中單個微粒上的第一多核苷酸共用相同的索引域。
本文還提供了用于對多個靶DNA分子測序的方法,所述方法包括:在靶DNA藉以被轉座體復合物片段化的條件下,將多個靶DNA施加至具有轉座體復合物固定至其上的固體支持物上;從而產生雙鏈片段的固定的文庫,其中每個靶DNA的第一部分在所述固體支持物上的第一位置處被附接至所述固體支持物,并且每個靶DNA的第二部分在所述固體支持物上的第二位置處被附接至所述固體支持物;以及繪制所述雙鏈片段的固定的文庫的圖譜以產生由每個靶DNA連接的位置的組;確定靶DNA的所述第一部分和所述第二部分的序列;以及關聯所述位置的組以確定第一部分和第二部分的哪些被所述靶DNA連接,并確定靶DNA分子的序列。
在本文提供的方法和組合物的一些實施方案中,轉座體復合物以至少103、104、105、106個復合物每mm2的密度存在于固體支持物上。在一些實施方案中,轉座體復合物包含超活性轉座酶,諸如Tn5轉座酶。
在本文提供的方法和組合物的一些實施方案中,標簽域可包含例如用于簇擴增的區域。在一些實施方案中,標簽域可包含用于引發測序反應的區域。
在本文提供的方法和組合物的一些實施方案中,固體支持物可包括例如微粒、模式化的表面、孔等。在一些實施方案中,轉座體復合物在固體支持物上隨機地分布。在一些實施方案中,轉座體復合物在模式化的表面上隨機地分布。
一個或更多個實施方案的細節在附圖和以下的說明中被描述。其他的特征、目標、和優勢將由說明書和附圖,以及由權利要求而明顯。
本申請提供了以下內容:
項目1.一種制備加標簽的DNA片段的固定的文庫的方法,所述方法包括:(a)提供具有轉座體復合物固定于其上的固體支持物,其中所述轉座體復合物包含結合至第一多核苷酸的轉座酶,所述第一多核苷酸包含(i)3’部分,所述3’部分包含轉座子末端序列,以及(ii)第一標簽,所述第一標簽包含第一標簽域;(b)在靶DNA藉以被所述轉座體復合物片段化,并且所述第一多核苷酸的3'轉座子末端序列藉以轉移至所述片段的至少一條鏈的5'末端的條件下,將所述靶DNA施加于所述固體支持物;從而產生雙鏈片段的固定的文庫,其中至少一條鏈是用所述第一標簽在5'-加標簽的。
項目2.根據項目1所述的方法,其中所述第一多核苷酸被固定至所述固體支持物。
項目3.根據項目1所述的方法,其中所述轉座體復合物包含第二多核苷酸,所述第二多核苷酸包含與所述轉座子末端序列互補的區域。
項目4.根據項目1所述的方法,所述方法還包括洗滌所述固體支持物以移除任何未結合的核酸。
項目5.根據項目1所述的方法,其中所述轉座體復合物以至少103、104、105、106個復合物每mm2的密度存在于所述固體支持物上。
項目6.根據項目1所述的方法,其中所述轉座體復合物包含超活性Tn5轉座酶。
項目7.根據項目1所述的方法,其中所述固定的文庫中的所述雙鏈片段的長度通過增加或減少存在于所述固體支持物上的轉座體復合物的密度來調整。
項目8.根據項目1所述的方法,其中存在于所述固體支持物上的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%的所述標簽包含相同的標簽域。
項目9.根據項目1所述的方法,所述方法還包括:(c)提供溶液中的轉座體復合物,并在所述靶DNA藉以被轉座體復合物溶液片段化的條件下使所述轉座體復合物與所述固定的片段接觸;從而獲得具有一個末端在溶液中的固定的核酸片段。
項目10.根據項目9所述的方法,其中所述溶液中的轉座體復合物包含第二標簽,從而產生具有第二標簽在溶液中的固定的核酸片段。
項目11.根據項目10所述的方法,其中所述第一標簽和所述第二標簽是不同的。
項目12.根據項目9所述的方法,其中溶液中的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%的所述轉座體復合物包含第二標簽,所述第二標簽包含第二標簽域。
項目13.根據項目9所述的方法,所述方法還包括通過提供聚合酶和對應于所述第一多核苷酸的部分的擴增引物來擴增所述固體表面上的所述片段。
項目14.根據項目1所述的方法,其中所述標簽域包含用于簇擴增的區域。
項目15.根據項目1所述的方法,其中所述標簽域包含用于引發測序反應的區域。
項目16.根據項目1所述的方法,其中所述固體支持物包括微粒。
項目17.根據項目1所述的方法,其中所述固體支持物包括模式化的表面。
項目18.根據項目1所述的方法,其中所述固體支持物包括孔。
項目19.根據項目1所述的方法,所述方法還包括將嵌入染料施加于所述固定的片段的至少一部分以獲得染色的固定的片段的組;并獲得所述染色的固定的片段的圖像。
項目20.根據項目1所述的方法,其中施加靶DNA包括將生物樣品添加至所述固體支持物。
項目21.根據項目20所述的方法,其中所述生物樣品包括細胞裂解物。
項目22.根據項目20所述的方法,其中所述生物樣品包括全細胞。
項目23.根據項目20所述的方法,其中所述生物樣品選自由以下組成的組:血液、血漿、血清、淋巴液、粘液、痰、尿液、精液、腦脊液、支氣管抽出物、排泄物和浸漬的組織。
項目24.根據項目1-23中任一項所述的方法制備的具有加標簽的DNA片段的文庫固定于其上的固體支持物。
項目25.一種固體支持物,所述固體支持物具有轉座體復合物固定于其上,其中所述轉座體復合物包含結合至第一多核苷酸的轉座酶,所述多核苷酸包含(i)3’部分,所述3’部分包含轉座子末端序列,以及(ii)第一標簽,所述第一標簽包含第一標簽域。
項目26.根據項目25所述的固體支持物,其中所述轉座體復合物以至少103、104、105、106個復合物每mm2的密度存在于所述固體支持物上。
項目27.根據項目25所述的固體支持物,其中所述轉座體復合物結合至固定的寡核苷酸。
項目28.根據項目25所述的固體支持物,其中所述標簽域包括用于簇擴增的區域。
項目29.根據項目25所述的固體支持物,其中所述標簽域包括用于引發測序反應的區域。
項目30.根據項目25所述的固體支持物,其中所述轉座體復合物包含超活性Tn5轉座酶。
項目31.根據項目25所述的固體支持物,其中所述固體支持物包括微粒。
項目32.根據項目25所述的固體支持物,其中所述固體支持物包括模式化的表面。
項目33.根據項目25所述的固體支持物,其中所述固體支持物包括孔。
項目34.根據項目25所述的固體支持物,其中所述轉座體復合物包含超活性Tn5轉座酶。
項目35.一種產生流通池的方法,所述方法包括將多個轉座體復合物固定至固體支持物,所述轉座體復合物包含結合至第一多核苷酸的轉座酶,所述第一多核苷酸包含(i)3’部分,所述3’部分包含轉座子末端序列,以及(ii)第一標簽,所述第一標簽包含第一標簽域。
項目36.根據項目35所述的方法,其中所述固定包括(a)提供具有多個所述第一多核苷酸固定于其上的固體支持物,以及(b)使所述固體支持物與轉座酶全酶和第二多核苷酸接觸,所述第二多核苷酸包含與所述轉座子末端序列互補的區域。
項目37.根據項目36所述的方法,其中在所述第二多核苷酸與所述第一多核苷酸雜交之后,使轉座酶全酶與所述固體支持物接觸。
項目38.根據項目36所述的方法,其中轉座酶全酶和所述第二多核苷酸同時與所述固體支持物接觸。
項目39.根據項目35所述的方法,其中所述轉座體復合物在溶液中被組裝,并且所述固定包括將所述第一多核苷酸與夾板寡核苷酸連接,所述夾板寡核苷酸被偶聯至所述固體支持物。
項目40.根據項目35所述的方法,其中所述第一多核苷酸首先被固定至所述固體支持物,并與具有第一末端和第二末端的帶環的寡核苷酸雜交,所述帶環的寡核苷酸在所述第一末端與所述固定的第一多核苷酸雜交,并在所述第二末端與溶液相第一多核苷酸雜交。
項目41.根據項目40所述的方法,其中所述固定的第一多核苷酸和所述溶液相第一多核苷酸包含不同的轉座子末端序列并且所述帶環的寡核苷酸在所述第一末端和所述第二末端包含與所述不同的轉座子末端序列的每個互補的序列。
項目42.根據項目35所述的方法,其中所述固定包括(a)提供具有擴增引物偶聯至其的固體支持物;(b)使第二多核苷酸與所述擴增引物之一雜交,所述第二寡核苷酸包含與轉座子末端序列互補的區域和與所述第一標簽互補的區域;(c)使用聚合酶延伸所述擴增引物以產生包含與所述第二多核苷酸雜交的所述第一多核苷酸的雙鏈體,所述第一多核苷酸直接地固定至所述固體支持物;以及(d)使所述固體支持物與轉座酶全酶接觸,從而在所述固體支持物上組裝轉座體復合物。
項目43.根據項目35所述的方法,其中所述標簽域包括用于簇擴增的區域。
項目44.根據項目35所述的方法,其中所述標簽域包括用于引發測序反應的區域。
項目45.根據項目35所述的方法,其中所述轉座體復合物包含超活性Tn5轉座酶。
項目46.根據項目35所述的方法,其中所述固體支持物包括微粒。
項目47.根據項目35所述的方法,其中所述固體支持物包括模式化的表面。
項目48.根據項目35所述的方法,其中所述固體支持物包括孔。
項目49.根據項目35所述的方法,其中所述轉座體復合物以至少103、104、105、106個復合物每mm2的密度存在于所述固體支持物上。
項目50.一種流通池,所述流通池利用根據項目35-49中任一項所述的方法制備。
項目51.一種微粒群體,所述微粒群體具有固定至其的轉座體復合物,所述轉座體復合物包含結合至第一多核苷酸的轉座酶和第二多核苷酸;其中所述第一多核苷酸在其5'末端被固定至所述微粒的表面并且所述第二多核苷酸與所述第一多核苷酸的3'末端雜交;并且其中所述第一多核苷酸包含:(i)3'部分,所述3'部分包含轉座子末端序列,和(ii)第一標簽,所述第一標簽包含第一標簽域。
項目52.根據項目51所述的微粒群體,其中所述第二多核苷酸包含與所述轉座子末端序列互補的區域。
項目53.根據項目51所述的微粒群體,其中所述第二多核苷酸的長約10、11、12、13、14、15、16、17、18、19、20bp。
項目54.根據項目51所述的微粒群體,其中所述第二多核苷酸在其5'末端被磷酸化。
項目55.根據項目51所述的微粒群體,其中每個微粒包括多個所述轉座酶復合物。
項目56.根據項目55所述的微粒群體,每個微粒包括第一多核苷酸的第一子群體和第二子群體,其中所述第一子群體包括第一標簽域并且所述第二子群體包括第二標簽域。
項目57.根據項目51所述的微粒群體,其中每個微粒包括不多于一個所述轉座酶復合物。
項目58.根據項目51所述的微粒群體,所述第一多核苷酸還包含索引域。
項目59.根據項目58所述的微粒群體,所述群體包括多個在所述第一多核苷酸上的索引域。
項目60.根據項目51所述的微粒群體,其中所述轉座體復合物包含超活性Tn5轉座酶。
項目61.根據項目51所述的微粒群體,其中所述微粒為珠。
項目62.根據項目51所述的微粒群體,其中所述微粒為順磁性的。
項目63.根據項目51所述的微粒群體,其中所述微粒群體還包括缺少轉座酶的微粒的子群體。
項目64.根據項目51所述的微粒群體,其中所述微粒群體還包括缺少所述第一多核苷酸的微粒的子群體。
項目65.一種制備加標簽的DNA片段的固定的文庫的方法,所述方法包括使靶DNA與項目51-64中任一項所述的微粒群體接觸,以產生固定的加標簽的DNA片段。
項目66.根據項目65所述的方法,其中所述接觸包括將所述DNA沉淀至一個或更多個所述微粒上。
項目67.根據項目65所述的方法,所述方法還包括固定所述微粒。
項目68.根據項目66所述的方法,其中所述微粒是順磁性的并且所述固定包括將外部磁場施加至所述微粒。
項目69.根據項目65所述的方法,所述方法還包括從所述固體支持物釋放所述固定的加標簽的DNA片段。
項目70.根據項目69所述的方法,其中所述釋放包括從所述固體支持物裂解所述標簽域。
項目71.根據項目69所述的方法,其中所述釋放包括進行抑制PCR。
項目72.一種產生加標簽的DNA片段文庫的方法,所述加標簽的DNA片段文庫用于索引定向的組裝為較長的序列讀段,所述方法包括:提供具有轉座體復合物固定至其的微粒群體,所述轉座體復合物包含結合至第一多核苷酸的轉座酶和第二多核苷酸,所述第一多核苷酸包含與所述微粒締合的索引域;將靶DNA施加至所述微粒群體,從而產生用所述索引域加標簽的固定的DNA片段。
項目73.根據項目72所述的方法,其中所述第一多核苷酸在其5'末端被固定至所述微粒的表面并且所述第二多核苷酸與所述第一多核苷酸的3'末端雜交;并且其中所述第一多核苷酸包含:(i)3’部分,所述3’部分包含轉座子末端序列,以及(ii)所述索引域;并且其中所述微粒群體包括至少多個索引域,并且其中單個微粒上的所述第一多核苷酸共用相同的索引域。
項目74.根據項目72所述的方法,所述方法還包括從所述微粒釋放所述加標簽的DNA片段。
項目75.根據項目74所述的方法,其中所述釋放包括裂解所述第一多核苷酸。
項目76.根據項目74所述的方法,其中所述釋放包括進行抑制PCR。
項目77.根據項目72所述的方法,其中所述第一多核苷酸包含用于從所述微粒釋放所述第一多核苷酸的裂解域。
項目78.根據項目72所述的方法,其中所述第一多核苷酸包含用于簇擴增的區域。
項目79.根據項目72所述的方法,其中所述第一多核苷酸包含用于引發測序反應的區域。
項目80.根據項目72所述的方法,其中所述轉座體復合物包含超活性Tn5轉座酶。
項目81.根據項目72所述的方法,其中所述微粒群體分布于固體表面上。
項目82.根據項目81所述的方法,其中所述固體表面包括孔的陣列。
項目83.根據項目82所述的方法,其中多個所述孔包括每孔一個微粒。
項目84.根據項目73所述的方法,其中通過將外部磁場施加至所述微粒來使群體分布。
項目85.根據項目72所述的方法,所述方法還包括進行測序反應以確定所述索引域和所述加標簽的DNA片段的至少一部分的序列。
項目86.根據項目85所述的方法,所述方法還包括組裝共有共同的索引域的DNA序列,從而產生包含多個子片段的較長的序列讀段。
項目87.根據項目85所述的方法,所述方法還包括確定所述序列讀段中的定相SNP。
項目88.根據項目72所述的方法,其中所述施加包括將所述DNA沉淀至一個或更多個所述微粒上。
項目89.一種用于測序多個靶DNA分子的方法,所述方法包括:a)在靶DNA藉以被轉座體復合物片段化的條件下,將多個所述靶DNA施加至具有所述轉座體復合物固定至其上的固體支持物上;從而產生雙鏈片段的固定文庫,其中每個靶DNA的第一部分在所述固體支持物上的第一位置處被附接至所述固體支持物,并且每個靶DNA的第二部分在所述固體支持物上的第二位置處被附接至所述固體支持物;以及b)繪制所述雙鏈片段的固定的文庫的圖譜以產生由每個靶DNA連接的位置的組;c)確定所述靶DNA的所述第一部分和所述第二部分的序列;以及d)關聯所述位置的組以確定第一部分和第二部分的哪些被所述靶DNA連接,以及確定所述靶DNA分子的序列。
項目90.根據項目89所述的方法,其中步驟c)包括裂解所述固定的雙鏈片段以釋放游離末端。
項目91.根據項目90所述的方法,其中所述裂解包括裂解可裂解位點。
項目92.根據項目91所述的方法,其中所述可裂解位點包含修飾的核苷酸或為限制性酶切位點。
項目93.根據項目90所述的方法,其中所述裂解包括使固定的雙鏈片段與溶液相轉座酶復合物接觸。
項目94.根據項目89所述的方法,其中繪制圖譜包括產生所述固定的DNA的物理圖譜。
項目95.根據項目94所述的方法,其中所述物理圖譜通過成像DNA來產生以確立跨所述固體表面的所述固定的DNA分子的位置。
項目96.根據項目95所述的方法,其中固定的多核苷酸通過將成像劑添加至所述固體支持物并檢測來自所述成像劑的信號來成像。
項目97.根據項目96所述的方法,其中所述成像劑包括可檢測的標記物。
項目98.根據項目96所述的方法,其中所述成像劑包括嵌入染料。
項目99.根據項目89所述的方法,其中所述固體支持物包括流通池。
項目100.根據項目99所述的方法,其中所述固體支持物包括納米通道。
項目101.根據項目99所述的方法,其中所述固體支持物包括具有多個分開的納米通道的流通池。
項目102.根據項目99所述的方法,其中所述固體支持物包括至少10、50、100、200、500、1000、3000、5000、10000、30000、50000、80000或至少100000個納米通道。
項目103.根據項目101所述的方法,其中每個納米通道包括不多于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或不多于1000個單獨的長鏈靶DNA每納米通道。
附圖簡述
圖1a顯示了根據一個實施方案的一般性概念。圖1b顯示了根據一個實施方案的一般性概念。
圖2a是闡述標簽化(tagmentation)反應的示意圖。
圖2b是重繪得到的橋以闡明得到的橋的性質的示意圖。
圖3a闡述了其中兩種形式的轉座體被組裝在流通池的表面上的實施方案。將DNA添加至流通池導致DNA的標簽化以及將DNA偶聯至轉座體。在圖3a中還顯示了不同類型的得到的簇:P7:P7、P5:P5和P5:P7簇。3b闡述了其中兩種形式的轉座體被組裝在流通池的表面上的實施方案。
圖4a闡述了另一個實施方案。在圖4a中,只存在一種形式的表面結合的轉座體(例如,P5轉座體),得到在每個末端具有相同的標簽序列的橋。添加另外的轉座體以進一步片段化橋結構并且并入另外的標簽序列(P7)。
圖4b顯示了擴增以產生從每個轉座體殘余部分(stump)得到的簇的對,所述簇的對代表了起始的完整的DNA樣品中兩個相鄰的片段(圖4b)。
圖5a、5b、5c和5d闡述了用于組裝表面結合的轉座體復合物的不同的方法。圖5a顯示了這種用于組裝表面結合的轉座體復合物的方法的一個實施方案。圖5b顯示了在溶液中組裝的轉座體復合物并且固定包括將第一多核苷酸與夾板(splint)寡核苷酸連接的另外的步驟,所述夾板寡核苷酸偶聯至固體支持物。圖5c顯示了轉座體二聚體通過使帶環的寡核苷酸(looped oligonucleotide)與固定的第一多核苷酸雜交來組裝。圖5d顯示轉座體復合物可被組裝在具有擴增引物固定至其上的標準成對末端流通池上。
圖6a闡述了用于作為實施例1提出的實驗的設計。圖6b闡述了用于作為實施例1提出的實驗的設計。
圖7闡述了在根據實施例1中提出的設計進行的實驗中獲得的代表性數據。
圖8闡述了在根據實施例1中提出的設計進行的實驗中獲得的代表性數據。
圖9是根據一個實施方案組裝珠結合的轉座體并且隨后標簽化的圖解。
圖10是根據一個實施方案組裝珠結合的轉座體并且隨后標簽化的圖解。
圖11是根據一個實施方案組裝珠結合的轉座體并且隨后標簽化的圖解。
圖12是根據一個實施方案組裝珠結合的轉座體并且隨后標簽化的圖解。
圖13是根據一個實施方案的表面結合的轉座體的圖解。
圖14是根據一個實施方案在珠結合的轉座體上進行標簽化的圖解。
圖15是根據一個實施方案在珠結合的轉座體上進行子片段的標簽化和條形碼化的圖解。
圖16是根據一個實施方案在珠結合的轉座體上進行子片段的標簽化和條形碼化的圖解。
圖17是如在實施例3中描述的轉座體組裝的圖解。
圖18a是如在實施例3中描述的轉座體組裝的圖解。
圖18b闡述了如在實施例3中描述的利用轉座體組裝的結果。
詳述
用于測序核酸樣品的現有方案常規地使用將DNA或RNA轉換為模板文庫的樣品制備方法。這些方法可導致DNA樣品的丟失并且通常需要用于片段化的昂貴的設備。另外,樣品制備方法通常是困難、冗長且低效的。
在標準樣品制備方法中,每個模板在任一插入物末端含有適體并且通常需要很多步驟以修飾DNA或RNA并純化期望的修飾反應產物。在將適合的片段添加至流通池之前,在溶液中進行這些步驟,其中適合的片段通過引物延伸反應被偶聯至表面,所述引物延伸反應將雜交的片段拷貝至共價地附接至表面的引物的末端。然后這些‘接種’模板通過若干個循環的擴增產生拷貝的模板的單克隆簇。
在溶液中將DNA轉化成適體修飾的模板,為形成簇和測序做準備所需要的步驟的數目可通過使用轉座酶介導的片段化和加標簽來最小化。本文被稱作“標簽化(tagmentation)”的該方法通常包括DNA通過包含與含有轉座子末端序列的適體復合的轉座酶的轉座體復合物的修飾。標簽化導致同時的DNA的片段化和適體與雙鏈體片段的兩條鏈的5’末端的連接。純化步驟去除轉座酶之后,另外的序列通過PCR被添加至適合的片段的末端。
基于溶液的標簽化具有缺點并且需要若干勞動密集的步驟。另外,在PCR擴增步驟期間可引入偏倚。本文提供的方法和組合物克服了這些缺點并且允許無偏倚樣品制備、簇形成和測序發生在單固體支持物上,對樣品操作或轉移的需求最小。
本公開內容涉及出乎意料的發現,預偶聯至流通池的表面的轉座體復合物可在流通池內有效地片段化、加標簽并固定完整的DNA。在特定的實施方案中,包含轉座體適體的一個或更多條鏈經由其5'末端被附接至流通池的表面。當完整的DNA被泵至流通池上時,標簽化反應以與在基于溶液的標簽化反應中發生的相同方式發生,但是得到的產物片段通過其末端物理地附接至流通池的表面。轉座體適體序列可包含使隨后能夠產生簇并測序的序列。
本文提供的方法和組合物提供了超過基于溶液的標簽化方法的若干優勢。例如,純化的、部分純化的或甚至未純化的完整的DNA模板可被直接地上樣至流通池,用于產生簇,而無之前的樣品制備。另外,初始的完整DNA中序列信息的連續性可通過在流通池表面上并置標簽化的(tagmented)片段來物理地保存。作為另外的優勢,DNA被物理地連接至流通池的表面,所以在DNA的進一步操作之后反應物的純化可通過流通池通道中的流通緩沖液交換來完成。
固體支持物上的標簽化
根據以上,本文提供了制備加標簽的DNA片段的固定的文庫的方法。在一些實施方案中,方法可包括:(a)提供具有轉座體復合物固定于其上的固體支持物,其中轉座體復合物包含結合至第一多核苷酸的轉座酶,第一多核苷酸包含(i)3'部分,所述3'部分包含轉座子末端序列,和(ii)第一標簽,所述第一標簽包含第一標簽域;和(b)在靶DNA藉以被轉座體復合物片段化,并且第一多核苷酸的3'轉座子末端序列藉以被轉移至片段的至少一條鏈的5'末端的條件下,將靶DNA施于固體支持物;從而產生雙鏈片段的固定的文庫,其中至少一條鏈是用第一標簽在5'-加標簽的。
如本文使用的,術語“轉座體復合物”通常地指非共價地結合至雙鏈核酸的轉座酶。例如,復合物可以是在支持非共價復合物形成的條件下與雙鏈轉座子DNA預孵育的轉座酶。雙鏈轉座子DNA可包括但不限于Tn5 DNA、Tn5 DNA的部分、轉座子末端成分、轉座子末端成分的混合物或能與轉座酶諸如超活性Tn5轉座酶相互作用的其他雙鏈DNA。
“轉座酶”指能與含有轉座子末端的成分(例如,轉座子、轉座子末端、轉座子末端成分)形成功能性復合物且例如能在體外轉座反應中催化含轉座子末端的成分插入或轉座至與其一起孵育的雙鏈靶DNA的酶。如本文提供的轉座酶還可包括來自逆轉錄轉座子和逆轉錄病毒的整合酶。轉座酶、轉座體和轉座體復合物通常地是為本領域技術人員所熟知的,如由US 2010/0120098的公開內容所例證的,通過引用其內容全部并入本文。盡管本文描述的很多實施方案涉及Tn5轉座酶和/或超活性Tn5轉座酶,但是將領會能以足夠的效率將轉座子末端插入5'-標簽并片段化靶DNA的任何轉座系統為了其意圖的目的可在本發明中使用。在特定的實施方案中,優選的轉座系統能以隨機或幾乎隨機的方式將轉座子末端插入至5'-標簽并片段化靶DNA。
術語“轉座子末端”指僅展現核苷酸序列(“轉座子末端序列”)的雙鏈核酸DNA,所述核苷酸序列對于與在體外轉座反應中是功能性的轉座酶或整合酶形成復合物是必要的。在一些實施方案中,轉座子末端能與轉座反應中的轉座酶形成功能性的復合物。作為非限制性實例,轉座子末端可包括19-bp外末端(“OE”)轉座子末端、內末端(“IE”)轉座子末端、或被野生型或突變Tn5轉座酶識別的“馬賽克(mosaic)末端”(“ME”)轉座子末端、或如在US 2010/0120098的公開內容中描述的R1和R2轉座子末端,其內容通過引用將其全部并入本文。轉座子末端可包括適于在體外轉座反應中與轉座酶或整合酶形成功能性復合物的核酸或核酸類似物。例如,轉座子末端可包括DNA、RNA、修飾堿基、非天然堿基、修飾的骨架,并且可在一條或兩條鏈中包含缺口。盡管術語“DNA”貫穿本公開內容與轉座子末端的成分相連使用,但是應理解任何合適的核酸或核酸類似物可在轉座子末端中被使用。
術語“轉移鏈(transferred strand)”指兩個轉座子末端的轉移部分。相似地,術語“非轉移鏈(non-transferred strand)”指兩個“轉座子末端”的非轉移部分。轉移鏈的3'-末端在體外轉座反應中被連接或轉移至靶DNA。展現出與轉移的轉座子末端序列互補的轉座子末端序列的非轉移鏈在體外轉座反應中不被連接或轉移至靶DNA。
在一些實施方案中,轉移鏈和非轉移鏈被共價地連接。例如,在一些實施方案中,在單寡核苷酸上提供轉移鏈序列和非轉移鏈序列,所述單寡核苷酸例如,在發卡構造中。像這樣,盡管非轉移鏈的自由末端不通過轉座反應直接地連接至靶DNA,但是非轉移鏈變成間接地附接至DNA片段,因為非轉移鏈通過發卡結構的環連接至轉移鏈。轉座體結構的另外的實例以及制備和使用轉座體的方法可發現于US 2010/0120098的公開內容中,其內容通過引用將其全部并入本文。
如本文使用的術語“標簽”和“標簽域”指展現出用于期望的意圖的目的或應用的序列的多核苷酸的部分或域。本文提供的一些實施方案包括如下轉座體復合物:所述轉座體復合物包含多核苷酸,所述多核苷酸具有含有轉座子末端序列的3'部分和含有標簽域的標簽。標簽域可包含提供任何期望的目的的任何序列。例如,在一些實施方案中,標簽域包含一個或更多個限制性內切核酸酶識別位點。在一些實施方案中,標簽域包含適于與用于簇擴增反應的引物雜交的一個或更多個區域。在一些實施方案中,標簽域包含適于與用于測序反應的引物雜交的一個或更多個區域。將領會任何其他合適的特征可被并入標簽域。在一些實施方案中,標簽域包含具有5和200bp之間的長度的序列。在一些實施方案中,標簽域包含具有10和100bp之間的長度的序列。在一些實施方案中,標簽域包含具有20和50bp之間的長度的序列。在一些實施方案中,標簽域包含具有5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150和200bp之間的長度的序列。
在本文提供的方法和組合物中,轉座體復合物被固定至固體支持物上。在一些實施方案中,轉座體復合物經由一個或更多個多核苷酸被固定至支持物,所述多核苷酸諸如包含轉座子末端序列的多核苷酸。在一些實施方案中,轉座體復合物可經由將轉座酶偶聯至固體支持物的接頭分子被固定。在一些實施方案中,轉座酶和多核苷酸兩者均被固定至固體支持物。當提及將分子(例如,核酸)固定至固體支持物時,術語“固定”和“附接”在本文是可互換地使用的,并且兩個術語均意圖涵蓋直接或間接的、共價或非共價的附接,除非另有明確地或通過上下文的指示。在本發明的某些實施方案中,共價附接可以是優選的,但是通常地所有需要的是,分子(例如,核酸)在于其中意圖使用支持物的條件下保持固定或附接至支持物,例如在需要核酸擴增和/或測序的應用中。
本發明的某些實施方案可使用包括惰性基底或基質(例如,載玻片、聚合物珠等)的固體支持物,所述惰性基底或基質已例如通過應用含有活性基團的中間材料的層或包衣而被功能化,所述活性基團允許共價附接至諸如多核苷酸的生物分子。此類支持物的實例包括但不限于負載于諸如玻璃的惰性基底上的聚丙烯酰胺水凝膠,特別是WO 2005/065814和US 2008/0280773中描述的聚丙烯酰胺水凝膠,其內容通過引用將其全部并入本文。在此類實施方案中,生物分子(例如多核苷酸)可被直接地共價地附接至中間材料(例如水凝膠),但是中間材料其自身可被非共價地附接至基底或基質(例如,玻璃基底)。術語“共價附接至固體支持物”要相應地理解為包括這種排列類型。
本文中術語“固體表面”、“固體支持物”和其他語法等同物指適合于或可被修飾以適合用于附接轉座體復合物的任何材料。如本領域人員將領會的,可能的基底的數目是很巨大的。可能的基底包括但不限于:玻璃和改性的或功能化的玻璃、塑料(包括丙烯酸樹脂、聚苯乙烯以及苯乙烯和其他材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、TeflonTM等)、多糖、尼龍或硝酸纖維素、陶瓷、樹脂、二氧化硅或基于二氧化硅的材料包括硅和改性的硅、碳、金屬、無機玻璃、塑料、光學纖維束、和很多其他聚合物。對于一些實施方案特別地有用的固體支持物和固體表面位于流通池裝置內。示例性流通池在以下被更詳細地描述。
在一些實施方案中,固體支持物包括適于以有序的模式固定轉座體復合物的模式化的表面。“模式化的表面”指在固體支持物的暴露層中或暴露層上不同區域的排列。例如,區域中的一個或更多個可以是其中存在一個或更多個轉座體復合物的特征。特征可被其中不存在轉座體復合物的間隙區域分開。在一些實施方案中,模式可以是行和列形式的形狀的x-y格式。在一些實施方案中,模式可以是特征和/或間隙區域的重復排列。在一些實施方案中,模式可以是特征和/或間隙區域的隨機排列。在一些實施方案中,轉座體復合物在固體支持物上隨機地分布。在一些實施方案中,轉座體復合物在模式化的表面上分布。可在本文描述的方法和組合物中使用的示例性模式化的表面被描述于美國系列號13/661,524或美國專利申請公布2012/0316086 A1中,通過引用將其每個并入本文。
在一些實施方案中,固體支持物包括表面中的孔或凹的陣列。如本領域普遍所知的,這可利用多種技術被制造,包括但不限于照相平板印刷術、沖壓技術、塑模技術和顯微蝕刻技術。如將被本領域人員所領會的,使用的技術將取決于陣列基底的組成和形狀。
固體支持物的組成和幾何結構可隨其使用而不同。在一些實施方案中,固體支持物是平面結構,諸如載片、芯片、微芯片和/或陣列。像這樣,基底的表面可以是平面層的形式。在一些實施方案中,固體支持物包括流通池的一個或更多個表面。如本文使用的術語“流通池”指包含固體表面的室,一種或更多種流體試劑可流動穿過所述室。可在本公開內容的方法中容易地使用的流通池和相關流體系統和檢測平臺的實例被描述于例如Bentley等人,Nature 456:53-59(2008);WO 04/018497;US 7,057,026;WO 91/06678;WO 07/123744;US 7,329,492;US 7,211,414;US 7,315,019;US 7,405,281和US 2008/0108082中,通過引用將其每個并入本文。
在一些實施方案中,固體支持物或其表面是非平面的,諸如管或容器的內表面或外表面。在一些實施方案中,固體支持物包括微球或珠。本文中“微球”或“珠”或“顆粒”或語法上的等同物是指小的離散顆粒。合適的珠成分包括但不限于塑料、陶瓷、玻璃、聚苯乙烯、甲基苯乙烯、丙烯酸聚合物、順磁材料、二氧化釷溶膠、碳石墨、二氧化鈦、乳膠或交聯葡聚糖諸如Sepharose、纖維素、尼龍、交聯膠束和teflon,以及本文概述用于固體支持物的任何其他材料可全部被使用。來自Bangs Laboratories,Fishers Ind.的“微球檢測指南(Microsphere Detection Guide)”是有用的指南。在某些實施方案中,微球為磁性微球或珠。
珠不必是球形的;不規則顆粒可被使用。可選地或另外的,珠可以是多孔的。珠大小范圍從納米即100nm至毫米即1mm,從約0.2微米至約200微米的珠是優選的,并且從約0.5至約5微米的珠是特別地優選的,盡管在一些實施方案中,更小或更大的珠可被使用。
圖1a和1b一般性地闡述了根據一個實施方案的方法。顯示了用接枝的寡核苷酸包被的固體支持物,其一些含有ME序列,在Tn5的存在下將形成物理地偶聯至固體支持物的活性轉座體復合物。這些表面結合的轉座體的密度可通過改變含ME序列的接枝寡核苷酸的密度或通過添加至固體支持物的轉座酶的量來調整。例如,在一些實施方案中,轉座體復合物以至少103、104、105、或至少106個復合物每mm2的密度存在于固體支持物上。
當雙鏈DNA被添加至固體支持物上時,轉座體復合物將對添加的DNA標簽化,從而產生在表面的兩端偶聯的雙鏈片段。在一些實施方案中,橋接的片段的長度可通過改變表面上的轉座體復合物的密度而變化。在某些實施方案中,得到的橋接片段的長度小于100bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1000bp、1100bp、1200bp、1300bp、1400bp、1500bp、1600bp、1700bp、1800bp、1900bp、2000bp、2100bp、2200bp、2300bp、2400bp、2500bp、2600bp、2700bp、2800bp、2900bp、3000bp、3100bp、3200bp、3300bp、3400bp、3500bp、3600bp、3700bp、3800bp、3900bp、4000bp、4100bp、4200bp、4300bp、4400bp、4500bp、4600bp、4700bp、4800bp、4900bp、5000bp、10000bp、30000bp或小于100,000bp。在此類實施方案中,然后橋接的片段可利用標準簇化學反應被擴增入簇中,如通過美國專利號7,985,565和7,115,400的公開內容所例證的,其每個的內容通過引用將其全部并入本文。
在一些實施方案中,模板的長度比利用標準簇化學反應可合適地擴增的長。例如,在一些實施方案中,模板的長度長于100bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1000bp、1100bp、1200bp、1300bp、1400bp、1500bp、1600bp、1700bp、1800bp、1900bp、2000bp、2100bp、2200bp、2300bp、2400bp、2500bp、2600bp、2700bp、2800bp、2900bp、3000bp、3100bp、3200bp、3300bp、3400bp、3500bp、3600bp、3700bp、3800bp、3900bp、4000bp、4100bp、4200bp、4300bp、4400bp、4500bp、4600bp、4700bp、4800bp、4900bp、5000bp、10000bp、30000bp或長于100,000bp。在此類實施方案中,然后可通過添加來自溶液的轉座體進行第二標簽化反應,所述第二標簽化反應使橋進一步片段化,如例如在圖4a中闡述的。第二標簽化反應可因此移除橋的內跨部分(span),留下短的殘余部分錨至表面,所述短的殘余部分能轉變成簇為進一步的測序步驟做準備。在特定的實施方案中,模板的長度可在由選自以上示例性的這些的上限和下限界定的范圍內。
在某些實施方案中,在簇產生之前,通過表面標簽化來固定的DNA可被成像。例如,固定的DNA可用嵌入染料染色并成像以保存表面上的DNA分子的骨架的位置的記錄。簇產生和測序之后,簇的坐標可與其在原始骨架上的位置相關,從而有助于沿著分子的讀段的比對以及基因組組裝。
在一些實施方案中,施加靶DNA的步驟包括將生物樣品添加至所述固體支持物。生物樣品可以是含有DNA的任何類型并且其可被放置于固體支持物上用于標簽化。例如,樣品可包含多種純化狀態的DNA,所述多種純化狀態的DNA包括純化的DNA。但是,樣品不需是完全地純化的,并且可包括例如與蛋白混合的DNA、其他核酸種類、其他細胞組分和/或任何其他污染物。如在以下實施例2中證實的,在一些實施方案中,生物樣品包括以如在體內發現的大約相同的比例存在的DNA、蛋白質、其他核酸種類、其他細胞組分和/或任何其他污染物的混合物。例如,在一些實施方案中,組分以與在完整的細胞中發現的相同的比例被發現。在一些實施方案中,生物樣品具有小于2.0、1.9、1.8、1.7、1.6、1.5、1.4、1.3、1.2、1.1、1.0、0.9、0.8、0.7或小于0.60的260/280比率。在一些實施方案中,生物樣品具有至少2.0、1.9、1.8、1.7、1.6、1.5、1.4、1.3、1.2、1.1、1.0、0.9、0.8、0.7或至少0.60的260/280比率。因為本文提供的方法允許DNA被結合至固體支持物,所以其他污染物只能通過在表面結合的標簽化發生之后洗滌固體支持物來移除。生物樣品可包括例如粗制細胞裂解物或全細胞。例如,以本文描述的方法施于固體支持物的粗制細胞裂解物不需已經受一個或更多個分離步驟,所述分離步驟常規地被用來從其它細胞組分分離核酸。示例性分離步驟被描述于Maniatis等人,Molecular Cloning:A Laboratory Manual,第二版,1989,和Short Protocols in Molecular Biology,編著Ausubel等人中,通過引用在此并入。
因此,在一些實施方案中,生物材料可包括例如血液、血漿、血清、淋巴液、粘液、痰、尿液、精液、腦脊液、支氣管抽出物、排泄物和浸漬的組織,或其裂解物,或含有DNA的任何其他生物樣品。本文提供的方法和組合物的一個優勢是生物樣品可被添加至流通池并且隨后的裂解和純化步驟可簡單地通過使必需的反應物流入流通池而全部發生于流通池中,而無另外的轉移或操作步驟。以下的實施例1和2證實粗制細胞裂解物成功的應用到本文提供的方法和組合物。
圖2a和2b還闡述了根據一個實施方案的標簽化反應。如在圖2a中顯示的,轉座體包括Tn5的二聚體,每個單體結合雙鏈分子,即ME適體。ME適體的一條鏈被共價地附接至流通池的表面。轉座體結合靶DNA并在DNA骨架中產生兩個缺口,在任一鏈上相距9個堿基。盡管圖2a顯示了缺口之間的9bp空隙,但是在其他實施方案中,轉座體可在缺口之間產生7、8、9、10、11或12bp的空隙。每個ME適體的兩條鏈中只有一條在每個缺口位置被連接至5'鏈。這種鏈“轉移鏈”經由其5'末端被接枝至流通池的表面。在圖2b中重繪了表面標簽化得到的橋以闡明得到的橋的性質。
圖3a和3b闡述了發明應用于實踐的實例。3b闡述了其中兩種形式的轉座體被組裝在流通池的表面上。第一形式包括P7轉座體,其中ME適體的‘轉移鏈’包含將轉座體連接至包含擴增域(P7)和測序引物(S2)的表面的延伸的寡核苷酸序列。第二形式包括P5轉座體,其中ME適體的‘轉移鏈’包含將轉座體連接至包含擴增域(P5)和測序引物(S1)的表面的延伸的寡核苷酸序列。將DNA添加至流通池導致DNA的標簽化以及將DNA偶聯至轉座體。三種類型的橋結果:P5-P5、P7-P7和P5-P7。在簇形成和線性化之后(圖3b),P5-P5或P7-P7簇被移除(取決于線性化)。如在圖3b中顯示的,如果線性化經由P5發生,則只有P5-P7和P7-P7橋保留。P7-P7簇不通過該反應線性化,并且因此將不會被測序。在用于測序的讀段2線性化期間,隨后移除P7-P7簇。
本文提供的方法還可包括在溶液中提供轉座體復合物,并在靶DNA藉以被轉座體復合物溶液片段化的條件下使固相轉座體復合物與固定的片段接觸的另外的步驟;從而獲得具有一個末端在溶液中的固定的核酸片段。在一些實施方案中,溶液中的轉座體復合物可包含第二標簽,以使得所述方法產生具有第二標簽的固定的核酸片段,所述第二標簽在溶液中。第一和第二標簽可以是不同的或相同的。
在一些實施方案中,一種形式的表面結合的轉座體主要地存在于固體支持物上。例如,在一些實施方案中,存在于所述固體支持物上的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或至少99%的標簽包含相同的標簽域。在此類實施方案中,在用表面結合的轉座體的初始標簽化反應之后,至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或至少99%的橋結構在橋的每個末端包含相同的標簽域。可通過添加來自溶液的轉座體進行第二標簽化反應,所述第二標簽化反應使橋進一步片段化。在一些實施方案中,大多數或全部的溶液相轉座體包含不同于存在于第一標簽化反應中產生的橋結構上的標簽域的標簽域。例如,在一些實施方案中,存在于溶液相轉座體中的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或至少99%的標簽包含不同于存在于第一標簽化反應中產生的橋結構上的標簽域的標簽域。
圖4a和4b闡述了該實施方案。在圖4a中顯示的固體支持物只包括含有單一類型的標簽序列(例如,P5轉座體)的表面結合的轉座體。在該實例中,所有標簽化的橋為P5-P5橋。從溶液添加P7轉座體并標簽化至橋中,使所有表面結合的分子為P5-P7模板。表面結合的片段可隨后地轉換為簇(參見例如圖4b)。此外,一對簇將從每個轉座體殘余部分產生,所述轉座體殘余部分代表了起始的完整DNA樣品中兩個相鄰的片段(圖4b)。
本文還提供了根據以上方法制備的具有加標簽的DNA片段文庫固定于其上的固體支持物。
固定的多核苷酸分子的物理圖譜
本文還提供了產生固定的多核苷酸的物理圖譜的方法。所述方法可有益地被用來鑒定可能含有連接的序列(即,來自相同的靶多核苷酸分子的第一部分和第二部分)的簇。來源于固定的多核苷酸的任何兩個簇的相對距離因此提供對于從兩個簇獲得的序列信息的比對有用的信息。特別地,固體表面上任何兩個給定的簇之間的距離與兩個簇來自相同的靶多核苷酸分子的可能性成正相關,如在WO 2012/025250中更詳細的描述的,通過引用將其全部并入本文。
作為實例,在一些實施方案中,在流通池的表面上伸出的長的dsDNA分子被原位(in situ)標簽化,產生跨流通池的表面的一行連接的dsDNA橋。另外,然后可產生固定的DNA的物理圖譜。在擴增固定的DNA后,物理圖譜因此關聯簇的物理關系。特別地,物理圖譜被用來計算從任何兩個簇獲得的序列數據是關聯的可能性,如在并入材料WO 2012/025250中描述的。
在一些實施方案中,物理圖譜通過成像DNA來產生以確立跨固體表面的固定的DNA分子的位置。在一些實施方案中,固定的DNA通過將成像劑添加至固體支持物,并檢測來自成像劑的信號來成像。在一些實施方案中,成像劑為可檢測的標簽。合適的可檢測標簽包括但不限于質子、半抗原、放射性核素、酶、熒光標記物、化學發光標記物、和/或顯色劑。例如,在一些實施方案中,成像劑為嵌入染料或非嵌入DNA結合劑。本領域已知的任何合適的嵌入染料或非嵌入DNA結合劑可被使用,包括但不限于在U.S.2012/0282617中描述的那些,通過引用將其并入本文。
在一些實施方案中,在簇產生(圖4b)之前,固定的雙鏈片段被進一步片段化以釋放出游離末端(參見圖4a)。可利用本領域已知的任何合適的方法進行裂解橋接結構,如通過WO 2012/025250的并入材料所例證的。例如,裂解可通過并入修飾的核苷酸,諸如在WO 2012/025250中描述的尿嘧啶;通過并入限制性內切核酸酶位點;或通過將溶液相轉座體復合物施加至橋接DNA結構發生,如本文別處描述的。
在某些實施方案中,多個靶DNA分子流至包含多個納米通道的流通池上,所述納米通道具有固定至其的多個轉座體復合物。如本文使用的,術語納米通道指長的線性DNA分子流至其中的狹窄通道。在一些實施方案中,不多于1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或不多于1000個單獨的長鏈靶DNA(individuallong strands of target DNA)流入每個納米通道中。在一些實施方案中,單個納米通道被物理屏障分開,所述物理屏障防止單獨的長鏈靶DNA與多個納米通道相互作用。在一些實施方案中,固體支持物包括至少10、50、100、200、500、1000、3000、5000、10000、30000、50000、80000或至少100000個納米通道。在一些實施方案中,結合至納米通道的表面的轉座體將DNA標簽化。然后可例如通過按照沿著這些通道之一的長度的簇來進行連續圖譜繪制。在一些實施方案中,長鏈靶DNA的長可以至少0.1kb、1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、15kb、20kb、25kb、30kb、35kb、40kb、45kb、50kb、55kb、60kb、65kb、70kb、75kb、80kb、85kb、90kb、95kb、100kb、150kb、200kb、250kb、300kb、350kb、400kb、450kb、500kb、550kb、600kb、650kb、700kb、750kb、800kb、850kb、900kb、950kb、1000kb、5000kb、10000kb、20000kb、30000kb、或至少50000kb。在一些實施方案中,長鏈靶DNA的長可以不多于0.1kb、1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、15kb、20kb、25kb、30kb、35kb、40kb、45kb、50kb、55kb、60kb、65kb、70kb、75kb、80kb、85kb、90kb、95kb、100kb、150kb、200kb、250kb、300kb、350kb、400kb、450kb、500kb、550kb、600kb、650kb、700kb、750kb、800kb、850kb、900kb、950kb,或不多于1000kb。作為實例,具有1000個或更多個納米通道、在納米通道中繪制的固定的標簽化產物的圖譜的流通池可被用來以短的‘定位的’讀段測序生物體的基因組。在一些實施方案中,納米通道中的繪制的固定的標簽化產物的圖譜可被用來分析單倍型。在一些實施方案中,納米通道中的繪制的固定的標簽化產物的圖譜可被用來解決定相問題。
擴增并測序固定的DNA片段
擴增.本公開內容還涉及根據本文提供的方法產生的固定的DNA片段的擴增。由表面結合的轉座體介導的標簽化產生的固定的DNA片段可根據本領域已知的任何合適的擴增方法來擴增。在一些實施方案中,在固體支持物上擴增固定的DNA片段。在一些實施方案中,固體支持物是與表面結合的標簽化于其上發生的固體支持物相同的固體支持物。在此類實施方案中,本文提供的方法和組合物允許從最初的樣品引入步驟至擴增且任選地至測序步驟,樣品制備在相同的固體支持物上進行。
例如,在一些實施方案中,固定的DNA片段利用簇擴增方法來擴增,如由美國專利號7,985,565和7,115,400的公開內容所例證的,其每個的內容通過引用以全文并入本文。美國專利號7,985,565和7,115,400的并入的材料描述了固相核酸擴增的方法,其允許擴增產物被固定在固體支持物上,以形成包括固定的核酸分子的簇或“集群”的陣列。在如此陣列上的每個簇或集群從多個相同的固定的多核苷酸鏈和多個相同的固定的互補多核苷酸鏈形成。如此形成的陣列本文中通常地被稱作“成簇的陣列”。固相擴增反應的產物諸如在美國專利號7,985,565和7,115,400中描述的那些是通過固定的多核苷酸鏈對和固定的互補的鏈的退火形成的所謂的“橋接的”結構,兩種鏈在5'末端被固定在固體支持物上,優選地經由共價附接。簇擴增方法是方法的實例,其中固定的核酸模板被用來產生固定的擴增子。其他合適的方法也可被用來從根據本文提供的方法產生的固定的DNA片段產生固定的擴增子。例如一個或更多個簇或集群可經由固相PCR來形成,每對擴增引物中的一個或兩個引物是被固定的。
在其他的實施方案中,在溶液中擴增固定的DNA片段。例如,在一些實施方案中,固定的DNA片段被裂解或者以其他方式從固體支持物釋放,并且然后擴增引物在溶液中與釋放的分子雜交。在其他的實施方案中,對于一個或更多個初始擴增步驟,擴增引物被與固定的DNA片段雜交,然后是隨后在溶液中的擴增步驟。因此,在一些實施方案中,固定的核酸模板可被用來產生溶液相擴增子。
將領會的是,本文描述的或本領域一般已知的任何擴增方法可與通用的或靶特異的引物一起使用以擴增固定的DNA片段。用于擴增的合適的方法包括但不限于聚合酶鏈式反應(PCR)、鏈置換擴增(SDA)、轉錄介導的擴增(TMA)和基于核酸序列的擴增(NASBA),如在美國專利號8,003,354中描述的,通過引用以其全文并入本文。以上擴增方法可被用來擴增一個或更多個感興趣的核酸。例如,PCR包括多路復用PCR、SDA、TMA、NASBA等可被用來擴增固定的DNA片段。在一些實施方案中,將特異地針對感興趣的核酸的引物包括在擴增反應中。
用于核酸擴增的其他合適方法可包括寡核苷酸延伸和連接技術、滾環擴增(RCA)技術(Lizardi等人,Nat.Genet.19:225-232(1998),通過引用將其并入本文)和寡核苷酸連接測定(OLA)技術(通常參見美國專利號7,582,420、5,185,243、5,679,524和5,573,907;EP 0 320 308 B1;EP 0 336 731 B1;EP 0 439 182 B1;WO 90/01069;WO 89/12696和WO 89/09835,通過引用將其所有并入本文)。將領會這些擴增方法可被設計為擴增固定的DNA片段。例如,在一些實施方案中,擴增方法可包括連接探針擴增或寡核苷酸連接測定(OLA)反應,其包括特異地針對感興趣的核酸的引物。在一些實施方案中,擴增方法可包括引物延伸-連接反應,其包括特異地針對感興趣的核酸的引物。作為引物延伸和連接引物的非限制性實例,其可被特異地設計為擴增感興趣的核酸,擴增可包括用于GoldenGate測定(Illumina,Inc.,San Diego,CA)的引物,如由美國專利號7,582,420和7,611,869所例證的,通過引用將其每個以其全文并入本文。
可在本公開內容的方法中使用的示例性等溫擴增方法包括但不限于多重置換擴增(MDA),如由例如Dean等人,Proc.Natl.Acad.Sci.USA 99:5261-66(2002)所例證的,或由例如美國專利號6,214,587所例證的等溫鏈置換核酸擴增,通過引用將其每個以其全文并入本文。可在本公開內容中使用的其他的非基于PCR的方法包括例如鏈置換擴增(SDA),其在例如Walker等人,Molecular Methods for Virus Detection,Academic Press,Inc.,1995,美國專利號5,455,166和5,130,238,以及Walker等人,Nucl.Acids Res.20:1691-96(1992)中被描述;或超支化鏈置換擴增,其在例如Lage等人,Genome Research 13:294-307(2003)中被描述,通過引用將其每個以其全文并入本文。等溫擴增方法可與用于基因組DNA的隨機引物擴增的鏈置換Phi 29聚合酶或Bst DNA聚合酶大片段5'->3'外切一起使用。這些聚合酶的使用運用其高的持續性和鏈置換活性。高的持續性允許聚合酶產生長10-20kb的片段。如以上描述的,可在等溫條件下使用具有低的持性和鏈置換活性的聚合酶諸如Klenow聚合酶產生較小的片段。在美國專利號7,670,810的公開內容中詳細描述了擴增反應、條件和組分的另外的描述,通過引用以其全文并入本文。
在本公開內容中有用的另一個核酸擴增方法是加標簽的PCR,其使用具有恒定的5'區域接著是隨機的3'區域的雙域引物的群體,例如在Grothues等人,Nucleic Acids Res.21(5):1321-2(1993)中描述的,通過引用以其全文并入本文。進行第一輪擴增以允許在熱變性的DNA上基于從隨機合成的3'區域單獨雜交的大量起始。由于3'區域的性質,所以起始位點預期是遍及基因組隨機的。其后,未結合的引物可被移除并且另外的復制可使用與恒定的5’區域互補的引物發生。
測序.本公開內容還涉及根據本文提供的方法產生的固定的DNA片段的測序。由表面結合的轉座體介導的標簽化產生的固定的DNA片段可根據任何合適的測序方法而被測序,諸如直接測序,包括合成測序、連接測序、雜交測序、納米孔測序等。在一些實施方案中,在固體支持物上測序固定的DNA片段。在一些實施方案中,用于測序的固體支持物是與于其上表面結合的標簽化發生的固體支持物相同的固體支持物。在一些實施方案中,用于測序的固體支持物是與于其上擴增發生的固體支持物相同的固體支持物。
一種優選的測序方法是合成測序法(SBS)。在SBS中,監測核酸引物沿著核酸模板(例如,靶核酸或其擴增子)的延伸以確定模板中核苷酸的序列。潛在的化學方法可以是聚合作用(例如,如被聚合酶催化)。在特定的基于聚合酶的SBS實施方案中,熒光標記的核苷酸以模板依賴模式被添加至引物(從而延伸引物),以使得檢測添加至引物的核苷酸的順序和類型可被用來確定模板的序列。
流通池提供了用于容納由本公開內容的方法產生的擴增的DNA片段的方便的固體支持物。此格式中的一種或更多種擴增的DNA片段可經受SBS或涉及循環中反應物的重復遞送的其他檢測技術。例如,為了起始第一SBS循環,一個或更多個標記的核苷酸、DNA聚合酶等可流入/流經容納一個或更多個擴增的核酸分子的流通池。其中引物延伸導致標記的核苷酸被并入的那些位點可被檢測。任選地,核苷酸還可包括可逆終止特性,在核苷酸已被添加至引物后,其終止進一步的引物延伸。例如,具有可逆終止子部分的核苷酸類似物可被添加至引物,以使得隨后的延伸不能發生,直到遞送解封劑以移除該部分。因此,對于使用可逆終止的實施方案,可使解封劑遞送至流通池(在檢測發生之前或之后)。在多個遞送步驟之間可進行洗滌。然后可重復循環n次,以將引物延伸n個核苷酸,從而檢測長度n的序列。可容易地適于與由本公開內容的方法產生的擴增子一起使用的示例性SBS過程、流體系統和檢測平臺被描述于例如Bentley等人,Nature 456:53-59(2008);WO 04/018497;US 7,057,026;WO 91/06678;WO 07/123744;US 7,329,492;US 7,211,414;US 7,315,019;US 7,405,281和US 2008/0108082中,通過引用將其每個并入本文。
使用循環反應的其他測序過程可被利用,諸如焦磷酸測序。隨著特定核苷酸被并入初生核酸鏈,焦磷酸測序檢測無機焦磷酸鹽(PPi)的釋放(Ronaghi等人,Analytical Biochemistry 242(1),84-9(1996);Ronaghi,Genome Res.11(1),3-11(2001);Ronaghi等人Science 281(5375),363(1998);US 6,210,891;US 6,258,568和US.6,274,320,通過引用將其每個并入本文)。在焦磷酸測序中,釋放的PPi可通過立即由ATP硫酸化酶轉化成腺苷三磷酸(ATP)來檢測,并且產生的ATP的水平可經由熒光素酶產生的質子來檢測。因此,測序反應可經由冷光檢測系統來監測。用于基于熒光的檢測系統的激發放射源對于焦磷酸測序過程不是必需的。可適于將焦磷酸測序應用到根據本公開內容產生的擴增子的有用的流體系統、檢測器和過程被描述于例如WIPO專利申請系列號PCT/US11/57111、US 2005/0191698A1、US 7,595,883和US 7,244,559中,通過引用將其每個并入本文。
一些實施方案可利用包括DNA聚合酶活性的實時監測的方法。例如,核苷酸并入可通過載有熒光團的聚合酶和γ-磷酸標記的核苷酸之間的熒光共振能量轉移(FRET)相互作用,或用零模波導(ZMW)來檢測。用于基于FRET的測序的技術和試劑被描述于例如Levene等人,Science 299,682–686(2003);Lundquist等人Opt.Lett.33,1026–1028(2008);Korlach等人Proc.Natl.Acad.Sci.USA 105,1176–1181(2008),通過引用將其公開內容并入本文。
一些SBS實施方案包括檢測將核苷酸并入延伸產物后釋放的質子。例如,基于檢測釋放的質子的測序可使用電子檢測器和從Ion Torrent(Guilford,CT,a Life Technologies subsidiary)商業可得的相關技術,或在US 2009/0026082 A1、US 2009/0127589 A1、US 2010/0137143 A1或US 2010/0282617 A1中描述的測序方法和系統,通過引用將其每個并入本文。本文描述的用于使用動力學排除擴增靶核酸的方法可容易地應用于被用來檢測質子的基底。更具體地,本文描述的方法可被用來產生用于檢測質子的擴增子的克隆群體。
另一種有用的測序技術是納米孔測序(參見例如Deamer等人Trends Biotechnol.18,147–151(2000);Deamer等人Acc.Chem.Res.35:817-825(2002);Li等人Nat.Mater.2:611–615(2003),通過引用將其公開內容并入本文。在一些納米孔實施方案中,將靶核酸或從靶核酸移除的單個核苷酸通過納米孔。隨著核酸或核苷酸通過納米孔,每個核苷酸類型可通過測量孔的電導率波動來鑒定。(美國專利號7,001,792;Soni等人Clin.Chem.53,1996–2001(2007);Healy,Nanomed.2,459–481(2007);Cockroft等人J.Am.Chem.Soc.130,818–820(2008),通過引用將其公開內容并入本文)。
可被應用于根據本公開內容的檢測的用于基于陣列的表達和基因分型分析的示例性方法被描述于美國專利號7,582,420、6,890,741、6,913,884或6,355,431或美國專利公布號2005/0053980 A1、2009/0186349 A1或US 2005/0181440 A1,通過引用將其每個并入本文。
本文描述的方法的優勢是,其提供了多個靶核酸的快速且有效的平行檢測。相應地本公開內容提供了能利用本領域已知的技術諸如以上例證的那些制備并檢測核酸的整合系統。因此,本公開內容的整合系統可包括能夠將擴增試劑和/或測序試劑遞送至一個或更多個固定的DNA片段的流體組分;系統包括泵、閥門、儲液箱、射流線路等。流通池可被構造和/或在用于檢測靶核酸的整合系統中使用。示例性流通池被描述于例如US 2010/0111768 A1和美國系列號13/273,666中,通過引用將其每個并入本文。作為流通池的例證,整合系統的一個或更多個流體組分可被用于擴增方法和用于檢測方法。以核酸測序實施方案為例,整合系統中的一種或更多種流體組分可被用于本文描述的擴增方法并用于在諸如以上例證的那些的測序方法中遞送測序試劑。可選地,整合系統可包括分隔流體系統以進行擴增方法和進行檢測方法。能產生擴增的核酸且還能確定核酸的序列的整合測序系統的實例包括但不限于MiSeqTM平臺(Illumina,Inc.,San Diego,CA)和在美國系列號13/273,666中描述的裝置,通過引用將其每個并入本文。
具有固定的轉座體的固體支持物及制備方法
本文提供的其他實施方案包括具有轉座體復合物固定至其上的固體支持物,諸如流通池。在某些實施方案中,轉座體復合物包含結合至第一多核苷酸的轉座酶,多核苷酸包含(i)3'部分,所述3'部分包含轉座子末端序列,和(ii)第一標簽,所述第一標簽包含第一標簽域。這些表面結合的轉座體的密度可變化。例如,在一些實施方案中,轉座體復合物以至少103、104、105、或至少106個復合物每mm2的密度存在于固體支持物上。
本文還提供了產生用于標簽化的流通池的方法。所述方法可包括例如將多個轉座體復合物固定至固體支持物,所述轉座體復合物包含結合至第一多核苷酸的轉座酶,第一多核苷酸包含(i)3'部分,所述3'部分包含轉座子末端序列,和(ii)第一標簽,所述第一標簽包含第一標簽域。
轉座體復合物可以多種方法固定至固體支持物,其將被本領域技術人員領會。在一個實施方案中,所述方法包括提供具有多個第一多核苷酸固定于其上的固體支持物,并且使固體支持物與轉座酶全酶和第二多核苷酸接觸,第二多核苷酸包含與轉座子末端序列互補的區域。在一些實施方案中,在添加轉座酶全酶之前,使第二多核苷酸與固定的第一多核苷酸雜交。在一些實施方案中,一起提供第二多核苷酸和轉座酶全酶。圖5a顯示了這種用于組裝表面結合轉座體復合物的方法的一個實施方案。在一種方法中,連同ME適體的非轉移鏈一起將轉座酶全酶添加至含有寡核苷酸的流通池,所述寡核苷酸從5'表面接枝末端起包含:簇擴增引物(A.pr)和測序引物(S.pr)和ME序列(圖5a)。可選地,非轉移ME'鏈可與表面接枝的ME鏈雜交并且然后轉座酶被添加至流通池。
在一些實施方案中,在溶液中組裝轉座體復合物并且固定包括將第一多核苷酸與夾板寡核苷酸連接的另外的步驟,所述夾板寡核苷酸偶聯至固體支持物。在圖5b中闡述了該實施方案。在一些實施方案中,在連接步驟發生之前,夾板寡核苷酸可利用聚合酶被延伸。
在一些實施方案中,轉座體二聚體通過使帶環的寡核苷酸與固定的第一多核苷酸雜交來組裝。例如,帶環的寡核苷酸可包含第一末端和第二末端,第一末端與第一多核苷酸的轉座子末端序列互補。帶環的寡核苷酸的第二末端可與第二轉座子末端序列互補。第二轉座子末端序列可例如為溶液相第一多核苷酸的部分。在一些實施方案中,固定的第一多核苷酸末端和溶液相第一多核苷酸可包括不同的轉座子末端序列或其互補物。在一些此類實施方案中,帶環的寡核苷酸在第一和第二末端包含與每個不同的轉座子末端序列的每個互補的序列。在圖5c中顯示了該實施方案的圖示。如在圖5c中顯示的,通過使兩個寡核苷酸與表面結合寡核苷酸雜交來產生連續的適體對。這可通過使用兩個不同的轉座子末端序列(ME1和ME2)來完成。添加轉座酶全酶重新組成活性“環”轉座體復合物,其中只有每個轉座體的兩個適體之一被偶聯至表面,圖5c。
在另一個實施方案中,轉座體復合物可在具有擴增引物固定于其的標準成對的末端流通池(例如,由Illumina Inc,San Diego,CA出售的HiSeq流通池或MiSeq流通池)上組裝。這可通過例如使退火至表面接枝的擴增引物的一種或兩種物質的‘夾板’寡核苷酸的雜交來完成。夾板起到模板的作用,然后用聚合酶和dNTP延伸接枝的表面引物,以形成含有表面擴增引物、測序引物和轉座酶的轉座子末端序列的寡核苷酸復合物。轉座酶的添加組裝表面的轉座體。在圖5d中闡述了該實施方案。
在本文提供的任何實施方案中,轉座體復合物可以是同二聚體或異二聚體。例如,如在圖11中闡述的,同二聚體轉座體將在兩個位點包括兩個P5-ME適體或可選地兩個P7-ME適體。相似地,異二聚體轉座體復合物將包括P5-ME和P7-ME適體兩者,如在圖11中顯示的。
使用轉座體珠的標簽化
本文提供的一個實施方案為具有轉座體復合物固定至其的微粒群體。固體支持物諸如珠的使用可提供超越溶液相標簽化的若干優勢。例如,在標準溶液相標簽化中,難以控制標簽化反應的最終片段大小。片段大小是轉座體的比例與DNA的量和大小以及與反應的持續時間的函數。即使這些參數是被控制的,通常需要大小選擇片段化作為另外的步驟以移除過量的比組合的成對讀段長度短的小片段。本文提供的方法避免了那些缺點。具體地,珠-固定的轉座體允許選擇最終片段大小作為結合的轉座體的空間分離的函數,不依賴于添加至標簽化反應的轉座體珠的量。基于溶液的標簽化的另外的局限是其通常在PCR擴增之前和之后均需要進行標簽化反應產物的一些形式的純化。這通常必須將反應從管至管的一些轉移。與之相比,基于珠的轉座體上的標簽化產物可被洗滌,并且之后被釋放用于擴增或其它下游處理,從而避免需要樣品轉移。例如,在轉座體被組裝在順磁性珠上的實施方案中,標簽化反應產物的純化可容易地通過用磁體固定珠并洗滌來完成。因此,在一些實施方案中,標簽化和其他下游處理諸如PCR擴增可全部在單個管、器皿、液滴或其它容器中被進行。在一些實施方案中,樣品的標簽化和下游處理發生在基于微流體液滴的裝置上,如在于2012年11月6日提交題為“INTEGRATED SEQUENCING APPARATUSES AND METHODS OF USE”的美國申請系列號13/670,318的公開內容中例證的,通過引用以其全文并入本文。例如,在基于微流體液滴的裝置中,含有靶核酸、洗滌緩沖液或其它試劑的液滴可通過含有固定的轉座體復合物的表面。同樣地,在基于微流體液滴的裝置中,含有具有轉座體固定至其上的珠的液滴可與靶核酸、洗滌緩沖液或其他試劑接觸。
在一些實施方案中,固定的轉座體復合物包含結合至第一多核苷酸的轉座酶和第二多核苷酸;其中第一多核苷酸在其5'末端被固定至微粒的表面并且第二多核苷酸與第一多核苷酸的3'末端雜交;并且其中第一多核苷酸包含:(i)3'部分,所述3'部分包含轉座子末端序列,和(ii)第一標簽,所述第一標簽包含第一標簽域。
圖9-12提供了組裝于順磁性珠的表面的轉座體的圖示。圖9顯示了具有兩個不同的第一多核苷酸固定至其的珠表面。顯示的第一多核苷酸包含轉座子末端序列(ME)。其中顯示的第一多核苷酸之一包含標簽域,所述標簽域包含擴增引物序列(P5)和測序引物序列(讀段1)。圖9中顯示的其他多核苷酸包含不同的擴增引物序列(P7)和測序引物序列(讀段2)。第一多核苷酸還可包含索引標簽。索引標簽可對于珠是獨特的,或其可與群體中的一個或更多個其他的珠共用。單個珠可只具有固定至其的單個索引標簽,或其可具有固定至其的多個索引標簽。
圖10顯示了與每個第一多核苷酸雜交的第二多核苷酸。第二多核苷酸含有與第一多核苷酸的轉座子末端序列互補的區域。在一些實施方案中,第一多核苷酸長度為15bp。在一些實施方案中,第二多核苷酸長度可為大約10、11、12、13、14、15、16、17、18、19、20bp或多于20bp。在一些實施方案中,第二多核苷酸在其5'末端被磷酸化。
圖11圖示了在珠的表面上組裝轉座體,其中轉座酶與固定的寡核苷酸接觸。如圖11中顯示的,當轉座酶被添加至珠時,形成三種類型的轉座體復合物:P5:P5、P7:P7和P5:P7復合物(圖11)。
當轉座體珠在標簽化緩沖液中被添加至靶DNA溶液時,發生標簽化,將DNA與珠的表面連接。加標簽的DNA片段的固定的文庫產生。
圖12圖示了這樣的實施方案:其中接連標簽化至DNA中產生了轉座體之間的橋接分子。當存在三種類型的轉座體時(如圖11中的),產生三種類型的橋接復合物:分別25:25:50比率的P5:P5、P7:P7和P5:P7復合物。
在一些實施方案中,橋接的片段的長度可由珠表面上的轉座體的密度來決定。該密度是經由以下可調的:表面上的寡核苷酸的量,表面上的雙鏈體轉座子末端復合物的量以及在轉座體組裝期間添加的轉座酶的量。標簽化完成之后,P5:P7標簽化產物可利用任何合適的方法從珠的表面釋放。在一些實施方案中,標簽化產物利用擴增方法諸如抑制PCR、step-out PCR等從珠釋放。在一些實施方案中,標簽化產物通過裂解從珠釋放。裂解例如可以是化學的、酶促的、光化學的或其組合。將領會的是,用于從固體支持物釋放一種或更多種標簽化產物的任何合適的方法可被用于本文提供的方法。
DNA可利用增加接觸的可能性的任何合適的方法來與表面結合的轉座體有效地接觸。例如,在一些實施方案中,將DNA沉淀在固體支持物上可被用來增加靶DNA和固體表面上的轉座體復合物之間的接觸。可利用本領域已知的用于使DNA與固體支持物接觸的很多方法中的任一種,如由WO 2010/115122的公開內容所例證的,通過引用以其全文并入本文。如本領域技術人員將領會的是,DNA可通過添加PEG、乙醇或已知使DNA沉淀于表面上的多種其他試劑中的任一種被沉淀在固體支持物上,已知使DNA沉淀于表面上的多種其他試劑包括例如在固相可逆固定(SPRI)技術中使用的很多緩沖液中的任一種。
在一些實施方案中,負載固定的轉座體復合物的珠的群體可與未負載轉座體或寡核苷酸的過量的珠混合,從而降低跨兩個或更多個不同的珠標簽化的可能性。降低跨兩個或更多個不同的珠標簽化的可能性的另一種方法包括固定珠以使得珠之間的接觸最小化。珠的固定可通過本領域已知的很多技術中的任一種來完成,包括例如經由磁力將珠固定至固體表面諸如微型離心管的側部、或如由WO 2010/115122的并入材料例證的任何其他固定技術。
在一些實施方案中,轉座體珠可被用來從單細胞諸如原核細胞或真核細胞分離和鑒定核酸。例如,在一些實施方案中,將顆粒諸如珠用索引轉座體包被,所述索引轉座體共有相同的索引(存在于特定珠上的全部轉座體具有相同的索引,其與在另一個珠上存在的索引不同)。然后珠可通過本領域已知的多種方法中的任一種被放置于細胞內。例如,用于在細胞內遞送珠的方法包括但不限于基因槍、光熱納米刀(photothermal nanoblades)(Wu等人Anal Chem.(2011)4:1321-7)、http://www.ncbi.nlm.nih.gov/pubmed/21247066以及連同細胞透化物質使用的肽(Nitin等人Ann Biomed Eng.(2009)37:2018-2027)等。將領會的是,用于使來自單細胞的DNA與負載索引的轉座體的顆粒關聯的任何合適的方法可被用于本文提供的方法。
在一些實施方案中,轉座體可共價地附接至珠,如在本文以上詳細的描述的。另外地或可選地,在應用化學或物理刺激以后,轉座體可從珠釋放。可引發轉座體從固體支持物釋放的刺激的一些實例包括光和/或溫度變化。在一些實施方案中,轉座體利用諸如限制性內切核酸酶的酶的活性從固體支持物釋放。在某些實施方案中,轉座體可從珠分離并在細胞內自由地移動。珠(或可選地,釋放的轉座體)得以與染色質或DNA接觸之后,標簽化可發生。將理解,在真核和原核系統中,并不是所有的基因組DNA對于標簽化將總是可達的和/或可得的。在一些實施方案中,細胞中多達0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或99%或多于99%的總DNA被轉座體標簽化。獨特地加標簽的珠的使用使得通過將共有相同的索引的讀段分組在一起來從相同的細胞鑒定讀段成為可能。這些讀段可被認為源自相同的珠(并且因此來自相同的細胞)。另外地或可選地,在一些實施方案中,可進行交聯步驟以交聯細胞DNA,同時其仍然在細胞核內。此步驟保證了來自單細胞的DNA被保持在一起。在從細胞提取DNA之后,然后其可與索引珠混合并經受標簽化,如在本文以上詳細描述的。另外地或可選地,方法的變化形式包括流式分選的染色體的標簽化。流式分選的染色體可與以上描述的索引珠混合。特定的染色體將附著至一個珠并且通過標簽化產生的片段可含有相同的索引。這可使能夠從整個染色體定相SNP(phasing SNP)(單倍分型)。
在一些此類實施方案中,索引的總數比成功標簽化的細胞總數大。在一些實施方案中,可執行雙索引方法,例如,作為增加可能的索引組合的數目的方式。作為一個實例,兩個8堿基索引的使用將給出48X 48=4.3X109個組合的理論數。
在一些實施方案中,可使用方法來確保單個細胞未被多個珠標簽化。例如,一種方法是使用與細胞的大小相似大小的珠。這會確保細胞不能容納多個珠。另外地或可選地,另一種方法是使用利于單細胞靶向的細胞與珠的比率。例如,如果細胞遠多于珠,則細胞內珠的泊松分布意味著吸收單個珠的細胞遠遠超過吸收兩個或更多個珠的細胞。
在一些實施方案中,以上描述的單細胞方法可被用來確定兩個SNP(或結構重排)是否存在于相同的細胞中。例如,在癌癥細胞的異質群體的情況中,知曉兩個SNP是否存在于相同的細胞或不同的細胞中可有助于實行正確的癌癥療法。
在一些實施方案中,以上描述的單細胞方法可被用來研究RNA。例如,通過以用于反轉錄步驟的合適的酶(即,反轉錄酶)和寡核苷酸包被珠,可分析在單細胞水平的基因表達。在一個實施方案中,引入用反轉錄酶、寡核苷酸和轉座體包被的珠之后,細胞質RNA可被轉化成cDNA,加標簽和細胞內制備。
使用固定的轉座體上的條形碼組裝長的讀段的方法
條形碼協助的DNA片段組裝使能夠分離DNA分子群體內單獨的長DNA分子并且將每個分子轉換成獨特的條形碼化的子片段文庫。當子片段化的DNA分子的整個群體被測序時,子片段可通過參考其包含的條形碼被組裝回其原始長分子。
單個DNA分子條形碼化的多種方法是已知的。例如,‘稀釋方法’通過極端稀釋并分裝入分開的區室(例如,平板的孔)來分離單個長分子,以使得每個孔只含有一個或只有幾個DNA分子。因為每個孔是物理上分開的,所以文庫制備可用獨特的條形碼在每個孔中進行。其后,孔的內容物被匯集并測序。另一種方法使用乳劑,其中每個液滴含有長DNA分子、文庫制備試劑和對每個液滴獨特的條形碼。另一種方法使用索引帶環的轉座體復合物(looped tranasposome complex)的大的文庫來沿著DNA的長度插入多個雙胞胎條形碼,同時保持分子的完整性。條形碼‘雙胞胎’之間的隨后裂解得到可通過匹配雙胞胎條形碼來測序并重組的片段。以上提到的條形碼化方法中的每個帶有其缺點,該缺點被本文提供的條形碼化方法克服。
本文提供了以上描述的分離和條形碼化單個長分子的方法的可替代方法。本文提供的方法獲得與乳劑方法相似的物理分離的優點,而不使用乳劑,并且同時提供比通過在稀釋方法中使用的大量‘孔’提供的復雜性大的多的復雜性。本方法的獨特的條形碼在某種程度上類似于稀釋方法中的‘孔’,除了在基于珠的方法中珠的數目通常可比稀釋方法中孔的數目高的多。超越乳劑方法的另外的優點是在基于珠的方法中,條形碼是確定性的分布的(即,每個珠一個條形碼)且不是隨機的(即,泊松分布)。本文提供的方法還獲得分子完整性和連續性的相同的初始保留,但不需要環轉座體復合物,如在一些其他方法中使用的。另外地,本文提供的方法不需要如在一些其他方法中所使用的大的碼空間。
因此,在本文提供的一些實施方案中,條形碼方法包括提供具有轉座體復合物固定至其的微顆粒群體,所述轉座體復合物包含結合至第一多核苷酸的轉座酶和第二多核苷酸。在一些實施方案中,第一多核苷酸包含與微粒結合的索引域。在一些實施方案中,索引域可以是對微粒獨特的。在一些實施方案中,微粒的群體包括至少多個索引域。在一些實施方案中,索引域存在于微粒群體中的多于一個微粒上。在一些實施方案中,微粒群體中的微粒包括多于一個的索引域。
本文提供的條形碼方法還包括將靶DNA施加至微粒群體,從而產生用索引域加標簽的固定的DNA片段。DNA可利用用于增加接觸的可能性的任何合適的方法來與表面結合的轉座體有效地接觸,如本文以上討論的,如由WO 2010/115122的并入材料例證的。
所述方法可利用多種已知格式中的任何一種來進行,例如用標簽化試劑和用于文庫制備的珠陣列的聯合,隨后是索引的測序運行和訂制的數據分析。使珠保持彼此靜態分離的任何其他合適的方法可被用來表面標簽化和樣品的加索引。例如,物理構造諸如基底中可保留珠的孔或小的凹槽,以使得微球可處于孔中,或其他力(磁力的或壓縮力的),或使用化學改變或活性位點諸如化學功能化的位點、靜電改變位點、疏水性和/或親水性功能化位點,或粘附的點。
在一些實施方案中,微球為非共價地結合于孔中,盡管孔可另外地被通常化學上功能化,如以下描述的,但是交聯劑可被使用,或物理屏障可被使用,例如珠上方的薄膜(film)或膜(member)。
在某些實施方案中,基底的表面被修飾為含有化學修飾位點,所述化學修飾位點可被用于使本發明的微球共價地或非共價地附接至離散位點或基底上的位置。在該上下文中“化學修飾位點”包括但不限于化學官能團模式的添加,化學官能團包括氨基、羧基、氧基和硫基,可被用來共價地附接微球,其通常地還含有相應的活性官能團;粘合劑模式的添加,其可被用來結合微球(通過在添加粘合劑之前先前化學功能化或直接添加粘合劑);帶電荷基團模式的添加(與化學功能相似)用于微球的靜電附接,例如當微球在位點相對處包含帶電荷基團時;化學官能團模式的添加,其致使位點不同地疏水性或親水性,以使得在合適的實驗條件下相似地疏水性或親水性微球的添加會導致微球基于水親和性結合至位點。例如,在水系統中疏水位點和疏水珠的使用驅使珠優先地結合至位點上。如以上描述的,在這個意義上的“模式”包括使用表面的均一處理以允許在離散位點處珠的附接,以及導致離散位點的表面處理。如本領域技術人員將領會的是,這可以多種方式來完成。
在某些實施方案中,產生了含有表面結合的轉座體的眾多珠,其中每個珠含有很多轉座體,但是任何給定珠上的所有轉座體均含有相同的條形碼。可根據本領域已知的很多技術中的任何一種來進行產生珠上的單克隆條形碼轉座體寡核苷酸群體,如由U.S.5,604,097的公開內容所例證的,通過引用以其全文并入本文。
圖13圖示了一種實施方案,其中表面結合的轉座體含有經由其5'末端附接至表面的長的寡核苷酸。如在圖13中描述的,寡核苷酸的3'末端含有Tn5轉座酶的馬賽克末端(METS)序列。該序列的上游(較接近5'末端)為通常地長6-8個堿基的條形碼序列。進一步的上游是引物序列。另外地,寡核苷酸還可包括裂解位點以使能夠寡核苷酸從表面裂解下:對于總體方法,其在寡核苷酸中的存在是任選的。將第二短寡核苷酸(非轉移鏈,MENTS)與長的表面接枝的寡核苷酸的3'末端的METS序列雜交。最后,轉座酶二聚體在寡核苷酸的3'末端組裝以形成功能性的轉座體。
圖14圖示了孔陣列中的珠上的條形碼。如在圖14中顯示的,當長的dsDNA分子被添加至珠固定的轉座體的陣列時,給定的分子遇到珠并且被珠上的轉座體進行多次標簽化。每個片段變為固定至珠并用與該珠結合的條形碼加標簽。在圖14中顯示的特定的實施方案中,陣列芯片中的珠的物理分離阻止了DNA分子達到兩個珠之間。在其他的實施方案中,珠緊密接觸并且一個或更多個DNA分子可在兩個或更多個珠之間延伸。在一些實施方案中,每珠可多于一個DNA分子被標簽化。兩個等位基因在相同的珠上被標簽化的可能性是低的并且是添加的DNA的濃度、珠的數目和條形碼的數目的函數。例如,為了避免在相同的孔中存在兩個等位基因,0.1x單倍體等同物(50,000基因組等同物)需被加載至1百萬個珠,每個珠具有獨特的條形碼。
圖15圖示了條形碼加標簽的分子被轉移至測序反應。如在圖15中顯示的,標簽化完成之后,DNA被從珠表面轉移至溶液,以使得單個片段可被匯集并被制備用于測序。參考條形碼測序并組裝使初始的長的標簽化的DNA分子的序列能夠被重新產生,從而使能夠長的或假長的讀取和SNP的定相。
條形碼化的表面標簽化的片段釋放至溶液可利用本領域已知的任何合適的方法來完成。例如,在一些實施方案中,標簽化的分子可經由存在于表面結合的寡核苷酸的5'末端的裂解部分從珠的表面裂解下(參見圖13)。裂解部分可以是適于將核酸鏈從固體支持物裂解的任何部分。利用裂解部分的方法的實例包括但不限于限制性內切核酸酶裂解、化學裂解、RNA酶裂解、光化學裂解等,包括WO 2006/064199中描述的那些裂解方法和裂解部分,通過引用以其全文并入。
利用裂解部分裂解得到具有以下格式的分子:
5’-引物-條形碼-ME-插入物-ME-條形碼-引物-3’
“引物”區域可被用作雜交點,以雜交PCR step-out引物(PCR step-out primer),其使能夠添加另外的序列諸如擴增引物和測序引物。例如,可添加擴增引物P5和P7。添加后,可使用抑制PCR,例如以富集在一個末端具有P5適體且在另一個末端具有P7的分子。
在一些實施方案中,可用step-out引物直接地進行從珠擴增下來,其通過抑制PCR添加P5和P7適體序列。在另一個實施方案中,每個珠可具有兩種類型的表面接枝的寡核苷酸,其中引物序列(如在圖13中的)為P5-讀段1測序引物或P7-讀段2測序引物。這將導致混合的P5-P7轉座體。這些可從珠裂解下并且然后通過抑制PCR以富集P5/P7分子或直接地從珠擴增下來,如以上描述的。
在一些實施方案中,單個轉座體類型(例如P5-讀段1-條形碼)可存在于珠的表面上。表面標簽化完成后,負載不同的擴增引物和/或測序引物的第二轉座體可在溶液中被添加以裂解橋接的分子。這得到具有能從珠表面裂解或擴增下來的相同的適體格式的所有分子。另外的樣品特異的條形碼可被添加至溶液轉座體以使得多個樣品可通過所述方法匯集。圖16是這種實施方案的圖示。如在圖16中顯示的,負載P7擴增引物序列的溶液相轉座體被添加至具有固定的橋接的標簽化產物的珠。固定的片段用含有P5擴增引物序列和對珠獨特的條形碼索引標簽(i9)的多核苷酸序列加標簽。如在圖16中顯示的,第二標簽化反應之后,每個片段具有負載P7引物序列的游離末端以及負載P5引物序列的固定的末端。
實施例1
流通池上的表面標簽化
該實施例描述了確認圖4a和4b中圖示的實施方案(表面標簽化然后溶液標簽化)的實驗。
利用一系列條件和對照進行8通道流通池上的實驗,如在圖6a和6b中顯示的。通道6表明了該方法的完整的從頭到尾的展示:未片段化的大腸桿菌(E.coli)基因組DNA被添加至流通池,其中其被表面結合的轉座體標簽化。接下來將熱施加于流通池以選擇性地使裸露的ME序列脫雜交,從而除去它們作為當轉座體接下來從溶液被添加時第二標簽化反應的靶。第二標簽化反應之后,產生簇并進行‘成對的末端’測序(2x36堿基讀段)。在圖7(slide 7)中給出了測序指標,其顯示在通道6中,73.14%的簇通過濾器并且這些中的74.69%是對齊的。這提供了足以獲得插入物的間隙大小圖和文庫多樣性的評價的數據(參見圖8)。
其他通道包括以下列出的對照。
通道1包含PhiX DNA作為陽性對照以確保所有物質被正確地抽運并且簇產生和測序如所預期的進行。
通道2是另一個對照通道,并闡明在靶DNA不存在下標簽化至表面結合的轉座體中。流通池(FC)含有標準成對的末端FC,在其上將含有標簽化引物序列和ME'序列(非轉移ME'鏈)的寡核苷酸與P7表面寡核苷酸雜交。該寡核苷酸以飽和濃度被添加。第一延伸產生具有ME末端的雙鏈轉座子。P5轉座體在溶液中被組裝并流至FC上(6.25nM/通道)。P5轉座體將雙鏈的表面結合的轉座子標簽化。標簽化產物隨后地被轉換成簇。
通道3圖示了在靶DNA的不存在下標簽化至表面結合的轉座子中,只有在該實例中,FC已被加熱至75℃以在從溶液添加P5轉座體之前將雙鏈的表面結合的轉座子轉化成單鏈寡核苷酸,以防止標簽化至這些結構中,因為這將干擾靶DNA的標簽化。
通道4圖示了將表面結合的轉座體添加至通道3的條件。在該通道中,含有標簽化引物序列和ME'序列的寡核苷酸與P7表面寡核苷酸雜交。第一延伸產生具有ME末端的雙鏈轉座子。這之后,通過將Tn5酶以50X濃度添加至通道并在30℃下孵育30分鐘,P7轉座體被組裝在FC的表面。然后在添加來自溶液的P5轉座體之前,FC被加熱至75℃。
通道5包括與通道4相同的條件,只是在該情況中不是添加來自溶液的P5轉座體,而是添加大腸桿菌900bp文庫(具有P5/P7末端)以確定在加熱步驟之后P7表面結合的轉座體是否保持活性。
通道6圖示了本發明應用于實踐的實例。在該實例中FC含有標準成對的末端FC,在其上將含有標簽化引物序列和ME'序列的寡核苷酸與P7表面寡核苷酸雜交。第一延伸產生具有ME末端的雙鏈轉座子。通過將Tn5酶以50X濃度添加至通道并在30℃下孵育30分鐘,P7轉座體被組裝在FC的表面。靶DNA(300ng未片段化的大腸桿菌基因組DNA)被添加至FC通道上并進行在55℃下孵育15min的步驟以發生標簽化。使用PBI(Qiagen)將P7表面結合的轉座體洗滌下來并且然后在添加來自溶液的P5轉座體之前將FC加熱至75℃。添加來自溶液的P5轉座體以及在55℃下15min的孵育步驟之后,進行鏈置換延伸反應以填充由轉座反應在DNA骨架中產生的9-bp空隙。鏈置換延伸反應包括添加Bst和dNTP混合物并在65℃下孵育5min。在最后步驟中將P5轉座體洗滌下來。此時,所有表面結合的分子應為P5-P7模板并且可因此被轉化成簇。
通道7含有與通道6相同的條件,只是在該實例中,加熱步驟已被去除,以突出熱對簇的數目和對齊%的影響。
通道8包括陰性對照,其中在雙鏈的表面結合的轉座子的飽和濃度的存在下P7轉座體已以50X濃度被組裝在表面上,但是未添加靶DNA。這允許評價表面結合的P7轉座體是否將表面結合的轉座子標簽化至其鄰近的雙鏈(ds)中。
實施例2
從大腸桿菌刮取物(scrape)制備表面結合的樣品
刮取大腸桿菌樣品(從瓊脂平板上的菌苔刮取5mm乘2mm)并重懸在含有水和玻璃珠的管中。利用渦旋混合器混合懸浮的細胞和珠以使細胞裂開并且然后離心以沉淀細胞碎片。上清液(含有細胞裂解物,包括蛋白質和核酸)被移除并添加至Genome Analyzer流通池(Illumina,Inc.,San Diego,CA),所述Genome Analyzer流通池具有根據實施例1中描述的方案的固定的轉座體。
利用Cluster Station樣品制備裝置(Illumina,Inc.,San Diego,CA)在流通池上進行簇產生。簇產生之后,以在每個方向上36個堿基的讀段來進行成對的末端測序運行。
對于讀段1,58.99%的簇通過濾器并且這些中的92.16%對齊。對于讀段2,58.99%的簇通過濾器并且這些中的55.08%對齊。這些數據證實,未純化的細胞裂解物可被直接地添加至具有固定的轉座體的流通池,具有出人意料的穩健的測序結果。
實施例3
該實施例描述了避免當溶液相轉座體被添加至流通池時的表面結合的寡核苷酸雙鏈體的標簽化的方法。
用于在流通池的表面上組裝轉座體的一種方法是取標準成對末端流通池、使‘夾板’寡核苷酸與P5和/或P7表面接枝的寡核苷酸雜交,形成可延伸的突出部分,所述可延伸的突出部分可用聚合酶延伸以制備含有雙鏈ME序列的雙鏈體。在該階段可添加轉座酶以形成功能性的表面結合的轉座體(圖5d)。如果只有雙鏈體的部分形成轉座體,隨后剩余的‘裸’ME雙鏈體可通過鄰近的表面結合的轉座體或從溶液添加的轉座體變成標簽化的靶。而且,完全組裝的表面轉座體含有ME序列上游的dsDNA部分,其也可通過鄰近的表面結合的轉座體或從溶液添加的轉座體變成標簽化的靶。這種不期望的標簽化自身顯示通過純化濾器的與靶基因組對齊的簇的百分比的減少。
這種影響的實例可通過比較圖18b中的通道4和5與通道6和7觀察到。在通道6和7中,如以上描述的用長的夾板寡核苷酸組裝轉座體,在延伸和轉座體組裝之后,長的夾板寡核苷酸產生具有至少50個雙鏈堿基的表面結合的雙鏈體。在用于表面標簽化反應(圖18a)和隨后的測序之后,分別僅22.59%和15.52%的簇與靶大腸桿菌對齊(圖18b)。
為了避免產生含有不與靶基因組DNA對齊的序列的簇的群體,如在圖17中說明的進行轉座體組裝。‘夾板’寡核苷酸首先與P5和/或P7表面接枝的寡核苷酸雜交,形成可用聚合酶延伸的可延伸的突出部分,以制備具有雙鏈ME序列的雙鏈體。接下來,通過去退火和沖洗來移除夾板寡核苷酸,并且然后通過使小至12個堿基長但優選地16個堿基長的較短寡核苷酸與表面附接的ME寡核苷酸的3'末端雜交來置換。添加轉座酶以組裝不含任何暴露的dsDNA的轉座體。不含結合的轉座酶的任何‘裸’雙鏈體通過在60℃下孵育流通池并在流動條件下洗滌來移除,以選擇性地去退火并移除短的雙鏈DNA。
該方法組裝轉座體的有益影響可在通道4和5中觀察到,其中表面結合的轉座體通過該方法組裝并被用于表面標簽化反應(圖18a)。與大腸桿菌對齊的簇的百分比從分別對于通道6和7的22.59%和15.52%增加至分別對于通道4和5的96.47%和96.41%。
貫穿該申請已參考多個出版物、專利和/或專利申請。通過引用以其全文將這些出版物的公開內容在此并入該申請。
在本文中術語包括是開放式的,不僅包括提及的要素,另外還包括任何另外的要素。
已描述了很多實施方案。但是,將理解可進行多種改變。相應地,其他的實施方案在所附權利要求書的范圍內。