專利名稱:一種基于pcr的dna標簽文庫構(gòu)建方法
技術(shù)領(lǐng)域:
本發(fā)明涉及DNA文庫構(gòu)建技術(shù)領(lǐng)域,特別是DNA標簽文庫構(gòu)建技術(shù)領(lǐng)域,特別是基于PCR的DNA標簽文庫構(gòu)建方法。另外,本發(fā)明還涉及標簽技術(shù),以及實現(xiàn)多個樣品在同一反應(yīng)體系中進行文庫構(gòu)建的方法。本發(fā)明的方法特別適用于第二代測序技術(shù),尤其是 solexa測序技術(shù)。
背景技術(shù):
Illumina公司提供的Solexa DNA測序平臺,可在一個反應(yīng)中同時加入四種帶熒光標記的核苷酸,采用邊合成邊測序Gequencing BySynthesis,SBS),具有所需樣品量少, 高通量,高精確性,擁有簡單易操作的自動化平臺和功能強大等特點[1-4]。文庫構(gòu)建首先需要將目的片段進行末端修復(fù),在目的片段的3’末端連接“A”堿基,將3’末端帶有“A”堿基的目的片段與DNA接頭(也稱為adapter)連接,通過PCR反應(yīng)將目的片段進行擴增,最后回收含有DNA接頭的目的片段文庫,見
圖1。目的片段文庫與測序芯片上面的DNA接頭進行雜交,通過橋式PCR進行擴增后,最后邊合成邊測序。在每個循環(huán)過程里,熒光標記的核苷和聚合酶被加入到單分子陣列中。互補的核苷和核苷酸片斷的第一個堿基配對,通過酶加入到引物上。多余的核苷被移走。這樣每個單鏈DNA分子通過互補堿基的配對被延伸, 針對每種堿基的特定波長的激光激發(fā)結(jié)合上的核苷的標記,這個標記會釋放出熒光,最后收集到的熒光信號來翻譯成堿基序列。目前這種DNA建庫方法可以根據(jù)需求運用于各種研究領(lǐng)域,如基因組的De Novo測序,基因組重測序、轉(zhuǎn)錄組測序和表觀基因組測序等。基于上述建庫方法illumina公司也推出了 DNA標簽(也稱為index)建庫方法, 如圖2所示。在DNA標簽建庫流程中,PCR過程使用了 3條PCR標簽引物,通過PCR導(dǎo)入標簽來構(gòu)建DNA標簽文庫[5]。專利申請W02005068656A1和W02008093098A2中公開了一種使用標簽序列標記核酸樣品的來源從而可以將樣品進行混合測序的方法,可以通過PCR的過程將特定的核苷酸序列(即標簽序列)通過PCR導(dǎo)入到文庫中,PCR標簽引物序列見表 1。這些帶有標簽的文庫可以根據(jù)需求進行任意混合,然后通過solexa測序儀器進行測序, 最后將數(shù)據(jù)按標簽標簽序列進行分類。但是illumina公司提供的標簽文庫制備的方法存在著一些缺陷第一、目前 illumina公司只提供12個長度為6bp的標簽序列,標簽的數(shù)量較少,隨著solexa測序通量的增加,不能對大量樣本進行混合測序?qū)⑹且粋€巨大的缺陷;第二、目前illumina公司提供的標簽建庫方法是通過PCR反應(yīng)將標簽序列導(dǎo)入到目的片段文庫中,需要3條PCR引物對目的片段進行擴增(兩條公用引物和一條PCR標簽引物,如表1),而且PCR擴增效率不尚ο第三、illumina公司提供的標簽建庫方法中接頭不包含標簽序列,每一個標簽文庫需要通過一個PCR反應(yīng)來導(dǎo)入標簽序列,然后針對每一個標簽文庫都需要切膠回收,然后將切膠回收后的標簽?zāi)康钠挝膸爝M行混合,這樣不僅費時費力,而且費用也較高。因此,對標簽的序列及標簽引入方法進行優(yōu)化和改進,使標簽引入的效率提高,擴大標簽序列的數(shù)量,才能滿足高通量的建庫的要求,以適應(yīng)測序通量不斷提高的現(xiàn)狀,使測序儀器的產(chǎn)能充分利用,降低測序的成本。表lillumina公司提供的標簽序列及相對應(yīng)的PCR標簽引物序列
權(quán)利要求
1.一組DNA標簽,所述DNA標簽包括如下或由如下組成表2所示的161個DNA標簽或與之相差1個堿基的DNA標簽中的至少10個,或至少20個,或至少30個,或至少40個,至少50個,或至少60個,或至少70個,或至少80個,或90個,或至少100個,或至少110個, 或至少120個,或至少130個,或至少140個,或至少150個,或全部161個,所述DNA標簽優(yōu)選地至少包括表2所示的161個DNA標簽的DNAhdexl DNA IndexlO,或 DNA Indexll DNA Index20,或 DNAhdex21 DNA Index30,或 DNA hdex31 DNA Index40,或 DNAhdex41 DNA Index50,或 DNA Index51 DNA Index60, 或 DNAhdex61 DNA Index70,或 DNA Index71 DNA Index80,或 DNAhdex81 DNA Index90,或 DNA hdex91 DNA IndexlOO,或 DNAhdexlOl DNA IndexllO,或 DNA Indexlll DNA Indexl20,或 DNAhdexl21 DNA Indexl30,或 DNA Indexl31 DNA hdexl40,或 DNAIndexHl DNA hdexl50,或 DNA hdexl51 DNA hdexl61,或者他們?nèi)魏蝺蓚€或多個的組合。
2.權(quán)利要求1所述的DNA標簽,其中所述的相差1個堿基包括標簽中1個堿基的取代、 添加或刪除。
3.權(quán)利要求1或2所述的DNA標簽用于構(gòu)建DNA標簽文庫的用途,其中DNA標簽文庫的DNA標簽接頭在3,末端包含所述DNA標簽,從而構(gòu)成各自相對應(yīng)的DNA標簽接頭,所述 DNA標簽接頭優(yōu)選地用作DNA標簽文庫的3,接頭。
4.權(quán)利要求3所述的用途,其中所述DNA標簽插入DNA標簽接頭中的3’末端中,或通過或不通過連接子連接在DNA接頭的3’末端,優(yōu)選地插入DNA標簽接頭中的3’末端中;更優(yōu)選地距離DNA標簽接頭中的3,末端1個堿基插入DNA標簽接頭中。
5.使用權(quán)利要求1或2的DNA標簽構(gòu)建的DNA標簽文庫。
6.含有權(quán)利要求1或2所述的DNA標簽的一組DNAPCR標簽引物,其中DNA PCR標簽引物在3’末端包含權(quán)利要求1所述的標簽,所述一組所述DNA PCR標簽引物包括如下或由如下組成表4所示161個DNAPCR標簽引物或與其所包含的DNA標簽序列相差1個堿基的 DNAPCR標簽引物中的至少10個,或至少20個,或至少30個,或至少40個,至少50個,或至少60個,或至少70個,或至少80個,或90個,或至少100個,或至少110個,或至少120 個,或至少130個,或至少140個,或至少150個,或全部161個,所述DNA PCR標簽引物優(yōu)選地至少包括表4所示的161個DNAPCR標簽引物中的 DNA PCR indexl primer ~ DNA PCR indexlOprimer, DNA PCR indexll primer ~ DNA PCR index20 primer, DNA PCR index21 primer ~ DNA PCR index30 primer, DNA PCRindex31 primer ~ DNA PCR index40 primer, DNA PCR index41primer ~ DNA PCR index50 primer,或 DNA PCR index51 primer DNA PCR index60 primer,或 DNA PCR index61 primer DNA PCRindex70 primer, DNA PCR index71 primer DNA PCR index80primer, DNA PCR index81 primer DNA PCR index90 primer, DNA PCR index91 primer ~ DNA PCR indexlOO primer, DNA PCRindexlOl primer ~ DNA PCR indexl 10 primer,或 DNA PCR indexl llprimer DNA PCR indexl20 primer,或 DNA PCR indexl21 primer DNA PCR indexl30 primer,或 DNA PCR indexl31 primer DNAPCR indexl40 primer,或 DNA PCR indexl41 primer DNA PCRindexl50 primer,或 DNA PCR indexl51 primer DNA PCR indexl61primer,或者他們?nèi)魏蝺蓚€或多個的組合。
7.權(quán)利要求6所述的DNAPCR標簽引物,其中所述的相差1個堿基包括標簽中1個堿基的取代、添加或刪除。
8.權(quán)利要求6或7所述的DNAPCR標簽引物用于構(gòu)建DNA標簽文庫的用途,優(yōu)選地所述DNA PCR標簽引物用作DNA標簽文庫的下游引物。
9.通過權(quán)利要求6或7所述的DNAPCR標簽引物構(gòu)建的DNA標簽文庫。
10.一種標簽文庫的構(gòu)建方法,所述方法的特征在于使用包含標簽的DNA PCR標簽引物來構(gòu)建標簽文庫。
11.權(quán)利要求10所述的方法,其包括1)提供η個DNA樣品,η為整數(shù)且1彡η彡161的整數(shù),優(yōu)選地η為整數(shù)且2彡η彡161, 所述DNA樣品來自所有真核和原核DNA樣品,包括但不限于人DNA樣品;2)將基因組DNA打斷,其中打斷方法包括但不限于超聲波打斷方法,優(yōu)選地使打斷后的DNA條帶集中在200bp左右;3)末端修復(fù);4)DNA片段3’末端加“A”堿基;5)連接DNA接頭;6)將步驟幻得到的連接產(chǎn)物進行凝膠回收純化,優(yōu)選地通過2%的瓊脂糖膠進行電泳并回收,并將各個DNA樣品的回收產(chǎn)物混合在一起;7)PCR反應(yīng),使用步驟6)的回收產(chǎn)物的混合物作為模板,在適于擴增目的核酸的條件下進行PCR擴增,將PCR產(chǎn)物進行膠回收純化,優(yōu)選地回收280 300bp的目的片段。
12.權(quán)利要求10或11所述的方法,其中步驟7)PCR反應(yīng)中使用的引物如下上游引物是 PE PCR Primers 1.0:AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT ;下游引物是包括如下或由如下組成的DNA PCR標簽引物表4所示161個DNA PCR標簽引物或與其所包含的DNA標簽序列相差1個堿基的DNA PCR標簽引物中的至少10個,或至少20個,或至少30個,或至少40個,至少50個,或至少60個,或至少70個,或至少80 個,或90個,或至少100個,或至少110個,或至少120個,或至少130個,或至少140個,或至少150個,或全部161個,所述DNA PCR標簽引物優(yōu)選地至少包括表4所示的161個DNAPCR標簽引物中的 DNA PCR indexl primer DNA PCR indexlOprimer,或 DNA PCR indexll primer DNA PCR index20 primer, DNA PCR index21 primer ~ DNA PCR index30 primer, DNA PCRindex31 primer ~ DNA PCR index40 primer, DNA PCR index41primer ~ DNA PCR index50 primer,或 DNA PCR index51 primer DNA PCR index60 primer,或 DNA PCR index61 primer DNA PCRindex70 primer, DNA PCR index71 primer DNA PCR index80primer,或 DNA PCR index81 primer DNA PCR index90 primer,或 DNA PCR index91 primer ~ DNA PCR indexlOO primer, DNA PCRindexlOl primer ~ DNA PCR indexllO primer,或 DNA PCR index 11 lprimer DNA PCR indexl20 primer,或 DNA PCR indexl21 primer DNA PCR indexl30 primer,或 DNA PCR indexl31 primer DNAPCR indexl40 primer,或 DNA PCR indexl41 primer DNA PCRindexl50 primer,或 DNA PCR indexl51 primer DNA PCR indexl61primer,或者他們?nèi)魏蝺蓚€或多個的組合。
13.權(quán)利要求12所述的方法,其中所述的相差1個堿基包括標簽中1個堿基的取代、添加或刪除。
14.權(quán)利要求11所述的方法,其中步驟5)中使用的DNA接頭是PEindex Adapters 5’ Phos/GATCGGAAGAGCACACGTCTGAACTCCAGTCAC5 ’ TACACTCTTTCCCTACACGACGCTCTTCCGATCT。
15.通過權(quán)利要求10或11所述的方法構(gòu)建的標簽文庫。
全文摘要
本發(fā)明設(shè)計了長度為8bp獨特的161個標簽序列,并將標簽嵌入DNA PCR引物中從而形成DNA PCR標簽引物,從而可以通過PCR反應(yīng)導(dǎo)入標簽序列。本發(fā)明成功地建立了DNA標簽文庫的建庫方法,并應(yīng)用于solexa DNA測序。
文檔編號C40B50/06GK102409049SQ20101029930
公開日2012年4月11日 申請日期2010年9月21日 優(yōu)先權(quán)日2010年9月21日
發(fā)明者于競, 劉濤, 周妍, 張艷艷, 田方, 章文蔚, 陳海燕, 龔梅花 申請人:深圳華大基因研究院, 深圳華大基因科技有限公司