本發(fā)明屬于生物技術領域,具體涉及一種可提高加A效率的突變型Taq酶及其制備方法和應用。
背景技術:
DNA聚合酶是一類以單鏈DNA為模板,合成其互補鏈的酶類。和其他來源于自然環(huán)境中的酶一樣,DNA聚合酶在進化中已經(jīng)適應了其發(fā)揮功能的環(huán)境,有相應的最適反應條件。不同來源的DNA聚合酶有不同的性質和功能,除聚合酶活性外,絕大多數(shù)也都包含外切酶活性(3’-5’外切酶活性或5’-3’外切酶活性),其中最常用的是來自一種水生嗜熱菌(Thermus aquaticus)的耐熱Taq酶。Taq DNA聚合酶屬于DNA聚合酶I家族,具有聚合酶和5’-3’外切酶活性,其聚合產物通常會在3’端形成一個帶A的粘性末端。目前的研究已經(jīng)對Taq酶的各方面性質有了比較明確的認識。在實際應用中,除野生型Taq酶外,也對野生型Taq酶做了不同的突變以優(yōu)化其各方面的性能。
目前,現(xiàn)有技術中有對Taq DNA聚合酶做突變或融合某些DNA結合蛋白來改善Taq酶的某些方面性能,比如熱穩(wěn)定性、延伸速度、延伸長度等。在目前高速發(fā)展的高通量測序技術應用中,Taq酶也被用來在建庫過程中給短的DNA片段末端加A,以利于后續(xù)加接頭等操作。除了野生型Taq酶之外,用于加A的酶還可以是DNA結合蛋白修飾過的Taq酶、3’-5’外切酶活性缺失的klenow酶、5’-3’外切酶活性缺失的Taq酶等。
由于目前已有的用于加A的酶普遍存在效率較低的情況,不能有效加A導致接頭無法連接到DNA片段上,所以,大大限制了高通量測序中建庫的質量和效率。因此,需要對野生型Taq酶進行改造,使之適應目前高通量測序技術的建庫需求。
技術實現(xiàn)要素:
本發(fā)明的目的在于提供一種可提高加A效率的突變型Taq酶及其制備方法和應用,克服了現(xiàn)有高通量測序技術中DNA片段末端加A效率低的缺陷,改造得到氨基酸序列如SEQ NO.1所示的突變型Taq酶,此突變型Taq酶加A效率得到較大提高,更加適應高通量測序建庫的需求。
為達到上述目的,本發(fā)明的技術方案是:
一種可提高加A效率的突變型Taq酶,含有下述1-6個突變位點:突變位點1:E315K,即野生型Taq酶氨基酸序列中第315位的谷氨酸突變?yōu)橘嚢彼?;突變位點2:E388V,即野生型Taq酶氨基酸序列中第388位的谷氨酸突變?yōu)槔i氨酸;突變位點3:E507K,即野生型Taq酶氨基酸序列中第507位的谷氨酸突變?yōu)橘嚢彼?;突變位點4:D578G,即野生型Taq酶氨基酸序列中第578位的天冬氨酸突變?yōu)楦拾彼?;突變位點5:A608V,即野生型Taq酶氨基酸序列中第608位的丙氨酸突變?yōu)槔i氨酸;突變位點6:M747R,即野生型Taq酶氨基酸序列中第747位的甲硫氨酸突變?yōu)榫彼帷?/p>
本發(fā)明所述可提高加A效率的突變型Taq酶,其氨基酸序列如SEQNO.1所示。
本發(fā)明還提供編碼所述突變型Taq酶的基因。
進一步,本發(fā)明編碼所述突變型Taq酶的基因的核苷酸序列如SEQNO.2所示。需要說明的是,由于同一氨基酸可能有多種不同的密碼子來決定,所以編碼上述突變型Taq酶的核苷酸序列并不局限于SEQ NO.2所示序列,也可以是由與SEQ NO.2所示核苷酸序列突變一個或幾個核苷酸形成同義突變得到可編碼相同氨基酸序列的核苷酸序列。
再,本申請?zhí)峁┝艘环N載體,該載體包含可編碼所述突變型Taq酶的核苷酸序列。
進一步,所述載體包含如SEQ NO.2所示的核苷酸序列。
一種重組細胞,包含:包含可編碼所述突變型Taq酶的核苷酸序列,或包含可編碼所述突變型Taq酶的核苷酸序列的載體。
進一步,所述重組細胞所使用的宿主細胞為BL21。
一種含有所述突變型Taq酶的聚合酶試劑。
本發(fā)明所述突變型Taq酶在高通量測序中的應用。
本發(fā)明所述可提高加A效率的突變型Taq酶的制備方法,其包括如下步驟:
1)構建含編碼突變型Taq酶的核苷酸序列的載體:利用含有突變位點信息的引物,對含有野生型Taq酶基因的質粒進行PCR擴增;得到目的條帶后利用同源重組得到重組質粒或直接轉化得到突變質粒,測序驗證;
2)將步驟1)得到的載體轉化宿主細胞得到重組細胞:將載體轉化到宿主細胞中,利用抗生素篩選得到正確轉化的重組細胞;
3)培養(yǎng)并收集重組細胞,提取純化突變型Taq酶。
進一步,步驟1)中,所述引物的具體序列如下:
E315K-1:TTCCCGCAAGAAGCCCATGTGGGCCGATCTTCTG;
E315K-2:CCCACATGGGCTTCTTGCGGGAAAGCACAAAGCC;
E388V-1:CACCACCCCCGTGGGGGTGGCCCGGCGCTACGGC;
E388V-2:GGGCCACCCCCACGGGGGTGGTGTTGGAAGGGTC;
E507K-1:CGGCAAGACGAAGAAGACCGGCAAGCGCTCCACC;
E507K-2:TGCCGGTCTTCTTCGTCTTGCCGATGGCGGGAAG;
D578G-1:AAGTAGCTCCGGCCCCAACCTCCAGAACATCCCC;
D578G-2:GGAGGTTGGGGCCGGAGCTACTTAGCCTGCCCGT;
A608V-1:GCTATTGGTGGTGCTGGACTATAGCCAGATAGAG:
A608V-2:TATAGTCCAGCACCACCAATAGCCACCCCTCCTC;
M747R-1:GGCCGAGCGCCGCGCCTTCAACATGCCCGTCCAGG;
M747R-2:TGTTGAAGGCGCGGCGCTCGGCCGCCTCCCGCAC。
本發(fā)明上述引物中包含了需要突變的位點和替換過的堿基。
本發(fā)明測試結果顯示:與野生型Taq酶相比,使用本發(fā)明改造的所述突變型Taq酶進行加A的實驗組文庫產量明顯提高,文庫分布無異常,充分說明所述突變型Taq酶的加A效果得到顯著提高。
本發(fā)明的有益效果:
本發(fā)明對野生型Taq酶進行定向突變優(yōu)化,使之適應在高通量測序技術中的應用要求,得到所述突變型Taq酶。該突變型Taq酶使加A效率得到提升,增加了建庫效率,可應用于更低起始量模板和增加建庫完整性和覆蓋度。
附圖說明
圖1為本發(fā)明實施例4文庫的瓊脂糖凝聚電泳檢測結果。
圖2為本發(fā)明實施例4文庫分布檢測結果。
具體實施方式
下面結合實施例和附圖對本發(fā)明做進一步說明。
實施例1構建含編碼突變型Taq酶的核苷酸序列的載體
利用基因合成的方法,合成引物序列如下:
E315K-1:TTCCCGCAAGAAGCCCATGTGGGCCGATCTTCTG;
E315K-2:CCCACATGGGCTTCTTGCGGGAAAGCACAAAGCC;
E388V-1:CACCACCCCCGTGGGGGTGGCCCGGCGCTACGGC;
E388V-2:GGGCCACCCCCACGGGGGTGGTGTTGGAAGGGTC;
E507K-1:CGGCAAGACGAAGAAGACCGGCAAGCGCTCCACC;
E507K-2:TGCCGGTCTTCTTCGTCTTGCCGATGGCGGGAAG;
D578G-1:AAGTAGCTCCGGCCCCAACCTCCAGAACATCCCC;
D578G-2:GGAGGTTGGGGCCGGAGCTACTTAGCCTGCCCGT;
A608V-1:GCTATTGGTGGTGCTGGACTATAGCCAGATAGAG;
A608V-2:TATAGTCCAGCACCACCAATAGCCACCCCTCCTC;
M747R-1:GGCCGAGCGCCGCGCCTTCAACATGCCCGTCCAGG;
M747R-2:TGTTGAAGGCGCGGCGCTCGGCCGCCTCCCGCAC;
以包含野生型Taq酶基因序列的質粒為模板,利用PCR對野生型Taq酶基因進行擴增。PCR擴增分為6個反應,分別以E315K-2和E388V-1,E388V-2和E507K-1,E507K-2和D578G-1,D578G-2和A608V-1,A608V-2和M747R-1,M747R-2和E315K-1為引物,在50μl反應體系中,10μM的引物各加入2μl,以Phanta Max Super-Fidelity DNA Polymerase(由南京諾唯贊生物科技有限公司生產,Vazyme,貨號P505)為DNA聚合酶。擴增條件為95℃ 30s;95℃ 15s;60℃ 15s;72℃ 30s-3min;72℃ 5min;共30個循環(huán)。
擴增結束后,在50μl反應體系中直接加入1μl DpnI,37℃恒溫孵育2小時,消化原始質粒模板。以1%-1.5%(W/V)瓊脂糖凝膠電泳,得到目的條帶后切膠回收。將回收產物利用MutMultiS Fast Mutagenesis Kit V2(由南京諾唯贊生物科技有限公司生產,Vazyme,貨號C215)進行重組反應,37℃恒溫孵育0.5小時。
取20μl冷卻反應液,加入到100μl DH5α感受態(tài)細胞(Vazyme)中,輕彈管壁數(shù)下混勻,在冰上放置30min。42℃熱激90秒,冰水浴孵育2min。加入500μl LB培養(yǎng)基,37℃孵育10min充分復蘇。37℃搖菌45min。取100μl菌液均勻涂布在含有氨芐青霉素的平板上。將平板倒置,于37℃過夜培養(yǎng)。第二天挑取單克隆,測序。測序結果表明:本發(fā)明合成的突變型Taq酶的核苷酸序列如SEQ NO.2所示,氨基酸序列如SEQ NO.1所示。
實施例2將載體轉化宿主細胞得到重組細胞:
取10ng測序驗證無誤的載體以同樣轉化方法轉化到BL21感受態(tài)細胞中,涂布在含有氨芐青霉素的LB平板上,37℃過夜培養(yǎng)。第二天挑取單克隆。
實施例3培養(yǎng)并收集重組細胞,提取純化突變型Taq酶
將單克隆重組細胞挑入3ml LB液體培養(yǎng)基中,搖培6-8h,然后轉接擴大培養(yǎng)至300ml LB液體培養(yǎng)基中,搖培4-6h后,加入IPTG至終濃度為50mmol/L后繼續(xù)搖培過夜,誘導目的蛋白表達。將300ml菌液分裝至50ml離心管中,以5000rpm離心10min收集菌體。每100ml菌液離心后加入10ml洗脫緩沖液(50mmol/L Tris-HCl pH7.9;50mmol/L右旋糖;1mmol/L EDTA)重懸,冰上放置1h;3500rpm離心3min重新收集菌體,加入50ml預裂解緩沖液(洗脫緩沖液加4g/L溶菌酶),室溫放置15min;加入50ml裂解緩沖液(10mmol/L Tris-HCl pH7.9;50mmol/L KCl;1mmol/L EDTA;1mmol/L PMSF;0.5%Tween-20(V/V);0.5%NP-40(V/V)),劇烈振蕩混勻,75℃孵育1h,不時振蕩,然后將裂解混合液轉移至50m1離心管,4℃5000rpm離心15min,轉移上清液至新的離心管中,加入30g硫酸銨,室溫迅速混勻。15000rpm離心15min,將蛋白沉淀物重新懸浮至20ml洗脫緩沖液中,在儲存緩沖液(50mmol/L Tris-HCl pH7.9;50mmol/L KCl;0.1mmol/L EDTA;0.5mmol/L PMSF;1mmol/L DTT;50%glycerol(V/V)中透析至少12h。透析后,用儲存緩沖液1∶1稀釋,儲存于-80℃。
實施例4突變型Taq酶和野生型Taq酶的性能比較
將2份10ng起始DNA模板分別利用VAHTS Nano DNA Library PrepKit for(由南京諾唯贊生物科技有限公司生產,Vazyme,貨號ND601)進行片段化和末端修復后,用等量突變型Taq酶和野生型Taq酶進行加A反應。然后加接頭連接,用試劑盒中的擴增模塊進行文庫擴增,得到文庫。
對文庫進行瓊脂糖凝膠電泳檢測,結果如圖1所示,其中,DNA marker為100bp DNA ladder(購于Takara公司,貨號3422A)。由圖1可知,從等體積建庫產物在紫外下的亮度來看,突變型Taq酶組在300bp左右的條帶亮度均高于野生型Taq酶組,可見,突變型Taq酶的建庫效率高于野生型Taq酶。
進一步,使用熒光染料Qubit進行文庫濃度測定,測定結果如表1所示。由表1可知,突變型Taq酶組文庫的濃度明顯增大,充分說明突變型Taq酶的加A效率得到了顯著提高。
將文庫稀釋后,用Agilent Technologies 2100Bioanalyzer購于AgilentTechnologies公司)進行文庫分布檢測,結果如圖2所示,圖2顯示二者分布正常。
綜上表明:與野生型Taq酶相比,本發(fā)明所述突變型Taq酶進行加A的實驗組文庫產量明顯提高,突變型Taq酶的加A效率顯著提高,且文庫分布無異常。
表1
應理解,這些實施例僅用于說明本發(fā)明而不用于限制本發(fā)明的范圍。此外應理解,在閱讀了本發(fā)明講授的內容之后,本領域技術人員可以對本發(fā)明作各種改動或修改,這些等價形式同樣落于本發(fā)明所附權利要求書所限定的范圍。
序列表
<110>南京諾唯贊生物科技有限公司
<120>一種可提高加A效率的突變型Taq酶及其制備方法和應用
<160>2
<210>SEQ ID NO. 1
<211>833
<212>PRT
<213>人工合成
MNSGMLPLFE PKGRVLLVDG HHLAYRTFHA LKGLTTSRGE PVQAVYGFAK SLLKALKEDG 60
DAVIVVFDAK APSFRHEAYG GYKAGRAPTP EDFPRQLALI KELVDLLGLA RLEVPGYEAD 120
DVLASLAKKA EKEGYEVRIL TADKDLYQLL SDRIHVLHPE GYLITPAWLW EKYGLRPDQW 180
ADYRALTGDE SDNLPGVKGI GEKTARKLLE EWGSLEALLK NLDRLKPAIR EKILAHMDDL 240
KLSWDLAKVR TDLPLEVDFA KRREPDRERL RAFLERLEFG SLLHEFGLLE SPKALEEAPW 300
PPPEGAFVGF VLSRKKPMWA DLLALAAARG GRVHRAPEPY KALRDLKEAR GLLAKDLSVL 360
ALREGLGLPP GDDPMLLAYL LDPSNTTPVG VARRYGGEWT EEAGERAALS ERLFANLWGR 420
LEGEERLLWL YREVERPLSA VLAHMEATGV RLDVAYLRAL SLEVAEEIAR LEAEVFRLAG 480
HPFNLNSRDQ LERVLFDELG LPAIGKTKKT GKRSTSAAVL EALREAHPIV EKILQYRELT 540
KLKSTYIDPL PDLIHPRTGR LHTRFNQTAT ATGRLSSSGP NLQNIPVRTP LGQRIRRAFI 600
AEEGWLLVVL DYSQIELRVL AHLSGDENLI RVFQEGRDIH TETASWMFGV PREAVDPLMR 660
RAAKTINFGV LYGMSAHRLS QELAIPYEEA QAFIERYFQS FPKVRAWIEK TLEEGRRRGY 720
VETLFGRRRY VPDLEARVKS VREAAERRAF NMPVQGTAAD LMKLAMVKLF PRLEEMGARM 780
LLQVHDELVL EAPKERAEAV ARLAKEVMEG VYPLAVPLEV EVGIGEDWLS AKE 833
<210>SEQ ID NO. 2
<211>2502
<212>DNA
<213>人工合成
atgaattcgg ggatgctgcc cctctttgag cccaagggcc gggtcctcct ggtggacggc 60
caccacctgg cctaccgcac cttccacgcc ctgaagggcc tcaccaccag ccggggggag 120
ccggtgcagg cggtctacgg cttcgccaag agcctcctca aggccctcaa ggaggacggg 180
gacgcggtga tcgtggtctt tgacgccaag gccccctcct tccgccacga ggcctacggg 240
gggtacaagg cgggccgggc ccccacgccg gaggactttc cccggcaact cgccctcatc 300
aaggagctgg tggacctcct ggggctggcg cgcctcgagg tcccgggcta cgaggcggac 360
gacgtcctgg ccagcctggc caagaaggcg gaaaaggagg gctacgaggt ccgcatcctc 420
accgccgaca aagaccttta ccagctcctt tccgaccgca tccacgtcct ccaccccgag 480
gggtacctca tcaccccggc ctggctttgg gaaaagtacg gcctgaggcc cgaccagtgg 540
gccgactacc gggccctgac cggggacgag tccgacaacc ttcccggggt caagggcatc 600
ggggagaaga cggcgaggaa gcttctggag gagtggggga gcctggaagc cctcctcaag 660
aacctggacc ggctgaagcc cgccatccgg gagaagatcc tggcccacat ggacgatctg 720
aagctctcct gggacctggc caaggtgcgc accgacctgc ccctggaggt ggacttcgcc 780
aaaaggcggg agcccgaccg ggagaggctt agggcctttc tggagaggct tgagtttggc 840
agcctcctcc acgagttcgg ccttctggaa agccccaagg ccctggagga ggccccctgg 900
cccccgccgg aaggggcctt cgtgggcttt gtgctttccc gcaagaagcc catgtgggcc 960
gatcttctgg ccctggccgc cgccaggggg ggccgggtcc accgggcccc cgagccttat 1020
aaagccctca gggacctgaa ggaggcgcgg gggcttctcg ccaaagacct gagcgttctg 1080
gccctgaggg aaggccttgg cctcccgccc ggcgacgacc ccatgctcct cgcctacctc 1140
ctggaccctt ccaacaccac ccccgtgggg gtggcccggc gctacggcgg ggagtggacg 1200
gaggaggcgg gggagcgggc cgccctttcc gagaggctct tcgccaacct gtgggggagg 1260
cttgaggggg aggagaggct cctttggctt taccgggagg tggagaggcc cctttccgct 1320
gtcctggccc acatggaggc cacgggggtg cgcctggacg tggcctatct cagggccttg 1380
tccctggagg tggccgagga gatcgcccgc ctcgaggccg aggtcttccg cctggccggc 1440
caccccttca acctcaactc ccgggaccag ctggaaaggg tcctctttga cgagctaggg 1500
cttcccgcca tcggcaagac gaagaagacc ggcaagcgct ccaccagcgc cgccgtcctg 1560
gaggccctcc gcgaggccca ccccatcgtg gagaagatcc tgcagtaccg ggagctcacc 1620
aagctgaaga gcacctacat tgaccccttg ccggacctca tccaccccag gacgggccgc 1680
ctccacaccc gcttcaacca gacggccacg gccacgggca ggctaagtag ctccggcccc 1740
aacctccaga acatccccgt ccgcaccccg cttgggcaga ggatccgccg ggccttcatc 1800
gccgaggagg ggtggctatt ggtggtgctg gactatagcc agatagagct cagggtgctg 1860
gcccacctct ccggcgacga gaacctgatc cgggtcttcc aggaggggcg ggacatccac 1920
acggagaccg ccagctggat gttcggcgtc ccccgggagg ccgtggaccc cctgatgcgc 1980
cgggcggcca agaccatcaa cttcggggtc ctctacggca tgtcggccca ccgcctctcc 2040
caggagctag ccatccctta cgaggaggcc caggccttca ttgagcgcta ctttcagagc 2100
ttccccaagg tgcgggcctg gattgagaag accctggagg agggcaggag gcgggggtac 2160
gtggagaccc tcttcggccg ccgccgctac gtgccagacc tagaggcccg ggtgaagagc 2220
gtgcgggagg cggccgagcg ccgcgccttc aacatgcccg tccagggcac cgccgccgac 2280
ctcatgaagc tggctatggt gaagctcttc cccaggctgg aggaaatggg ggccaggatg 2340
ctccttcagg tccacgacga gctggtcctc gaggccccaa aagagagggc ggaggccgtg 2400
gcccggctgg ccaaggaggt catggagggg gtgtatcccc tggccgtgcc cctggaggtg 2460
gaggtgggga taggggagga ctggctctcc gccaaggagt ga 2502