一種實現基因組定點修飾的蛋白表達載體的方法【專利摘要】本發明涉及生物基因克隆表達技術,特別是一種快速高效地構建轉錄激活因子樣效應蛋白切割酶(TALEN)表達載體的方法。特別適合用于大規模的構建針對高等動物基因組遺傳修飾的表達載體,以研究動物基因的功能。【專利說明】一種實現基因組定點修飾的蛋白表達載體的方法【
技術領域:
】[0001]本發明涉及生物基因克隆表達技術,特別是一種快速高效地構建轉錄激活因子樣效應蛋白切割酶(TALEN)表達載體的方法。特別適合用于大規模的構建針對高等動物基因組遺傳修飾的表達載體,以研究動物基因的功能。【
背景技術:
】[0002]一.TALEN技術的介紹和應用[0003]隨著越來越多的物種全基因組序列測定工作的完成,當前的基因組學研究熱點已經由結構基因組學轉向了功能基因組學,因此發展能夠快速、高效、高通量的基因功能研究方法和策略具有廣泛的需求。基因敲除(Knockout)技術是當今動物基因功能研究中最為重要的手段。近一年多來,陸續有文獻報導轉錄激活因子樣效應蛋白(TALEtranscriptionActivatorLikeEffectors)能夠高效的用于基因組的修飾,從而達到調控動植物內源基因的轉錄調控,其特異性高,操作簡便,重復性好。[0004]轉錄激活因子樣效應蛋白(TALE!TranscriptionActivatorLikeEffectors)是植物致病菌Xanthomonas通過III型分泌系統注入到宿主細胞內的一種蛋白質(參考文獻1-4)。TALE蛋白的奇特之處在于它包括一個DNA結合結構域,該DNA結合結構域不同于其他已知的DNA結合結構域。它是由數量不同(通常15到35個)的重復單元組成,每一個重復單元能夠特異識別一個DNA堿基對。通常情況下每個重復單元由34個氨基酸組成,除了第12和13位的氨基酸存在變化,其他位點的氨基酸高度保守。這兩個不保守的氨基酸被命名為RVD(RepeatVariableDiresidue)。現在已經確定,每個重復單元中12和13位的氨基酸和識別的核苷酸種類有特殊的一一對應關系:HD單元對應堿基C;NI單元對應堿基A;NG單元對應堿基T;NN單元對應堿基G。[0005]TALE蛋白的特異DNA序列識別的特性以及DNA結合結構域中重復單元的可組裝性為它們在生物學和生物技術中的應用提供了巨大的前景,理論上科學家們可以設計和組裝任意的TALE單元去識別目標DNA序列。目前為止,利用TALE蛋白這一特性的應用中,前途最為廣闊的是用于構造切割特異雙鏈DNA序列的工具酶TALEN(TALENuclease)0TALEN把限制性內切酶(FokI)融合表達于TALE蛋白的羧基端,通過在細胞中表達一對TALEN融合蛋白,稱之為5’端TALEN蛋白和3’端TALEN蛋白。它們的DNA結合結構域可以分別特異識別并結合目標DNA序列,實現對基因組中目的基因的錨定。5’端TALEN蛋白和3’端TALEN蛋白的羧基端融合的限制性內切酶FokI,在空間上靠近后可以形成二聚體,切割位于DNA結合結構域錨定的DNA序列之間的DNA雙螺旋,形成DNA雙鏈斷裂。見圖1。[0006]絕大多數物種在進化中都形成了天然的DNA斷裂修復機制。通過TALEN識別并結合指定的基因組中的特定位點,高效并且精確地造成靶位點DNA斷裂。然后,細胞可以自發的識別基因組中的DNA雙鏈斷裂,利用天然的DNA修復過程一“同源定向修復”或“非同源末端連接”來修復靶DNA斷裂。研究人員可以利用這個過程,進行各種形式的基因組編輯或修飾。通過“非同源末端連接”,可以導入DNA堿基插入和堿基缺失,從而實現基因敲除;通過“同源定向修復”,可以實現基因替換和定向的基因添加。傳統的基因敲除技術依賴于細胞內自然發生的同源重組,其效率非常低,通常為10-6級別。而TALEN技術可以實現在基因組的特定DNA位點產生缺口,通過細胞內源的同源重組或非同源末端連接來實現目的基因的敲除,因此極大的提高了基因敲除的效率,可以達到10-25%。迄今為止,TALEN已經成功應用于模式物種果蠅、斑馬魚、小鼠和大鼠的細胞和個體水平的基因組修飾(參考文獻5-9)。[0007]二.TALEN技術實現的難點[0008]通過TALEN技術實現在動物細胞或者個體中進行基因組修飾,必須通過分子生物學技術構建TALEN蛋白的表達載體。TALEN蛋白的結構包括氨基端蛋白片段、羧基端蛋白片段和位于前二者之間的DNA結合結構域。DNA結合結構域由數量不同(通常15到20個)的重復單元組成,每一個重復單元特異識別一個DNA堿基對。其中,最后一個重復單元(末位重復單元)是一個部分完整的重復單元。組成重復單元的34個氨基酸中,只有第12和13位點的氨基酸存在變化,這種氨基酸片段的高度重復結構使得構建TALEN蛋白的表達元件非常有難度。[0009]目前,已知的構建TALEN蛋白表達載體的方法主要有2種:[0010]第一種是采用順序克隆的方法(見圖2)。順序克隆的內容是:將4個不同的重復單元(分別HD單元;NI單元;NG單元和NN單元)的表達元件,分別構建于一個克隆載體中,然后通過DNA酶切和DNA連接,每次將一個重復單元的表達元件DNA切下,并且插入到最終目的表達載體,完成一個重復單元的組裝。第一個重復單元組裝后,再進行第二個重復單元的組裝,直到依次將所有的重復單元組裝完畢。第二種方法采用全化學合成的方法,合成TALEN蛋白的DNA結合結構域的表達元件,來實現表達載體的構建。[0011]上述2種方法雖然能夠成功構建TALEN蛋白表達載體,但是明顯存在不足,主要表現在以下幾個方面:[0012]1.步驟繁瑣,克隆效率低。順序克隆方法中,每一輪操作都需要DNA的酶切、片段的純化回收、DNA插入片度和載體的連接、大腸桿菌的轉化、含有重組載體的陽性菌的篩選鑒定以及陽性菌中的重組載體質粒的提取。一輪操作下來所需要的時間最少為3天。用于基因組修飾的TALEN蛋白,通常需要DNA結合結構域包括15到20個重復單元。因此要實現含有15到20個重復單元的TALEN蛋白的表達載體的構建,通常需要5輪上述操作。待完整的TALEN蛋白表達元件構建完成,需要再進行一輪操作,將整個表達元件酶切下來,連接到最終的真核生物表達載體中。[0013]2.成本高。順序克隆方法中,每一輪操作都包括:DNA的酶切、目的DNA片段的純化回收、DNA插入片度和載體的連接、連接產物轉化大腸桿菌、篩選鑒定含有重組載體的陽性菌和重組載體質粒的提取。“順序克隆”方法構建一個含有20個重復單元的TALEN蛋白的真核表達載體,需要6輪操作。每一個步驟都意味著投入的耗材、試劑和人力的成本。化學合成方法現階段最大的不足在于化學合成長片段的DNA片段成本非常高。按照現在主要提供商的產品合成價格,合成一個含有20個重復單元的DNA結合結構域的表達元件DNA,成本聞于2_3萬人民幣。[0014]因此,在本領域中,仍有對快速、高效、低成本地構建TALEN蛋白表達載體的需要。[0015]參考文獻:[0016]1.PlantPathogenRecognitionMediatedbyPromoterActivationofthePepperBs3ResistanceGene.PatrickRdlTier3SimoneHahn,TinaJordan,TinaStrau,UllaBonas,ThomasLahaye.Science318,645(2007)[0017]2.ABacterialEffectorActsasaPlantTranscriptionFactorandInducesaCellSizeRegulator.SabineKayjSimoneHahn,EricMaroisjGerdHausejUllaBonas.Science318,648(2007)[0018]3.ASimpleCipherGovernsDNARecognitionbyTALEffectors.MatthewJ.MoscouandAdamJ.Bogdanove.SCIENCE326,1501(2009)[0019]4.BreakingtheCodeofDNABindingSpecificityofTAL-TypeII1.JensBochjHeidiScholzejSebastianSchornackjAngelikaLandgraf,SimoneHahn,SabineKayjThomasLahaye,AnjaNickstadtjUllaBonas.Science326,1509(2009)[0020]5.ATALEnucleasearchitectureforefficientgenomeediting.JeffreyCMillerjSiyuanTan,GuijuanQiao,KyleABarlow,JianbinWang,DannyFXiajXiangdongMengjDavidEPaschonjEloLeung,SarahJHinkleyjGladysPDulayjKevinLHua,IrinaAnkoudinova,GregoryJCost,FyodorDUrnovjSteveZhangjMichaelCHolmes,LeiZhang,PhilipDGregory&EdwardJRebar,NatureBiotechnol.29,143-148(2011)[0021]6.KnockoutratsgeneratedbyembryomicroinjectionofTALENs.LaurentTessonjClaireUsaljSeverineMenoretjEloLeung,BrettJNiles,SeverineRemyjYolandaSantiago,AnnaIVincent,XiangdongMengjLeiZhang,PhilipDGregoryjIgnacioAnegon&GregoryJCost,NatureBiotechnol.29,695-696(2011)[0022]7.TargetedgenedisruptioninsomaticzebrafishcellsusingengineeredTALENs.JeffryDSander,LindsayCade,CydKhayter,DeepakReyonjRandallTPetersonjJKeithJoung&Jing-RueyJYeh.NatureBiotechnol.29,697-698(2011)[0023]8.HeritablegenetargetinginzebrafishusingcustomizedTALENs.PengHuangjAnXiao,MingguoZhou,ZuoyanZhu,ShuoLin&BoZhang.NatureBiotechnol.29,699-700(2011)[0024]9.GeneticengineeringofhumanpluripotentcellsusingTALEnucleases.DirkHockemeyer,HaoyiWang,SamiraKiani,ChristineSLaijQingGaojJohnPCassady,GregoryJCost,LeiZhang,YolandaSantiago,JeffreyCMiller,BryanZeitler,JenniferMCherone,XiangdongMeng,SarahJHinkley,EdwardJRebar,PhilipDGregory,FyodorDUrnov&RudolfJaenisch.NatureBiotechnol.29,731-734(2011)【
發明內容】[0025]在本申請中,除非另行指明,對于核苷酸序列,A、C、T、G代表核苷酸堿基的單字母縮寫,而下述大寫字母代表選自多個堿基中的任一個:[0026]R----A/G[0027]Y----C/T[0028]M----A/C[0029]K——G/T[0030]S——G/C[0031]WA/T[0032]H----A/T/C[0033]B——G/T/C[0034]V----G/A/C[0035]D----G/A/T[0036]N——A/G/C/T。[0037]在本申請中,除非另行指明,只表明序列之間的連接關系,本身不代表任何序列。[0038]本發明由下述段落所描述:[0039]1.一種核苷酸序列,所述核苷酸序列包含下述結構:[0040]R1-Ln-Xn-Lntl-R2,[0041]其中η選自I至m的自然數,m為7、8、9、10、11、12、13或14;[0042]R1和R2分別為IIS型限制性內切酶識別序列及其反向互補序列;[0043]1^和Ln+1為i個核苷酸的接頭序列,i為該IIS型選擇性內切酶酶切產生的粘性末端的長度;[0044]其中,[0045]L1為SEQIDNO:2的編碼序列的J1至jj1-l位;[0046]Lm+1為SEQIDNO:3的編碼序列的jm+1至jm+1+1-l位;[0047]Lk為SEQIDNO:1的編碼序列的jk至jk+i_l位,k是2至m的自然數;[0048]其中J1選自I至970-1;[0049]jm+1選自I至730-1;[0050]當k為2至m時,jk選自I至97-1,[0051]且L1至Llrt彼此各不相同;[0052]當n=l時,父?為YD1,[0053]當n=m時,Xn為YE,[0054]當η為2至m-Ι時,Xn選自YDn*YSn,[0055]其中YDn為FLn-YLn-FMn-YRn-FRn,[0056]YSn為FLn-Yn-FRn,[0057]YE為FLn1-Yn1-FRE,[0058]其中,[0059]當n=l時,[0060]FL1為SEQIDNO:2的編碼序列的jji至969位,但當1=9704時,該FL1為空序列,[0061]其他情況下:[0062]FLn為SEQIDNO:1的編碼序列的jn+i至96位,但當jn=97_i時,該FLn為空序列,[0063]FRn為SEQIDNO:1的編碼序列的I至jn+1_l位,但當jn+1=l時,該FRn為空序列,[0064]FMn為SEQIDNO:1的編碼序列,[0065]FRE為SEQIDNO:3的編碼序列的I至jm+rl位,但當jm+1=l時,該FRn為空序列,[0066]其中Yn、YLn,YRn彼此獨立地為堿基Α、C、T或G的TALE識別序列的編碼序列。[0067]2.一種試劑盒,所述試劑盒包括m種核苷酸序列,且任選地包括表達載體,其中m為7、8、9、10、11、12、13或14,[0068]其中第η種核苷酸序列包含下述結構:[0069]R1-Ln-Xn-Lntl-R2,[0070]其中η選自I至m的自然數;[0071]R1和R2分別為IIS型限制性內切酶識別序列及其反向互補序列;[0072]Ln和Ln+1為i個核苷酸的接頭序列,i為該IIS型選擇性內切酶酶切產生的粘性末端的長度;[0073]其中,[0074]L1為SEQIDNO:2的編碼序列的J1至j'+1-l位;[0075]Lm+1為SEQIDNO:3的編碼序列的jm+1至jm+1+1-l位;[0076]Lk為SEQIDNO:1的編碼序列的jk至jk+i_l位,k是2至m的自然數;[0077]其中J1選自I至970-1;[0078]jm+1選自I至730-1;[0079]當k為2至m時,jk選自I至97-1,[0080]且L1至Llrt彼此各不相同;[0081]當n=l時,Xn為YD1,[0082]當n=m時,Xn為YE,[0083]當η為2至m-Ι時,Xn選自YDn*YSn,[0084]其中YDn為FLn-YLn-FMn-YRn-FRn,[0085]YSn為FLn-Yn-FRn,[0086]YE為FLn1-Yn1-FRE,[0087]其中,[0088]當η=I時,[0089]FL1為SEQIDNO:2的編碼序列的jji至969位,但當1=9704時,該FL1為空序列,[0090]其他情況下:[0091]FLn為SEQIDNO:1的編碼序列的jn+i至96位,但當jn=97_i時,該FLn為空序列,[0092]FRn為SEQIDNO:1的編碼序列的I至jn+1_l位,但當jn+1=l時,該FRn為空序列,[0093]FMnSSEQIDNO:1的編碼序列,[0094]FRE為SEQIDNO:3的編碼序列的I至jm+1_l位,但當jm+1=l時,該FRE為空序列,[0095]其中Yn、YLn,YRn彼此獨立地為堿基Α、C、T或G的TALE識別序列的編碼序列。[0096]其中所述表達載體包含下述結構:[0097]PN-L1-R2-M-R1-Lmtl-PC-NE,[0098]R1和R2的定義如上所述;[0099]PN為SEQIDNO:2的編碼序列的I至位,但當J1=I時,該PN為空序列;[0100]PC為SEQIDNO:3的編碼序列的jm+1+i至729位,但當jm+1=730-1時,該PC為空序列;[0101]NE為核酸內切酶的編碼序列;[0102]M為選擇性標記。[0103]3.一種試劑盒,所述試劑盒包括20(m-Ι)種核苷酸序列,且任選地包括表達載體,其中m為7、8、9、10、11、12、13或14,[0104]所述20(m-Ι)種核苷酸序列分為m組,[0105]其中第η組核苷酸序列包含下述共同結構:[0106]R1-Ln-Xn-Lntl-R2,[0107]其中η選自I至m的自然數;[0108]R1和R2分別為IIS型限制性內切酶識別序列及其反向互補序列;[0109]Ln和Ln+1為i個核苷酸的接頭序列,i為該IIS型選擇性內切酶酶切產生的粘性末端的長度;[0110]其中,[0111]L1為SEQIDNO:2的編碼序列的J1至j'+1-l位;[0112]Lm+1為SEQIDNO:3的編碼序列的jm+1至jm+1+1-l位;[0113]Lk為SEQIDNO:1的編碼序列的jk至jk+i_l位,k是2至m的自然數;[0114]其中J1選自I至970-1;[0115]jm+1選自I至730-1;[0116]當k為2至m時,jk選自I至97-1,[0117]且L1至Llrt彼此各不相同;[0118]對于第I組,XnSYD1,[0119]YD1為FL1-YLrFMrYR1-FR1,[0120]FL1為SEQIDNO:2的編碼序列的jji至969位,但當1=9704時,該FL1為空序列,[0121]FR1為SEQIDNO:1的編碼序列的I至j2_l位,但當J2=I時,該FRn為空序列,[0122]FM1為SEQIDNO:1的編碼序列,[0123]第I組共包括16個序列,在這16個序列中,YL1和YR1分別為堿基A、C、T或G的TALE識別序列的編碼序列的不同組合;[0124]對于第[0125]YE為FLn1-Yn1-FRE,[0126]其中,[0127]FLm為SEQIDNO:1的編碼序列的jm+i至96位,但當jm=97_i時,該FLm為空序列,[0128]FRE為SEQIDNO:3的編碼序列的I至jm+1_l位,但當jm+1=l時,該FRE為空序列,[0129]第m組共包括4個序列,在這4個序列中,Yn分別為堿基A、C、T或G的TALE識別序列的編碼序列;[0130]對于第2至m-Ι組,Xn選自YDn或YSn,[0131]其中YDn為FLn-YLn-FMn-YRn-FRn,[0132]YS1^FLn-Yn-FRn,[0133]其中,[0134]FLn為SEQIDNO:1的編碼序列的jn+i至96位,但當jn=97_i時,該FLn為空序列,[0135]FRn為SEQIDNO:1的編碼序列的I至jn+1_l位,但當jn+1=l時,該FRn為空序列,[0136]FMnSSEQIDNO:1的編碼序列,[0137]對于第2至m-Ι組,每組共包括20個序列,在其中16個序列中,Xn為YDn,且YLn和YRn分別為堿基A、C、T或G的TALE識別序列的編碼序列的不同組合,在剩下4個序列中,Xn為YSn,且Yn分別為堿基A、C、T或G的TALE識別序列的編碼序列;[0138]其中所述表達載體包含下述結構:[0139]PN-L1-R2-M-R1-Ln^1-PC-NE,[0140]R1和R2的定義如上所述;[0141]PN為SEQIDNO:2的編碼序列的I至位,但當J1=I時,該PN為空序列;[0142]PC為SEQIDNO:3的編碼序列的jm+1+i至729位,但當jm+1=730-1時,該PC為空序列;[0143]NE為核酸內切酶的編碼序列;[0144]M為選擇性標記。[0145]4.一種組裝DNA結合結構域元件的方法,其中所述DNA序列由不多于20個堿基組成:[0146](I)根據目標DNA序列,將DNA序列按5’到3’端分為m個堿基組,第一個堿基組由2個堿基組成,第m個堿基組由I個堿基組成,其他各組由I個或2個堿基組成,其中m為7、8、9、10、11、12、13或14;[0147](2)根據所述m個堿基組的堿基序列,設計m個對應的核苷酸序列,和表達載體;[0148]其中第η種核苷酸序列包含下述結構:[0149]R1-Ln-Xn-Lntl-R2,[0150]其中η是I至m的自然數;[0151]R1和R2分別為IIS型限制性內切酶識別序列及其反向互補序列;[0152]Ln和Ln+1為i個核苷酸的接頭序列,i為該IIS型選擇性內切酶酶切產生的粘性末端的長度;[0153]其中,[0154]L1為SEQIDNO:2的編碼序列的J1至位;[0155]Lm+1為SEQIDNO:3的編碼序列的jm+1至jm+1+1-l位;[0156]Lk為SEQIDNO:1的編碼序列的jk至jk+i_l位,k是2至m的自然數;[0157]其中J1選自I至970-1;[0158]jm+1選自I至730-1;[0159]當k為2至m時,jk選自I至97-1,[0160]且L1至Llrt彼此各不相同;[0161]對于第I個堿基組,Xn為YD1,[0162]對于第m個堿基組,Xn為YE,[0163]對于第2至m-Ι個堿基組,當該堿基組由一個堿基組成時,Xn為YSn,而當該堿基組由兩個堿基組成時,Xn為YDn,[0164]其中YDn為FLn-YLn-FMn-YRn-FRn,[0165]YSnSFLn-Yn-FRn,[0166]YE為FLn1-Yn1-FRE,[0167]其中,[0168]當n=l時,[0169]FL1為SEQIDNO:2的編碼序列的J1+!至969位,但當1=9704時,該FL1為空序列,[0170]其他情況下:[0171]FLnSSEQIDNO:1的編碼序列的jn+i至96位,但當jn=97_i時,該FLn為空序列,[0172]FRn為SEQIDNO:1的編碼序列的I至jn+1_l位,但當jn+1=l時,該FRn為空序列,[0173]FMnSSEQIDNO:1的編碼序列,[0174]FRE為SEQIDNO:3的編碼序列的I至jm+1_l位,但當jm+1=l時,該FRE為空序列,[0175]其中Yn、YLn,YRn彼此獨立地為堿基Α、C、T或G的TALE識別序列的編碼序列。[0176]當該堿基組由一個堿基組成時,Yn為該堿基的TALE識別序列的編碼序列,而當該堿基組由兩個堿基組成時,YLn和YRn分別為所述堿基組中第一個和第二個YDn堿基的TALE識別序列的編碼序列;[0177]其中所述表達載體包含下述結構:[0178]PN-L1-R2-M-R1-Lmtl-PC-NE,[0179]R1和R2的定義如上所述;[0180]PN為SEQIDNO:2的編碼序列的I至位,但當J1=I時,該PN為空序列;[0181]PC為SEQIDNO:3的編碼序列的jm+1+i至729位,但當jm+1=730_i時,該PC為空序列;[0182]NE為核酸內切酶的編碼序列;[0183]M為選擇性標記;[0184]任選地,所述m種核苷酸序列并非設計的,而是直接從如本發明第三個方面所述的20(m-l)個核苷酸中選取的;[0185](3)將所述m種核苷酸序列,所述表達載體,與R1和R2對應的限制性內切酶IIS,和DNA連接酶混合;[0186](4)將(3)中的混合物用所述IIS型限制性內切酶酶切,并用DNA連接酶連接,獲得包含組裝的DNA結合結構域元件的表達載體;[0187]任選地,本發明的該方面還包括回收所述包含組裝的DNA結合結構域元件的表達載體的方法,所述方法進一步包括下述步驟:[0188](5)用(4)的反應產物轉化、轉導或轉染宿主細胞,并針對選擇性標記M篩選包含表達載體的宿主細胞;[0189](6)在適于表達載體增殖的條件下,培養經篩選的宿主細胞,和[0190](7)從培養的宿主細胞回收經增殖的表達載體。[0191]5.段落1-4任一項的核苷酸序列、試劑盒或方法,其中所述SEQIDNO:1的編碼序列為:[0192]GGNGGNAARCARGCNYTNGARACNGTNCARMGNYTNYTNCCNGTNYTNTGYCARGAYCAYGGNYTNACNCCNGAYCARGTNGTNGCNATHGCNWSN(SEQIDNO:5);和/或[0193]所述SEQIDNO:2的編碼序列為:[0194]ATGGCNWSNWSNCCNCCNAARAARAARMGNAARGTNWSNTGGAARGAYGCNWSNGGNTGGWSNMGNATGCAYGCNGAYCCNATHMGNCCNMGNMGNCCNWSNCCNGCNMGNGARYTNYTNCCNGGNCCNCARCCNGAYMGNGTNCARCCNACNGCNGAYMGNGGNGTNWSNGCNCCNGCNGGNWSNCCNYTNGAYGGNYTNCCNGCNMGNMGNACNGTNWSNMGNACNMGNYTNCCNWSNCCNCCNGCNCCNWSNCCNGCNTTYWSNGCNGGNWSNTTYWSNGAYYTNYTNMGNCCNTTYGAYCCNWSNYTNYTNGAYACNWSNYTNYTNGAYWSNATGCCNGCNGTNGGNACNCCNCAYACNGCNGCNGCNCCNGCNGARTGGGAYGARGCNCARWSNGCNYTNMGNGCNGCNGAYGAYCCNCCNCCNACNGTNMGNGTNGCNGTNACNGCNGCNMGNCCNCCNMGNGCNAARCCNGCNCCNMGNMGNMGNGCNGCNCARCCNWSNGAYGCNWSNCCNGCNGCNCARGTNGAYYTNMGNACNYTNGGNTAYWSNCARCARCARCARGARAARATHAARCCNAARGTNMGNWSNACNGTNGCNCARCAYCAYGARGCNYTNGTNGGNCAYGGNTTYACNCAYGCNCAYATHGTNGCNYTNWSNCARCAYCCNGCNGCNYTNGGNACNGTNGCNGTNACNTAYCARCAYATHATHACNGCNYTNCCNGARGCNACNCAYGARGAYATHGTNGGNGTNGGNAARCARTGGWSNGGNGCNMGNGCNYTNGARGCNYTNYTNACNGAYGCNGGNGARYTNMGNGGNCCNCCNYTNCARYTNGAYACNGGNCARYTNGTNAARATHGCNAARMGNGGNGGNGTNACNGCNATGGARGCNGTNCAYGCNWSNMGNAAYGCNYTNACNGGNGCNCCNYTNAAYYTNACNCCNGAYCARGTNGTNGCNATHGCNWSN(SEQIDNO:6);和/或[0195]所述SEQIDN0:3的編碼序列為:[0196]GGNGGNAARCARGCNYTNGARWSNATHGTNGCNCARYTNWSNMGNCCNGAYCCNGCNYTNGCNGCNYTNACNAAYGAYCAYYTNGTNGCNYTNGCNTGYYTNGGNGGNMGNCCNGCNATGGAYGCNGTNAARAARGGNYTNCCNCAYGCNCCNGARYTNATHMGNMGNGTNAAYMGNMGNATHGGNGARMGNACNWSNCAYMGNGTNGCNGAYTAYGCNCARGTNGTNMGNGTNYTNGARTTYTTYCARTGYCAYWSNCAYCCNGCNTAYGCNTTYGAYGARGCNATGACNCARTTYGGNATGWSNMGNAAYGGNYTNGTNCARYTNTTYMGNMGNGTNGGNGTNACNGARYTNGARGCNMGNGGNGGNACNYTNCCNCCNGCNWSNCARMGNTGGGAYMGNATHYTNCARGCNWSNGGNATGAARMGNGCNAARCCNWSNCCNACNWSNGCNCARACNCCNGAYCARGCNWSNYTNCAYGCNTTYGCNGAYWSNYTNGARMGNGAYYTNGAYGCNCCNWSNCCNATGCAYGARGGNGAYCARACNMGNGCNWSNWSNMGNAARMGNWSNMGNWSNGAYMGNGCNGTNACNGGNCCNWSNGCNCARCARGCNGTNGARGTNMGNGTNCCNGARCARMGNGAYGCNYTNCAYYTNCCNYTNWSNTGGMGNGTNAARMGNCCNMGNACNMGNATHTGGGGNGGNYTNCCNGAYCCNATHWSNMGNWSNCAR(SEQIDNO:7)。[0197]6.段落1-5任一項的核苷酸序列、試劑盒或方法,其中m為8至12的自然數,優選m為9至11的自然數,更優選m是10。[0198]7.段落1-6任一項的核苷酸序列、試劑盒或方法,其中所述核苷酸序列是載體,優選適于在宿主細胞中復制的載體,更優選可在宿主細胞中大量復制的載體。[0199]8.段落1-7任一項的核苷酸序列、試劑盒或方法,其中所述載體是質粒,優選地,所述質粒是多拷貝質粒。[0200]9.段落1-8任一項的核苷酸序列、試劑盒或方法,其中所述宿主是真核宿主。[0201]10.段落1-9任一項的核苷酸序列、試劑盒或方法,其中所述宿主是原核宿主,優選大腸桿菌。[0202]11.段落1-10任一項的核苷酸序列、試劑盒或方法,其中所述載體是病毒載體。[0203]12.段落1-11任一項的核苷酸序列、試劑盒或方法,其中i為3、4或5,優選i為4。[0204]13.段落1-12任一項的核苷酸序列、試劑盒或方法,其中所述IIS型限制性內切酶是BsmBI,R1是BsmBI識別序列CGTCTCN,而R2是BsmBI識別序列的反向互補序列NGAGACG,和i=4。[0205]14.段落1-13任一項的核苷酸序列、試劑盒或方法,其中[0206]J1為I至970-1的自然數;和/或[0207]jm+1為I至730-1的自然數;和/或[0208]當k為2至m時,jk為I至97-1的自然數。[0209]15.段落1-14任一項的核苷酸序列、試劑盒或方法,其中當k為2至m時,jk選自a至b的自然數,其中a和b均選自I至97_i的自然數,且a<b。[0210]16.段落1-15任一項的核苷酸序列、試劑盒或方法,其中當k為2至m時,jk為57至86的自然數。[0211]17.段落1-16任一項的核苷酸序列、試劑盒或方法,其中FMn為:[0212]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGC,或[0213]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGC,[0214]18.段落1-17任一項的核苷酸序列、試劑盒或方法,其中J1選自a至b的自然數,其中a和b均選自I至970-1的自然數,且a<b,優選地,J1選自891至967,更優選J1選自901至961,更優選J1選自911至951,更優選J1選自921至941,更優選J1為931。[0215]19.段落1-18任一項的核苷酸序列、試劑盒或方法,其中FL1為:[0216]ACCTGACCCCGGACCAAGTGGTGGCTATCGCCAGC。[0217]20.段落1-19任一項的核苷酸序列、試劑盒或方法,其中當k為2至m時,FLk為:[0218]GGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGC,[0219]GCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGC,[0220]CCTGACCCCGGACCAAGTGGTGGCTATCGCCAGC,[0221]CTGACCCCGGACCAAGTGGTGGCTATCGCCAGC,[0222]TGACCCCGGACCAAGTGGTGGCTATCGCCAGC,[0223]GACTCCGGACCAAGTGGTGGCTATCGCCAGC,[0224]ACCCCGGACCAAGTGGTGGCTATCGCCAGC,[0225]CGGACCAAGTGGTGGCTATCGCCAGC,或[0226]CGCCAGC。[0227]21.段落1-20任一項的核苷酸序列、試劑盒或方法,其中FRn為:[0228]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGA,[0229]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGAC,[0230]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACC,[0231]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCA,[0232]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCAT,[0233]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATG,[0234]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGG,[0235]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTG,或[0236]GGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGG。[0237]22.段落1-21任一項的核苷酸序列、試劑盒或方法,其中jm+1選自a至b的自然數,其中a和b均選自I至730-1的自然數,且a≤b,優選地,jm+1選自I至727,更優選jm+i選自3至143,更優選jm+1選自13至133,更優選jm+1選自23至123,更優選jm+1選自33至113,更優選jm+1選自43至103,更優選jm+1選自53至93,更優選jm+1選自63至83,更優選jm+i為73。[0238]23.段落1-22任一項的核苷酸序列、試劑盒或方法,其中FRE為:[0239]GGCGGCAAGCAAGCGCTCGAAAGCATTGTGGCCCAGCTGAGCCGGCCTGATCCGGCGTTGGCCGCGTTGACC。[0240]24.段落1-23任一項的核苷酸序列、試劑盒或方法,[0241]其中L1為CTGA;和/或[0242]Lm+1為AACG;和/或[0243]Lk選自[0244]CTGA,[0245]CCAT,[0246]CATG,[0247]ATGG,[0248]TGGC,[0249]GGCC,[0250]GCCT,[0251]CCTG,[0252]ACCCdP[0253]CTAT;[0254]其中k為2至m。[0255]25.段落1-24任一項的核苷酸序列、試劑盒或方法,其中所述NE為FokI的編碼序列,優選地,所述NE為SEQIDNO:4的編碼序列,更優選地,所述NE為SEQIDNO:8。[0256]26.段落1-25任一項的核苷酸序列、試劑盒或方法,其中所述選擇性標記M為LbcZ0[0257]27.段落1-26任一項的核苷酸序列、試劑盒或方法,其中所述突光蛋白是GFP或RFP。[0258]28.段落1-27任一項的核苷酸序列、試劑盒或方法,其中所述表達載體為pCMV-TALEN、pCMV-TALEN-GFP或pCMV-TALEN-RFP。[0259]29.段落3的試劑盒,包括下述180個DNA序列:[0260](I)144個包含“雙堿基重復單元表達元件”的DNA序列,所述“雙堿基重復單元表達元件”的序列如SEQIDNO:11~154所示;[0261](2)32個包含“單堿基重復單元表達元件”的DNA序列,所述“單堿基重復單元表達元件”的序列如SEQIDNO:155~186所示;[0262](3)4個包含“末位單堿基重復單元表達元件”的DNA序列,所述“末位單堿基重復單元表達元件”的序列如SEQIDNO:187~190所示;[0263]任選地,所述試劑盒還包括[0264](4)已構建的哺乳動物真核表達載體,其可為pCMV-TALEN。[0265]30.段落29的試劑盒,包括下述180個環狀質粒:[0266](1)144個“雙堿基重復單元表達元件質粒”,每個質粒由一個“雙堿基重復單元表達元件”和該元件兩翼的5’和3’側翼質粒骨架序列組成,命名為pXX-n,XX為A、C、T、G的所有16種兩兩組合,η為1-9,其中所述雙堿基重復單元表達元件”的序列如SEQIDNO:11~154所示;[0267](2)32個“單堿基重復單元表達元件質粒”,每個質粒由一個“單堿基重復單元表達元件”和該元件兩翼的5’和3’側翼質粒骨架序列組成,命名為ρΧ_η,Χ為A、T、C或G,n為2-9,其中所述“單堿基重復單元表達元件”的序列如SEQIDNO:155~186所示;[0268](3)4個“末位單堿基重復單元表達元件質粒”,每個質粒由一個“末位單堿基重復單元表達元件”和該元件兩翼的5’和3’側翼質粒骨架序列組成,分別是pC-L、pG-L、pA-L和pT-L,其中所述“末位單堿基重復單元表達元件”的序列如SEQIDNO:187~190所示;[0269]其中,所述5,和3,側翼質粒骨架序列分別為SEQIDNO:9和10;[0270]任選地,所述試劑盒還包括[0271](4)已構建的哺乳動物真核表達載體,其可為pCMV-TALEN。[0272]31.SEQIDNO:1-193的氨基酸序列或核苷酸序列。【專利附圖】【附圖說明】[0273]圖1:TALEN蛋白用于基因組定點修飾的原理示意圖。[0274]圖2順序克隆”策略構建TALEN蛋白表達載體示意圖。[0275]圖3:本發明方法中構建TALEN蛋白表達載體示意圖。多片段DNA定向連接克隆的示意圖。示意圖中演示在一個反應體系中按照正確的順序組裝10個DNA片段。這種連接策略使用IIS型限制性內切酶(本發明中使用BsmBI),其特點在于DNA識別序列和切割序列不重疊。預先在所有10個DNA片段中精準設計相同的BsmBI的DNA識別序列和不同的DNA切割序列。經過BsmBI切割后,所有的DNA片段都會產生4堿基長的粘末端。只有具有反向互補序列粘末端的DNA片段,在連接酶作用下,實現兩個DNA片段的定向連接。同理,通過在需要連接的多個DNA片段兩側精準設計好酶切序列,待IIS型限制性內切酶作用后,可以獲得含有不同序列的4堿基長的粘末端,便可以實現多片段DNA的定向組裝。[0276]圖4:本發明中包含重復單元表達元件的載體質粒結構示意圖。[0277]圖5:哺乳動物表達載體pCMV-TALEN結構示意圖。【具體實施方式】[0278]定義[0279]核苷酸序列和氨基酸序列[0280]在本文中,除非另行指明,核苷酸序列從左向由為5’至3’方向,氨基酸序列從左向右為氨基至羧基方向。[0281]TALE重復單元和TALE識別序列[0282]在本文中,所謂“TALE重復單元”是指TALE蛋白中DNA結合結構域中的重復單元,所述重復單元通常由34個氨基酸組成,其氨基酸序列為LTPEQVVAIASZiZ2GGKQALETVQRLLPVLCQAHG,其中,Z1Z2代表兩個氨基酸殘基,稱作RVDOtepeatVariableDiresidue)。RVD的選擇決定了該TALE重復單元所識別的DNA堿基:[0283]當RVD為HD時,該TALE重復單元識別堿基C;[0284]當RVD為NI時,該TALE重復單元識別堿基A;[0285]當RVD為NG時,該TALE重復單元識別堿基T;[0286]當RVD為NN時,該TALE重復單元識別堿基G。[0287]在上述情況下,識別特定堿基的RVD序列即稱為該堿基的TALE識別序列。[0288]IIS型限制性內切酶[0289]限制性內切酶是存在于許多物種中,能夠在識別位點序列特異性結合DNA,并且在結合位點處或接近結合位點處切割DNA。IIS型限制性內切酶(或簡稱IIS型酶)是一類在與識別位點不同的位點切割DNA的限制性內切酶。舉例而言,BsaI催化DNA的雙鏈切割,其識別位點為,而在一條鏈距離其識別位點I個核苷酸處,而在另一條鏈距離其識別位點5個核苷酸處切割DNA雙鏈。[0290]本發明中可使用的IIS型限制性內切酶包括但不限于表1中所列出的這些:[0291]表1:本發明可用的IIS型限制性內切酶[0292]【權利要求】1.一種核苷酸序列,所述核苷酸序列包含下述結構:Ri_Ln_Xn-Ln+1-R2,其中η選自I至m的自然數,m為7、8、9、10、11、12、13或14;R1和R2分別為IIS型限制性內切酶識別序列及其反向互補序列;Ln和Ln+1為i個核苷酸的接頭序列,i為該IIS型選擇性內切酶酶切產生的粘性末端的長度;其中,L1為SEQIDNO:2的編碼序列的J1至i+1-1位;Lm+1為SEQIDNO:3的編碼序列的jm+1至jm+1+i_l位;Lk為SEQIDNO:1的編碼序列的jk至jk+i_l位,k是2至m的自然數;其中J1選自1至970-1;jm+1選自1至730-1;當k為2至m時,jk選自I至97-1,且L1至Lm+1彼此各不相同;當n=l時,XnSYD1,當n=m時,Xn為YE,當η為2至m-Ι時,Xn選自YDn或YSn,其中YDn為FLn-YLn-FMn-YRn-FRn,YSn為FLn-Yn-FRn,YE為FLm-Ym-FRE,其中,當n=l時,FL1為SEQIDNO:2的編碼序列的J1+!至969位,但當1=9704時,該FL1為空序列,其他情況下:FLn為SEQIDNO:1的編碼序列的jn+i至96位,但當jn=97_i時,該FLn為空序列,FRn為SEQIDNO:1的編碼序列的I至jn+1_l位,但當jn+1=l時,該FRn為空序列,FMnSSEQIDNO:1的編碼序列,FRE為SEQIDNO:3的編碼序列的I至jm+1_l位,但當jm+1=l時,該FRn為空序列,其中Yn、YLn,YRn彼此獨立地為堿基Α、C、T或G的TALE識別序列的編碼序列。2.一種試劑盒,所述試劑盒包括m種核苷酸序列,且任選地包括表達載體,其中m為7、.8、9、10、11、12、13或14,其中第η種核苷酸序列包含下述結構:Ri_Ln_Xn-Ln+1-R2,其中η選自I至m的自然數;R1和R2分別為IIS型限制性內切酶識別序列及其反向互補序列;Ln和Ln+1為i個核苷酸的接頭序列,i為該IIS型選擇性內切酶酶切產生的粘性末端的長度;其中,L1為SEQIDNO:2的編碼序列的J1至i+1-1位;Lm+1為SEQIDNO:3的編碼序列的jm+1至jm+1+i_l位;Lk為SEQIDNO:1的編碼序列的jk至jk+i_l位,k是2至m的自然數;其中J1選自1至970-1;jm+1選自1至730-1;當k為2至m時,jk選自I至97-1,且L1至Lm+1彼此各不相同;當n=l時,XnSYD1,當n=m時,Xn為YE,當η為2至m-Ι時,Xn選自YDn或YSn,其中YDn為FLn-YLn-FMn-YRn-FRn,YSn為FLn-Yn-FRn,YE為FLm-Ym-FRE,其中,當n=l時,FL1為SEQIDNO:2的編碼序列的J1+!至969位,但當1=9704時,該FL1為空序列,其他情況下:FLn為SEQIDNO:1的編碼序列的jn+i至96位,但當jn=97_i時,該FLn為空序列,FRn為SEQIDNO:1的編碼序列的I至jn+1_l位,但當jn+1=l時,該FRn為空序列,FMnSSEQIDNO:1的編碼序列,FRE為SEQIDNO:3的編碼序列的I至jm+1_l位,但當jm+1=l時,該FRE為空序列,其中Yn、YLn,YRn彼此獨立地為堿基Α、C、T或G的TALE識別序列的編碼序列。其中所述表達載體包含下述結構:PN-L1-R2-M-R1-Llrt-PC-NE,R1和R2的定義如上所述;PN為SEQIDNO:2的編碼序列的I至位,但當J1=I時,該PN為空序列;PC為SEQIDNO:3的編碼序列的jm+1+i至729位,但當jm+1=730-1時,該PC為空序列;NE為核酸內切酶的編碼序列;M為選擇性標記。3.一種試劑盒,所述試劑盒包括20(m-Ι)種核苷酸序列,且任選地包括表達載體,其中m為7、8、9、10、11、12、13或14,所述20(m-Ι)種核苷酸序列分為m組,其中第η組核苷酸序列包含下述共同結構:Ri_Ln_Xn-Ln+1-R2,其中η選自I至m的自然數;R1和R2分別為IIS型限制性內切酶識別序列及其反向互補序列;Ln和Ln+1為i個核苷酸的接頭序列,i為該IIS型選擇性內切酶酶切產生的粘性末端的長度;其中,L1為SEQIDNO:2的編碼序列的J1至i+1-1位;Lm+1為SEQIDNO:3的編碼序列的jm+1至jm+1+i_l位;Lk為SEQIDNO:1的編碼序列的jk至jk+i_l位,k是2至m的自然數;其中J1選自I至970-1;jm+1選自I至730-1;當k為2至m時,jk選自I至97-1,且L1至Lm+1彼此各不相同;對于第I組,XnSYD1,YD1為FL1-YL1-FM1-YR1-FR1,FL1為SEQIDNO:2的編碼序列的J1+!至969位,但當1=9704時,該FL1為空序列,FR1為SEQIDNO:1的編碼序列的I至j2_l位,但當j2=l時,該FRn為空序列,FM1為SEQIDNO:1的編碼序列,第I組共包括16個序列,在這16個序列中,YL1和YR1分別為堿基A、C、T或G的TALE識別序列的編碼序列的不同組合;對于第m組,Xn為YE,YE為FLm-Ym-FRE,其中,FLm為SEQIDNO:1的編碼序列的jm+i至96位,但當jm=97-1時,該FLm為空序列,FRE為SEQIDNO:3的編碼序列的I至jm+1_l位,但當jm+1=l時,該FRE為空序列,第m組共包括4個序列,在這4個序列中,Yn分別為堿基A、C、T或G的TALE識別序列的編碼序列;對于第2至m-Ι組,Xn選自YDn或YSn,其中YDn為FLn-YLn-FMn-YRn-FRn,YSn為FLn-Yn-FRn,其中,FLn為SEQIDNO:1的編碼序列的jn+i至96位,但當jn=97_i時,該FLn為空序列,FRn為SEQIDNO:1的編碼序列的I至jn+1_l位,但當jn+1=l時,該FRn為空序列,FMnSSEQIDNO:1的編碼序列,對于第2至m-Ι組,每組共包括20個序列,在其中16個序列中,Xn為YDn,且YLn和YRn分別為堿基A、C、T或G的TALE識別序列的編碼序列的不同組合,在剩下4個序列中,Xn為YSn,且Yn分別為堿基A、C、T或G的TALE識別序列的編碼序列;其中所述表達載體包含下述結構:PN-L1-R2-M-R1-Llrt-PC-NE,R1和R2的定義如上所述;PN為SEQIDNO:2的編碼序列的I至位,但當J1=I時,該PN為空序列;PC為SEQIDNO:3的編碼序列的jm+1+i至729位,但當jm+1=730-1時,該PC為空序列;NE為核酸內切酶的編碼序列;M為選擇性標記。4.一種組裝DNA結合結構域元件的方法,其中所述DNA序列由不多于20個堿基組成:(I)根據目標DNA序列,將DNA序列按5’到3’端分為m個堿基組,第一個堿基組由2個堿基組成,第m個堿基組由I個堿基組成,其他各組由1個或2個堿基組成,其中m為7、.8、9、10、11、12、13或14;(2)根據所述m個堿基組的堿基序列,設計m個對應的核苷酸序列,和表達載體;其中第η種核苷酸序列包含下述結構:R1-Ln_Xn-Ln+1-R2,其中n是1至m的自然數;R1和R2分別為IIS型限制性內切酶識別序列及其反向互補序列;Ln和Ln+1為i個核苷酸的接頭序列,i為該IIS型選擇性內切酶酶切產生的粘性末端的長度;其中,L1為SEQIDNO:2的編碼序列的J1至i+1-1位;Lm+1為SEQIDNO:3的編碼序列的jm+1至jm+1+i_l位;Lk為SEQIDNO:1的編碼序列的jk至jk+i_l位,k是2至m的自然數;其中J1選自1至970-1;jm+1選自1至730-1;當k為2至m時,jk選自I至97-1,且L1至Lm+1彼此各不相同;對于第1個堿基組,XnSYD1,對于第m個堿基組,XnSYE,對于第2至m-1個堿基組,當該堿基組由一個堿基組成時,XnSYSn,而當該堿基組由兩個堿基組成時,Xn為YDn,其中YDn為FLn-YLn-FMn-YRn-FRn,YSn為FLn-Yn-FRn,YE為FLm-Ym-FRE,其中,當n=l時,FL1為SEQIDNO:2的編碼序列的J1+!至969位,但當1=9704時,該FL1為空序列,其他情況下:FLn為SEQIDNO:1的編碼序列的jn+i至96位,但當jn=97_i時,該FLn為空序列,FRn為SEQIDNO:1的編碼序列的I至jn+1_l位,但當jn+1=l時,該FRn為空序列,FMnSSEQIDNO:1的編碼序列,FRE為SEQIDNO:3的編碼序列的I至jm+1_l位,但當jm+1=l時,該FRE為空序列,其中Yn、YLn,YRn彼此獨立地為堿基Α、C、T或G的TALE識別序列的編碼序列。當該堿基組由一個堿基組成時,Yn為該堿基的TALE識別序列的編碼序列,而當該堿基組由兩個堿基組成時,YL1^PYRn分別為所述堿基組中第一個和第二個YDn堿基的TALE識別序列的編碼序列;其中所述表達載體包含下述結構:PN-L1-R2-M-R1-Llrt-PC-NE,R1和R2的定義如上所述;PN為SEQIDNO:2的編碼序列的I至位,但當J1=I時,該PN為空序列;PC為SEQIDNO:3的編碼序列的jm+1+i至729位,但當jm+1=730-1時,該PC為空序列;NE為核酸內切酶的編碼序列;M為選擇性標記;任選地,所述m種核苷酸序列并非設計的,而是直接從如本發明第三個方面所述的.20(m-1)個核苷酸中選取的;(3)將所述m種核苷酸序列,所述表達載體,與R1和R2對應的限制性內切酶HS,和DNA連接酶混合;(4)將(3)中的混合物用所述IIS型限制性內切酶酶切,并用DNA連接酶連接,獲得包含組裝的DNA結合結構域元件的表達載體;任選地,本發明的該方面還包括回收所述包含組裝的DNA結合結構域元件的表達載體的方法,所述方法進一步包括下述步驟:(5)用(4)的反應產物轉化、轉導或轉染宿主細胞,并針對選擇性標記M篩選包含表達載體的宿主細胞;(6)在適于表達載體增殖的條件下,培養經篩選的宿主細胞,和(7)從培養的宿主細胞回收經增殖的表達載體。5.權利要求1-4任一項的核苷酸序列、試劑盒或方法,其中所述SEQIDNO:l的編碼序列為:6.權利要求1-5任一項的核苷酸序列、試劑盒或方法,其中m為8至12的自然數,優選m為9至11的自然數,更優選m是10。7.權利要求1-6任一項的核苷酸序列、試劑盒或方法,其中所述核苷酸序列是載體,優選適于在宿主細胞中復制的載體,更優選可在宿主細胞中大量復制的載體。8.權利要求1-7任一項的核苷酸序列、試劑盒或方法,其中所述載體是質粒,優選地,所述質粒是多拷貝質粒。9.權利要求1-8任一項的核苷酸序列、試劑盒或方法,其中所述宿主是真核宿主。10.權利要求1-9任一項的核苷酸序列、試劑盒或方法,其中所述宿主是原核宿主,優選大腸桿菌。【文檔編號】C12N15/11GK103898099SQ201210572536【公開日】2014年7月2日申請日期:2012年12月25日優先權日:2012年12月25日【發明者】袁晶,王惠申請人:袁晶,王惠