專利名稱:一種基因合成方法、基因芯片及試劑盒的制作方法
技術領域:
本發明涉及生物技術領域,特別涉及基因芯片領域,具體公開了一種高通量、高保真、基因合成方法、基因芯片及試劑盒。
背景技術:
合成生物學的一個關鍵技術問題是低成本、高通量的基因合成和蛋白質表達的精確調控。目前,人工合成基因的主要方法是將短鏈的寡核苷酸進行拼接和組裝得到長鏈的 DNA。使用化學方法人工合成短鏈寡核苷酸的方法成本高,每核苷酸約需人民幣0.6元,且合成錯誤率高,100個堿基中出現一個堿基缺失,400個堿基中約有一個堿基錯配和插入。 因此,利用寡核苷酸組裝來合成基因或基因組的成本十分昂貴,且合成累積的錯誤率很高。 通過克隆測序和突變的方法來修復錯誤會進一步增加工作量和總成本。在微流芯片上進行大規模平行合成寡核苷酸合成可以顯著的降低成本。目前, 在芯片上合成寡核苷酸的方法主要包括噴墨打印(Agilent公司)、5’端修飾光敏保護基團(Nimblegen/Affmetrix公司),光照生成酸脫保護(Atactic/Xeotron)和電化學方法 (Oxamer/Combimatrix公司)。但是,由于微流芯片的表面積非常小,寡核苷酸合成產量低, 溶液中每種序列的寡核苷酸濃度為10_12摩爾或更低,因此,在組裝成基因之前還需進行大量擴增。目前可行的方法是通過化學或酶解處理將合成出的寡核苷酸從微流芯片上釋放下來,經PCR擴增、限制性酶消化和純化后,得到的寡核苷酸用來組裝成基因或基因組,而合成基因的錯誤修復方法主要采用聚丙烯酰胺凝膠電泳、高效液相色譜分離。因此,目前基因合成和錯誤修復的步驟依然繁瑣,迫切需要提高其集成化、微型化程度,顯著降低成本,并提高合成和錯誤修復效率。
發明內容
本發明旨在提供一種高通量、高保真、低成本的基因合成方法,將擴增寡核苷酸庫和平行組裝基因步驟整合到一塊微流芯片上同時進行;采用錯配特異性內切酶建立高效的基因合成錯誤修復體系,使合成錯誤率由每千堿基對0Λ)約1. 9個錯誤堿基降至低于0. 19 個錯誤堿基,成本為目前報道最低成本的十分之一。本發明提供的一種基因合成方法,在一張基因芯片上采用恒溫刻痕和鏈位移擴增及聚合酶拼接反應進行寡核苷酸擴增以及基因組裝,所述基因芯片通過將寡核苷酸固定在固相載體表面形成,寡核苷酸的3’端具有長度為15-150個堿基的接頭序列且通過該接頭序列中的刻痕內切酶識別位點錨定在芯片表面。優選地,所合成基因的長度大于或等于200個堿基對。優選地,還包含并采用錯配特異性內切酶進行基因合成錯誤修復步驟。優選地,寡核苷酸擴增以及組裝、基因合成錯誤修復三種反應在同一體系中先后連續進行或分步進行。優選地,基因合成錯誤修復反應在芯片上或芯片外單獨進行。
優選地,所述基因芯片可以劃分成一個或多個區域,寡核苷酸擴增以及基因組裝在一個或多個區域同時進行。優選地,所述恒溫刻痕和鏈位移擴增及聚合酶拼接反應是采用一條通用引物與寡核苷酸3’端的接頭雜交,在鏈移位聚合酶延伸并位移寡核苷酸鏈的同時,刻痕內切酶將通用引物從剛剛擴增出的寡核苷酸鏈上裂解下來,使通用引物的3’端重新游離,繼續開始新的延伸反應。優選地,所述基因合成錯誤修復步驟為通過熱變性,讓合成的基因重新退火,使錯配位點暴露,錯配位點被錯配特異性核酸內切酶和3’ 一 5’核酸外切酶活性識別并切除, 所得的基因片段經交疊延伸PCR反應組裝成完整基因。本發明的另一個目的是提供一種基因芯片,所述基因芯片通過將寡核苷酸探針固定在固相載體表面形成,寡核苷酸的3’端具有長度為15-150個堿基的接頭序列且通過該接頭序列中的刻痕內切酶識別位點錨定在芯片表面。優選地,所述基因芯片采用物理區隔的辦法,將微陣列分為子陣列,每一個子陣列中包含合成大于0. 2kb總長的寡核苷酸序列。本發明的基因芯片所采用的固相載體選自任何可用于制備基因芯片的材料,包括但不限于,硝酸纖維素膜、尼龍膜、玻璃片、硅片和塑料片。本發明所述基因芯片的制備,是將所述的寡核苷酸有序地點樣到載體上,通過寡核苷酸的3’端接頭序列中的刻痕內切酶識別位點錨定,將寡核苷酸固定于載體上,從而制成基因芯片。本發明還提供一種基因合成的試劑盒,包含上述任一項所述基因芯片、刻痕內切酶、鏈位移DNA聚合酶、高保真DNA聚合酶以及錯配特異性內切酶。優選地,本發明所述試劑盒還包含dNTP、BSA、刻痕內切酶、鏈位移聚合酶、高保真 DNA聚合酶及Hiermopol II緩沖液和寡核苷酸引物,所述Thermopol II緩沖液由20mM Tris-HCl, IOmM(NH4)2SO4, IOmM KCl, 2mM MgSO4,0. 1% Triton X-100 組成,其在 25°C 的pH為
8.8 ο本發明所述方法是基于DNA微陣列的高通量基因合成技術,采用物理區隔的辦法,將微陣列分為子陣列,每一個子陣列中僅僅包含合成大于0. 2kb總長的寡核苷酸序列, 從而可以避免了序列的選擇性擴增,可以有效地合成所有的DNA序列,最后利用各子陣列中合成的總長DNA來組裝最終的DNA,避免相似序列之間交叉雜交而實現基因的有效組裝。目前大多采用化學方法對寡核苷酸序列進行處理使之脫離芯片繼而進行芯片外組裝反應。本發明首次采用了刻痕和鏈位移擴增反應從微陣列表面擴增寡核苷酸序列。也就是說,用于錨定序列于芯片表面的25-mer通用配體含有一個刻痕內切酶識別位點。寡核苷酸序列被合成后只需要加入刻痕內切酶就能催化序列的脫離從而進行序列組裝。為了避免下游基因的組裝反應所需要的基因收集和純化的復雜操作,聚合酶循環組裝反應能在nSDA反應后直接進行而不需要更換緩沖溶液,實現了寡核苷酸序列的合成與組裝成基因片段在同一個小室中實現。通過使用一種特別的錯配特異性內切酶CEL酶減少了基因合成的錯誤,使基因合成的錯誤率達到了 0. 19error/lA。本發明的一種基于微流芯片技術的高通量、高保真基因合成方法,可大幅度降低了基因合成成本,顯著縮短了合成時間,極大地滿足生命科學前沿領域對大規?;蚝铣傻钠惹行枨?。
術語與定義術語“刻痕內切酶”是指只切斷DNA雙鏈中一條鏈的DNA內切酶。術語“鏈位移擴增”是指一種可以在恒溫條件下,在體外擴增DNA的方法。術語“通用引物”是指能與某類載體DNA結合,適用于由該載體建立的所有克隆 DNA的引物。術語“聚合酶拼接”是指直接利用嗜熱性DNA聚合酶,通過熱循環反應將兩頭重疊雜交的寡核苷酸片斷步步延伸,最終合成全長基因的方法。術語“錯配特異性內切酶”是指能夠裂解含有因堿基突變、插入或缺失導致的所有類型的DNA雙鏈錯配的酶。
圖1是將寡核苷酸擴增和基因組裝過程整合到同一塊芯片上進行的全過程示意圖。圖2是基因合成錯誤修復體系反應原理示意圖。圖3顯示了應用本專利方法在芯片上合成出的IacZa密碼子變異基因在大腸桿菌中的表達情況。a中顯示了將1,296個的表達不同IacZa密碼子變異基因的大腸桿菌菌落依顏色強度分類。b中柱狀圖顯示了瓊脂平板上1,468種表達不同IacZ α密碼子變異基因的隨機菌落顏色深度分布。圖4顯示了使用本發明高通量、高保真芯片基因合成技術對蛋白質表達的優化結^ ο圖a中列出了其中15種蛋白的數據。每對泳道顯示的均為大腸桿菌內的總蛋白, 左側泳道為原生型(WT),右邊是優化后的克隆(Op)。箭頭標示的較粗的條帶是高度表達的原生型轉錄因子-GFP融合蛋白。泳道M是蛋白質分子量標準。圖b中為余下59中蛋白表達結果。
具體實施例方式本發明公開了一種高通量、高保真、基因合成芯片及其應用,本領域技術人員可以借鑒本文內容,適當改進工藝參數實現。特別需要指出的是,所有類似的替換和改動對本領域技術人員來說是顯而易見的,它們都被視為包括在本發明。本發明的芯片及應用已經通過較佳實施例進行了描述,相關人員明顯能在不脫離本發明內容、精神和范圍內對本文所述的方法和應用進行改動或適當變更與組合,來實現和應用本發明技術。本發明提供的基因合成方法全過程示意圖見圖1,其中寡核苷酸擴增和基因組裝過程整合到同一塊芯片上進行。利用噴墨打印式DNA芯片合成儀或其它類型芯片合成儀在微流芯片上各個獨立的微池內合成寡核苷酸庫。然后向微池中加入組合好的擴增和組裝反應混合物并密封。在刻痕和鏈位移擴增反應(nSDA)中,鏈位移DNA聚合酶延伸并移位正在處理的鏈,同時刻痕內切酶將通用引物從合成出得寡核苷酸產物上切去,產生新的3'端并繼續延伸。擴增之后,每個微池中的游離的寡核苷酸通過聚合酶鏈式反應(PCR)組裝成基因產物。為了使本領域的技術人員更好地理解本發明的技術方案,下面結合具體實施例對本發明作進一步的詳細說明,所述的實施例是對本發明的解釋而不是限定。實施例1 芯片的設計和制備1" X 3"的標準環烯烴共聚物(COC)薄片表面經硅薄膜修飾,整塊芯片表面被劃分成30個微池,每個微池的半徑為150微米,間距300微米(中心點之間的距離)以減少導致寡核苷酸合成不理想的邊緣效應。圖3是經二氧化硅薄膜修飾的微流芯片表面的微池陣列示意圖。實施例2 寡核苷酸在芯片上的合成噴墨式合成寡核苷酸的方法是已知的。使用特制的噴墨式DNA芯片合成儀在經硅薄膜修飾的環烯烴共聚物(COC)芯片上合成寡核苷酸。寡核苷酸產物的長度設計為48 或60個堿基,其中3’端為一段長為25個堿基的接頭序列。該接頭中含有一個刻痕內切酶 (Nickingendonuclease)識別位點并將寡核苷酸錨定在芯片表面。芯片上每個微池內可以打印361個點,每個點上合成一種序列的寡核苷酸,每個微池內合成出的寡核苷酸將分別組裝成長度為大于0. 2kb的一條基因或一個基因庫。為提高產量,可于多個點上均合成同一種序列的寡核苷酸。實施例3 寡核苷酸在芯片上的擴增和基因組裝寡核苷酸在合成后,向芯片上的每個微池中加入恒溫刻痕和鏈位移擴增 (Isothermal nicking and strand displacement amplification, nSDA)、聚合酶拼接 (Polymerase chain assembly, PCA)組合反應所需的其他組分的混合物,該混合物中含有 0. 4mM dNTP、0. ang/mlBSA、刻痕內切酶(Nt. BstNBI,購自美國NEB公司)、鏈位移DNA聚合酶(Bst DNA聚合酶大片段,購自美國Ν^公司)、高保真DNA聚合酶(Phusion聚合酶,購自美國NEB公司)及經優化的ThermopolII buffer (購自美國NEB公司)。將芯片上各微池密封后,將芯片置于Mastercycler梯度PCR儀(購自Eppendorf公司)的芯片適配器上進行nSDA-PCA組合反應。體系中首先進行nSDA反應,于50°C恒溫2hr后,升至80°C恒溫 20min ;隨后進行PCA反應,于98°C預變性30s后,進行40個循環的PCR反應,每個循環包括98°C變性7s,60°C退火60s,72°C以15s/kb速度延伸,最后再于72°C延伸5min。在刻痕和鏈位移擴增反應(nSDA)中,一條通用引物與寡核苷酸3’端的接頭雜交, DNA鏈位移聚合酶(strand-displacing polymerase)延伸并位移正在處理的寡核苷酸鏈, 同時刻痕內切酶(nickingendonuclease)將通用引物從用于基因合成組裝的寡核苷酸上分離開來,并產生新的3’端用于進一步的延伸反應。nSDA-PCA反應之后,各微池內1_2 μ 1反應產物利用Wiusion聚合酶和末端引物進行PCR擴增。末端引物濃度為0.5 μ M。PCR反應先于98°C預變性30s后,進行30個循環的PCR反應,每個循環包括98°C變性10s,60°C退火60s,72°C以30s/lib速度延伸,最后再于72°C延伸5min。擴增后,每個小池中的游離寡核苷酸通過聚合酶拼接(PCA)反應全部用來組裝成為基因產物。實施例4 合成錯誤的修復系統本發明中使用植物CEL族的錯配特異性內切酶,可識別并裂解由堿基取代或小插CN 102533738 A入或缺失導致的所有類型的錯配。CEL酶的一個商品化的亞型是Surveyor核酸酶(購自 Transgenomic公司),在基因錯誤修復反應中,我們首先通過熱變性,讓合成的基因重新退火,使錯配位點暴露,然后用Surveyor核酸酶處理這些基因,錯配位點被錯配特異性核酸內切酶和3’ 一5’核酸外切酶活性識別并切斷。最后,所得的基因片段經交疊延伸PCR反應重新組裝成完整的基因。該修復過程可以重復進行,以提高修復率。經過兩輪修復,合成出的基因的錯誤可降低16倍以上,最終錯誤率約為每8700bp中有一個錯誤堿基。基因合成錯誤修復反應原理示意圖見圖2。在片組裝的基因產物經PCR擴增并純化后,用1 X Taq緩沖液(購自NEB公司)或 IXPhusion HF緩沖液(購自^ffiB公司)稀釋至終濃度為50ng/μ 1,95°C預變性IOmin后, 逐漸降溫退火,先以2V /s的速率降溫至85°C,然后以0. 30C /s的速率降溫至25°C,每隔 10°C保溫Imin0反應產物(4 μ 1,200ng)與0· 5 μ 1 Surveyor核酸酶試劑和0. 5 μ 1增強劑(購自Transgenomic公司)混合,于42°C孵育20min。反應產物進行交疊延伸PCR將因含有錯誤堿基而被切斷的基因片段重新組裝成完整的基因。PCR反應先于98°C預變性30s 后,進行30個循環的PCR反應,每個循環包括98V變性IOs,60°C退火60s,72°C以30s/lib 速度延伸,最后再于72°C延伸5min結束反應。在第二輪錯誤修復中,將上一輪修復產物用IXTaq緩沖液稀釋至50ng/y 1,重新退火,反應體系和條件都如前所述。反應產物進行交疊延伸PCR,所得產物即為經修復的完
整基因。實施例5 =IacZ的密碼子變異基因的表達篩選在異丙基-β -D-硫代半乳糖苷(IPTG)存在下,IacZ α的表達可使宿主大腸桿菌菌落呈現藍色。首先,參照非偏好性密碼子使用表,設計出一系列IacZa密碼子變異基因, 在該表中對應同一種氨基酸的各種密碼子使用頻率相同。之后,構建了一個IacZ α密碼子變異基因庫,由1,296個的表達不同IacZ α密碼子變異基因組成,并將其全部轉化到大腸桿菌感受態細胞中。取出一小部分涂布在瓊脂糖固體平皿上,并通過自動成像分析實時測定各個單克隆菌落的藍色深度。菌落顏色深淺的差別顯示著蛋白質表達水平不同。隨機挑選瓊脂糖固體平皿上的單克隆菌落進行統計,得到了關于密碼子變異基因表達水平的鐘形分布圖。大約三分之一的變異基因顯示出比原生型IacZa更高的表達水平。原生型基因的表達水平稍高于所有表達量可測的克隆的中等水平。圖3顯示了應用本發明所述方法在芯片上合成出的IacZa密碼子變異基因在大腸桿菌中的表達情況。圖3a中顯示了將1,296個的表達不同IacZ α密碼子變異基因的大腸桿菌菌落依顏色強度分類。原始圖片是使用HP Photosmart C7180平板掃描儀對瓊脂平皿進行掃描獲得的。圖北中柱狀圖顯示了瓊脂平板上1,468種表達不同IacZ α密碼子變異基因的隨機菌落顏色深度分布。對幾百個藍色克隆的測序證實,由于芯片合成的密碼子變異基因庫很大,在一塊平板上得到相同克隆的幾率極低。原生型IacZ α的表達水平用虛線表示。盡管這種分布的原因尚需進一步研究,但通過該分布圖已能夠估計大腸桿菌中 IacZa基因的潛在翻譯能力。這些實驗結果顯示出本專利公開的這種在芯片上合成基因的方法,實現了在給定的表達體系中篩選出具有可靠且理想的蛋白表達水平的基因序列,具有高度的可行性和可靠性。實施例6 果蠅轉錄因子蛋白結構域的表達篩選為了直接測定蛋白質在大腸桿菌中的表達水平,在每種目標基因上加上綠色熒光蛋白(GFP)報告基因標簽。蛋白質表達水平越高,該單克隆菌落發出的熒光越強。本發明應用對74種果蠅轉錄因子蛋白的結構域進行了表達的優化和篩選,這些蛋白是被用于制備ENCODE工程(DNA元件的百科全書)的抗體。首先,針對15種在大腸桿菌中不表達的候選基因,并根據大腸桿菌密碼子使用表,設計并應用本專利公開的芯片基因合成方法合成了密碼子變異基因庫。在此應用中,沒有使用錯配內切酶錯誤修復體系,因為非常相關的密碼子變異基因之間可能會形成異類雙鏈DNA。合成出的基因與GFP的N端融合,并使用非序列依賴型的聚合酶循環延伸克隆的方法(CPEC)插入到pAcGFP表達載體中。質粒轉化到大腸桿菌細胞內,在瓊脂平板上培養。持續監測所有菌落發出的熒光,熒光很強的部分克隆被挑選出來進行測序。所有克隆中所含有的質粒,帶有不同密碼子變異基因的,貫穿了候選蛋白的序列。將序列已確定的、熒光較強的克隆于液體培養基中培養,在聚丙烯酰胺凝膠上對總蛋白提取物進行電泳以確定蛋白結構域的表達情況。使用這種方法,15種候選蛋白均篩選得到具有高表達量的克隆。相比之下,克隆到相同的載體中,并在相同的條件下培養的原生型對照組檢測不到蛋白表達量。這種結果表明,本專利公開的芯片基因合成方法能夠可靠地從不可檢測的水平將蛋白質的表達量提高到占細胞中蛋白總質量的50-60%。圖4顯示了使用高通量、高保真芯片基因合成技術對蛋白質表達的優化結果。圖 a中列出了其中15種蛋白的數據。每對泳道顯示的均為大腸桿菌內的總蛋白,左側泳道為原生型(WT),右邊是優化后的克隆(Op)。箭頭標示的較粗的條帶是高度表達的原生型轉錄因子-GFP融合蛋白。在原生型的泳道內,檢測不到有原生型轉錄因子-GFP融合蛋白被表達。每塊Ni^age 4-12%梯度膠上分離的細胞內總蛋白的量相同。用EZBlue凝膠染色試劑染色。泳道M是Novex預染蛋白質分子量標準混合物(購自hvitrogen公司)。對其余59種蛋白進行了相同的密碼子優化實驗。圖4b中為余下59中蛋白表達結果。本實施例74種果蠅轉錄因子基因片段經優化后在大腸桿菌中表達,針對每種基因片段均合成了大約1,000-1, 500種密碼子變異基因,與GFP基因一起克隆到表達載體的開放閱讀框架中,經表達篩選出熒光最強的菌落。測序和蛋白凝膠電泳結果證實所測試的所有候選蛋白都如預期得到了高表達量的克隆。據此,可以再一次證實本發明的可行性和
可靠性。以上所述,僅為本發明的具體實施例,但本發明的保護范圍并不局限于此,任何熟悉本技術領域的技術人員在本發明揭露的技術范圍內,可輕易想到的變化或替換,都應涵蓋在本發明的保護范圍之內。
權利要求
1.一種基因合成方法,其特征在于,在一張基因芯片上采用恒溫刻痕和鏈位移擴增及聚合酶拼接反應進行寡核苷酸擴增以及基因組裝,所述基因芯片通過將寡核苷酸固定在固相載體表面形成,寡核苷酸的3’端具有長度為15-150個堿基的接頭序列且通過該接頭序列中的刻痕內切酶識別位點錨定在芯片表面。
2.權利要求1所述的基因合成方法,其特征在于,所合成基因的長度大于或等于200個堿基對。
3.權利要求1所述的基因合成方法,其特征在于,還包含并采用錯配特異性內切酶進行基因合成錯誤修復步驟。
4.權利要求3所述的基因合成方法,其特征在于,寡核苷酸擴增以及組裝、基因合成錯誤修復三種反應在同一體系中先后連續進行或分步進行。
5.權利要求3所述的基因合成方法,其特征在于,基因合成錯誤修復反應在芯片上或芯片外單獨進行。
6.權利要求1所述的基因合成方法,其特征在于,所述基因芯片可以劃分成一個或多個區域,寡核苷酸擴增以及基因組裝在一個或多個區域同時進行。
7.權利要求1所述的基因合成方法,其特征在于,所述恒溫刻痕和鏈位移擴增及聚合酶拼接反應是采用一條通用引物與寡核苷酸3’端的接頭雜交,在鏈移位聚合酶延伸并位移寡核苷酸鏈的同時,刻痕內切酶將通用引物從剛剛擴增出的寡核苷酸鏈上裂解下來,使通用引物的3’端重新游離,繼續開始新的延伸反應。
8.權利要求3所述的基因合成方法,其特征在于,所述基因合成錯誤修復步驟為通過熱變性,讓合成的基因重新退火,使錯配位點暴露,錯配位點被錯配特異性核酸內切酶和 3’ 一5’核酸外切酶活性識別并切除,所得的基因片段經交疊延伸PCR反應組裝成完整基因。
9.一種基因芯片,通過將寡核苷酸探針固定在固相載體表面形成,其特征在于,寡核苷酸的3’端具有長度為15-150個堿基的接頭序列且通過該接頭序列中的刻痕內切酶識別位點錨定在芯片表面。
10.根據權利要求9所述的基因芯片,其特征在于,采用物理區隔的辦法,將微陣列分為子陣列,每一個子陣列中包含合成總長大于0. 2kb的寡核苷酸序列。
11.根據權利要求9或10所述的基因芯片,其特征在于,所述固相載體選自硝酸纖維素膜、尼龍膜、玻璃片、硅片和塑料片。
12.—種基因合成的試劑盒,包含權利要求9-11任一項所述基因芯片、刻痕內切酶、鏈位移DNA聚合酶、高保真DNA聚合酶以及錯配特異性內切酶。
13.根據權利要求12所述的試劑盒,其特征在于,還包含dNTP、BSA、Thermopol II 緩沖液和寡核苷酸引物,所述Thermopol II緩沖液由20mM Tris-HCl, IOmM(NH4)2SO4, IOmM KCl, 2mM MgSO4,0. 1% Triton X-IOO 組成,其在 25°C 的 pH 為 8. 8。
全文摘要
本發明涉及生物技術領域,特別涉及基因芯片技術領域,公開了一種基因合成芯片方法,將寡核苷酸擴增和寡核苷酸平行組裝成基因全過程整合到一張芯片上。本發明還使用錯配特異性內切酶建立基因因合成錯誤修復系統,錯誤率降至低于~0.19錯誤堿基/kb。本發明提供的高通量、高保真、低成本的基因合成芯片方法,可極大地滿足合成生物學、基因組學、系統生物學等生命科學前沿領域對大規?;蚝铣珊偷鞍踪|表達優化篩選的迫切需求。
文檔編號C40B40/06GK102533738SQ20121006884
公開日2012年7月4日 申請日期2012年3月15日 優先權日2012年3月15日
發明者田敬東 申請人:田敬東