麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

臺勾霉素的生物合成基因簇及其應用的制作方法

文檔序號:588093閱讀:578來源:國知局
專利名稱:臺勾霉素的生物合成基因簇及其應用的制作方法
技術領域
本發明屬于微生物基因工程領域,具體涉及抗生素臺勾霉素的生物合成基因簇的 克隆、分析、功能研究及其應用。
背景技術
近年來,抗生素的濫用導致了各種耐藥菌的出現,直接威脅人類的生命和健康。艱 難梭菌(Clostridium difficile)就是其中的一種。艱難梭菌引起的腹瀉(Clostridium difficile-associateddiarrhoea, CDAD)已經成為困撓人類健康的一個嚴重的問題 (Johnson,2007),另外,部分抗生素腹瀉(antibiotic-associated diarrhea, AAD)和大部 分抗生素性結膜炎(antibiotic associatedcolitis,AAC)也是由艱難梭菌引起的(Gerber & Ackermann,2008 ;Y-K ·舒;C-K ·王;Y-H 邱;A ·羅梅羅;F ·巴巴卡尼;P ·西爾斯; F·奧庫姆,200 。這些疾病成為衛生保健體系的主要經濟負擔,據保守估計,美國醫院每 年都為此花費30-60億美元(Kyne et al.,2002 ;Y-K ·舒;C-K ·王;Y-H 邱;A ·羅梅羅; F ·巴巴卡尼;P ·西爾斯;F ·奧庫姆,2005)。大環內酯類抗生素臺勾霉素(tiacumicins, 又稱lipiarmycins),具有抗各種細菌病原體的活性,特別是針對艱難梭菌有明顯的抗菌 活性(Ackermann et al. ,2004 ;Karlowsky et al.,2008)。臺勾霉素是一系列 18 元環 大環內酯類抗生素的總稱,由放線菌指孢囊菌Dactylosporangium aurantiacum subsp. hamdenensis NRRL 18085,游動放線菌 Actinoplanes deccanensis ATCC 21983 和小孢鏈 菌 Catellatospora sp. Bp3323_81 等產生(Coronelli et al. , 1975 ;Hochlowski et al., 1987 ;Kurabachew et al. ,2008) 研究發現臺勾霉素中臺勾霉素B (Tiacumicin B)是最 好的活性組分,其擁有兩個脫氧糖基和一個芳香環支鏈,C-18為R-羥基(見圖1),對艱難 梭菌具有較低的最小抑制濃度(MIC)值,體外對艱難梭菌的抗菌活性為萬古霉素的8-10倍 (Y-K ·舒;C-K ·王;Y-H 邱;A ·羅梅羅;F ·巴巴卡尼;P ·西爾斯;F ·奧庫姆,2005)。目 前該藥物已經進入到三期臨床試驗階段(Louie et al. ,2009 ;Shue et al.,2008)。最近 有報道表明,臺勾霉素B也具有很好的抗結核分枝桿菌(Mycobacteriumtuberculosis)活 性(Kurabachew et al.,2008)和體外抗癌活性(Wu et al. ,2009) 因此,這種針對革蘭氏 陽性細菌的高效新型抗生素具有很大的潛力開發成新藥(Gerber & Ackermarm,2008)。近年來蓬勃發展起來的組合生物合成技術,為改造臺勾霉素的生產菌指孢囊菌 NRRL18085帶來了新的機遇。在闡明了自然界的生物合成途徑、理解自然界聚酮化合物天然 組合生物合成機理的基礎上,人們可以采用組合生物合成技術對抗生素的生物合成基因、 調控基因進行體內敲除、突變、置換和重組等操作,不但能夠生產“非天然”的天然產物結構 類似物,而且還可以提高天然產物的產量,或定向積累所需要的天然產物,為天然產物的發 現和藥物開發提供分子和活性多樣性。

發明內容
本發明的第一個目的在于提供一種臺勾霉素的生物合成基因簇。
本發明的臺勾霉素的生物合成基因簇,其特征在于,該生物合成基因簇的核苷酸 序列如SEQ ID NO. 1所示,包含31個基因,具體為1)聚酮合成酶基因,即tiaAl、tiaA2、tiaA3、tiaA4共4個基因tiaAl位于基因簇核苷酸序列第41491-57180個堿基處,長度為15690個堿基對, 編碼聚酮合成酶,5229個氨基酸;tiaA2位于基因簇核苷酸序列第57186-66803個堿基處,長度為9618個堿基對,編 碼聚酮合成酶,3205個氨基酸;tiaA3位于基因簇核苷酸序列第66擬9_71337個堿基處,長度為4509個堿基對,編 碼聚酮合成酶,1502個氨基酸;tiaA4位于基因簇核苷酸序列第71361-81746個堿基處,長度為10386個堿基對, 編碼聚酮合成酶,3461個氨基酸;2)脫氧糖基的生物合成基因,即 tiaSl、tiaS2、tiaS3、tiaS4、tiaS5、tiaS6、 tiaGl、tiaG2 共 8 個基因tiaSl位于基因簇核苷酸序列第8508-7492個堿基處,長度為1017個堿基對,編碼 ⑶P-D-甘露糖4,6-脫水酶,338個氨基酸;tiaS2位于基因簇核苷酸序列第9742-8534個堿基處,長度為1209個堿基對,編碼 C-甲基轉移酶,402個氨基酸;tiaS3位于基因簇核苷酸序列第10785-9787個堿基處,長度為999個堿基對,編碼 ⑶P-甘露糖4,6-脫水酶,332個氨基酸;tiaS4位于基因簇核苷酸序列第21789-22820個堿基處,長度為1032個堿基對,編 碼⑶P-甘露糖4,6-脫水酶,343個氨基酸;tiaS5位于基因簇核苷酸序列第33022-34347個堿基處,長度為13 個堿基對,編 碼糖0-甲基轉移酶,441個氨基酸;tiaS6位于基因簇核苷酸序列第38882-40021個堿基處,長度為1140個堿基對,編 碼0-酰基轉移酶,379個氨基酸;tiaGl位于基因簇核苷酸序列第7441-6044個堿基處,長度為1398個堿基對,編碼 糖基轉移酶,465個氨基酸;tiaG2位于基因簇核苷酸序列第20351-21772個堿基處,長度為1422個堿基對,編 碼糖基轉移酶,473個氨基酸;3) 2,4-二羥基-3,5-二氯-6-乙基苯甲酸合成酶基因,即tiaE、tiaF、tiaB、tiaM 共4個基因tiaE位于基因簇核苷酸序列第14006-13260個堿基處,長度為747個堿基對,編碼 II型硫酯酶,248個氨基酸;tiaF位于基因簇核苷酸序列第14189-15220個堿基處,長度為1032個堿基對,編
碼酰基載體蛋白合成酶/縮合酶,343個氨基酸;tiaB位于基因簇核苷酸序列第15220-20349個堿基處,長度為5130個堿基對,編 碼可重復利用的聚酮合成酶,1709個氨基酸;tiaM位于基因簇核苷酸序列第37305-38789個堿基處,長度為1485個堿基對,編 碼鹵化酶,494個氨基酸;
4)異丁酰基合成基因,即tiaC、tiaD共2個基因tiaC位于基因簇核苷酸序列第11219-12280個堿基處,長度為1062個堿基對,編 碼支鏈α酮酸脫氫酶的El α亞單元,353個氨基酸;tiaD位于基因簇核苷酸序列第12277-132M個堿基處,長度為978個堿基對,編碼 支鏈α酮酸脫氫酶的El β亞單元,325個氨基酸;5)甲基丙二酰輔酶A和乙基丙二酰輔酶A合成基因,即tiaJ、tiaK、tiaL、tiaN共 4個基因tiaj位于基因簇核苷酸序列第27166-28398個堿基處,長度為1233個堿基對,編 碼3-羥乙酰基-輔酶A脫氫酶,410個氨基酸;tiaK位于基因簇核苷酸序列第28395-29759個堿基處,長度為1368個堿基對,編 碼巴豆酰基-輔酶A還原酶/羧化酶,454個氨基酸;tiaL位于基因簇核苷酸序列第29770-31200個堿基處,長度為1431個堿基對,編 碼丙酰-輔酶A羧化酶,476個氨基酸;tiaN位于基因簇核苷酸序列第82097-83296個堿基處,長度為1200個堿基對,編 碼烯酰-輔酶A水合酶/異構酶,399個氨基酸;6)環骨架后修飾基因,即tiaPl、tiaP2,共2個基因tiaPl位于基因簇核苷酸序列第32479-31301個堿基處,長度為1179個堿基對,編 碼細胞色素P-450氧化酶,392個氨基酸;tiaP2位于基因簇核苷酸序列第41304-40105個堿基處,長度為1200個堿基對,編 碼細胞色素P-450氧化酶,399個氨基酸;7)調節、抗性和未知功能基因,即 tiaI、tiaRl、tiaR2、tiaTl、tiaT2、tiaT3、tiaT4 共7個基因tial位于基因簇核苷酸序列第26853-24502個堿基處,長度為2352個堿基對,編 碼ATP-依賴的DNA解螺旋酶,783個氨基酸;tiaRl位于基因簇核苷酸序列第34415-37186個堿基處,長度為2772個堿基對,編 碼LuxR家族轉錄調節因子,923個氨基酸;tiaR2位于基因簇核苷酸序列第88114-88527個堿基處,長度為414個堿基對,編 碼TetR家族轉錄調節因子,137個氨基酸;tiaTl位于基因簇核苷酸序列第24505-2^80個堿基處,長度為16 個堿基對,編 碼膜轉運蛋白,541個氨基酸;tiaT2位于基因簇核苷酸序列第83304-84590個堿基處,長度為1287個堿基對,編 碼膜轉運蛋白,4 個氨基酸;tiaT3位于基因簇核苷酸序列第85955-84642個堿基處,長度為1314個堿基對,編 碼NitT/TauT家族ABC轉運蛋白,437個氨基酸;tial^位于基因簇核苷酸序列第87757-86003個堿基處,長度為1755個堿基對,編 碼NitT/TauT家族ABC轉運蛋白,584個氨基酸。SEQ ID NO. 1的互補序列可根據DNA堿基互補原則隨時得到。SEQ ID NO. 1的核 苷酸序列或部分核苷酸序列可以通過聚合酶鏈式反應(PCR)或用合適的限制性內切酶酶 切相應的DNA或DNA體外合成技術或使用其他合適的技術得到。本發明提供了得到至少包含部分SEQ ID NO. 1中DNA序列的重組DNA載體的途徑。本發明還提供了產生臺勾霉素生物合成基因被中斷或其他基因改造的途徑,至少 其中之一的基因包含有SEQ ID NO. 1中的核苷酸序列。本發明所提供的核苷酸序列或部分核苷酸序列,可利用聚合酶鏈式反應(PCR)的 方法或包含本發明序列SEQ ID NO. 1的DNA作為探針以Southern雜交等方法從其他生物 體中得到與臺勾霉素生物合成基因相似的基因。包含本發明所提供的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于從指 孢囊菌NRRL 18085基因組文庫中定位更多的文庫質粒。這些文庫質粒至少包含本發明中 的部分序列,也包含有指孢囊菌NRRL 18085基因組中鄰近區域未克隆的DNA。包含本發明所提供的核苷酸序列或至少部分核苷酸序列可以被體內體外修飾或 進行突變,包括插入、置換或缺失,聚合酶鏈式反應,錯誤介導聚合酶鏈式反應,位點特異性 突變,不同序列的重新連接,序列的不同部分或與其他來源的同源序列進行定向進化,或通 過紫外線或化學試劑誘變等。包含本發明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以通過合 適的表達體系在外源宿主中表達以得到相應的酶或其他更高的生物活性物質或產量。這些 外源宿主包括大腸桿菌、鏈霉菌、小單孢菌、假單孢菌、芽孢桿菌、酵母、植物和動物等。本發明所提供的氨基酸序列可以用來分離所需要的蛋白并可用于抗體的制備。包含本發明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些 氨基酸之后仍有生物活性甚至有新的生物學活性,或者提高了產量或優化了蛋白動力學特 征或其他致力于得到的性質。包含本發明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在 異源宿主中表達并了解它們在宿主代謝中的功能。包含本發明所提供的核苷酸序列編碼的蛋白可以催化合成2,4- 二羥基-3,5- 二 氯-6-乙基苯甲酸、脫氧糖及臺勾霉素聚酮大環骨架,進一步催化合成抗生素臺勾霉素B。包含本發明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通 過遺傳重組來構建重組載體以獲得新型生物合成途徑,也可以通過插入、置換、缺失或失活 進而獲得其他新型生物合成途徑或者產生新的化合物。包含本發明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因DNA片段可 以通過中斷臺勾霉素生物合成的一個或幾個步驟而得到新的臺勾霉素結構類似物或前體。 包含DNA片段或基因可以用來提高臺勾霉素或其衍生物的產量,本發明提供了在基因工程 微生物中提高產量的途徑。包含本發明所提供的聚酮合成酶可以通過缺失、插入或失活來自于相同或不同的 聚酮合成酶系統的一個或多個聚酮合成酶結構域、模塊或基因而產生新的聚酮化合物。包含本發明所提供的核苷酸序列或至少部分核苷酸序列的片段或基因可以用來 構建聚酮合成酶庫或聚酮合成酶衍生庫或組合庫。本發明所提供的催化合成2,4- 二羥基-3,5- 二氯_6_乙基苯甲酸的合成基因可 用于合成臺勾霉素衍生物。本發明所提供的臺勾霉素大環骨架的后修飾基因或糖基轉移酶或其他酶提供了 通過遺傳修飾得到類似物的途徑,所包含的催化大環內酯生成或后修飾的其他應用。
本發明所提供的鹵化酶TiaM可以應用于臺勾霉素的2,4_ 二羥基-6-乙基苯甲酸 的結構域鹵素基團的改變。總之,本發明所提供的包含臺勾霉素生物合成相關的所有基因和蛋白信息可以幫 助人們理解臺勾霉素家族天然產物的生物合成機制,為進一步遺傳改造提供了材料和知 識。本發明所提供的基因及其蛋白質也可以用來尋找和發現可用于醫藥、工業或農業的化 合物或基因、蛋白。用于本發明的指抱囊菌 Dactylosporangium aurantiacum subsp. hamdenensis NRRL 18085,已在本申請以前公開記載于美國專利,其專利號為US4,918,174的專利中。 根據該專禾1J文獻的記載,指抱囊菌 Dactylosporangium aurantiacum subsp. hamdenensis NRRL 18085保藏于美國農業研究菌種保藏中心(Agricultural Research Service Culture Collection,簡寫NRRL),其登錄號為 NRRL 18085。


圖1是臺勾霉素B的化學結構;圖2是陽性克隆的限制性酶切圖譜及其相互重疊區示意圖,包括了陽性克隆 pCSGl,pCSG4-7,pCSG9,pCSGlO, pCSG12,pCSG15_18,黑色部分表明了序列測定區域,E EcoRKB =BglII ;圖3是臺勾霉素生物合成基因簇的組織結構示意圖;圖4是推測的臺勾霉素B的生物合成途徑,(A)臺勾霉素大環內酯骨架的形成及 其關鍵后修飾過程;(B)芳香環的生物合成;(C)脫氧糖基的生物合成及其修飾;(D)乙基 丙二酰輔酶A的生物合成;圖5是基因遺傳改造指囊孢菌NRRL 18085中臺勾霉素的生物合成基因得到臺勾 霉素結構類似物的高壓液相分析圖(0)野生型菌株指孢囊菌NRRL18085經發酵獲得了臺 勾霉素B ;⑴敲除了 tiaM-鹵化酶基因,獲得的突變株發酵TCM50產生了化合物1 ; (2)敲 除了 tiaSl-GDP甘露糖4,6_脫水酶基因,獲得的突變株TCM51發酵產生了化合物2,3,4, 5; (3)敲除了 tiaS6-0乙酰轉移酶基因,獲得的突變株TCM53發酵產生了化合物4,5,6,7 ; (4)敲除了 tiaP2-P450基因,獲得的突變株TCMM發酵產生了化合物8,9,10,11 ;(5)敲 除了 tiaS2-C甲基轉移酶基因,獲得的突變株發酵TCM55產生了化合物2,3,4;(6)敲除了 tiaRl-Lux家族的調控基因,獲得的突變株TCM56失去了產生tiacumicinB的能力;(7)敲 除了 tiaGl-糖基轉移酶基因,獲得的突變株TCM57發酵產生了化合物3,4,5,6,12 ; (8)敲 除了 tiaG2-糖基轉移酶基因,獲得的突變株TCM64發酵產生了化合物13,14,15,16 ; (9)敲 除了 tiaF-ACP合成酶基因,獲得的突變株TCM62發酵產生了化合物13,14,15,16 ; (10)敲 除了 tiaPl-P450基因,獲得的突變株TCM69發酵產生了化合物17 ;(11)敲除了 tiaB-可重 復利用聚酮合成酶基因,獲得的突變株TCM63發酵產生了化合物4,13,14,15,16 ; (12)敲除 了 tiaS3-GDP甘露糖4,6-脫水酶基因,獲得的突變株TCM52發酵仍舊生產臺勾霉素B ; (13) 敲除了 tiaS4-GDP甘露糖4,6-脫水酶基因,獲得的突變株TCM65發酵生產臺勾霉素B和化 合物4 ; (14)敲除了 ORF(-l)-轉座酶基因,獲得的突變株TCM58發酵仍舊生產臺勾霉素B ; (15)敲除了 tiaC-Alpha支鏈酮酸脫氫酶基因,獲得的突變株TCM59發酵仍舊生產臺勾霉 素B ; (16)敲除了 tiaD-Alpha支鏈酮酸脫氫酶基因,獲得的突變株TCM60發酵仍舊生產臺
9勾霉素B; (17)敲除了 tiaE-硫酯合成酶基因,獲得的突變株TCM61發酵仍舊生產臺勾霉素 B,同時產生了化合物13,14,15,16 ; (18)敲除了 tiaJ-3-羥酰輔酶A脫氫酶基因,獲得的突 變株TCM66發酵仍舊生產臺勾霉素B ; (19)敲除了 tiaK-Crotonyl輔酶A脫羧酶/還原酶 基因,獲得的突變株TCM67發酵仍舊生產臺勾霉素B; 00)敲除了 tiaL-丙酰輔酶A脫羧酶 基因,獲得的突變株TCM68發酵仍舊生產臺勾霉素B; 敲除了 tiaS5-氧甲基轉移酶基 因,獲得的突變株TCM70發酵產生了化合物18-29 ; (22)敲除了 tiaN-烯醇酰輔酶A脫水酶 /異構酶基因,獲得的突變株TCM71發酵仍舊生產臺勾霉素B ; (23)敲除了 tiaR2-ArS家族 轉錄調控子編碼基因,獲得的突變株TCM72發酵仍舊生產臺勾霉素B,產量略有提高;04) 敲除了 orfl-短鏈脫氫輔基因,獲得的突變株TCM73發酵仍舊生產臺勾霉素B; 05)敲除了 tiaT2-Na/H膜轉運蛋白編碼基因,獲得的突變株TCM74發酵仍舊生產臺勾霉素B ; (26)敲 除了 tiaT4-ABC膜轉運蛋白編碼基因,獲得的突變株TCM76發酵仍舊生產臺勾霉素B ; (27) 敲除了 tiaAl-聚酮合成酶編碼基因,獲得的突變株TCM77失去生產臺勾霉素B及其類似物 的能力;圖6是基因遺傳改造臺勾霉素的生物合成基因得到的臺勾霉素結構類似物的化 學結構式;圖7是鹵化酶TiaM的體外生化鑒定,(A)TiaM催化反應的示意圖;⑶純化蛋白 TiaM和WuE的蛋白電泳分析;(C) TiaM反應產物的高壓液相分析圖(i) TiaM的標準反應 體系包括26 μ M化合物1,0. ImM黃素腺嘌呤二核苷酸(FAD),4mM NADH, IOOmM NaCl, 2. 9 μ M TiaM和0. 22 μ M SsuE ; (ii)標準反應體系缺少SsuE ; (iii)標準反應體系缺少TiaM ; (iv) 標準反應體系缺少FAD ; (ν)標準反應體系缺少NADH ; (vi)標準反應體系缺少NaCl ; (vii) 標準反應體系中用化合物30替代化合物1 ; (viii)臺勾霉素B標準品;(ix)標準反應體系 中用NaBr替代NaCl ; (χ)標準反應體系中用化合物30替代化合物1,用NaBr替代NaCl。
具體實施例方式以下是對本發明的進一步說明,而不是對本發明的限制。1.臺勾霉素的生物合成基因簇克隆、序列分析及功能分析臺勾霉素B(圖1)中有一個大環內脂的骨架,是由聚酮合成酶PKS催化產生的, 因此設計 PKS 的兼并引物 TCM-PKS4F :5' -CTff CGT SGA GGC SCA YGG CAC SGG-3 ‘和 TCM-PKS5R 5' -CCR TGM CCS GAG AAS ACC CAS AC-3',通過 PCR 擴增從指孢囊菌 NRRL 18085基因組中獲得一個約700bp的PCR片段,連入到T載體中,測序后將序列進行blast 比對,結果表明,該序列與已知的PKS具有高度同源性。同樣臺勾霉素B中的芳香環支鏈上 有兩個氯原子,這暗示有鹵化酶參與了臺勾霉素B的生物合成。我們采用文獻報道的次級 代謝產物鹵化酶的兼并引物引物Halo-B4-FW :5' -TTC CCS CGS TAC CAS ATC GGS GAG-3 ‘ 和 Halo-B7-RV 5' -GSG GGA TSff MCC AGff ACC ASC C_3' (Hornung et al.,2007),從指 孢囊菌NRRL 18085的基因組DNA中擴增獲得了約550bp的DNA片段。序列測定(GenBank 序列號為GU^^IO)和Blast結果顯示該DNA片段所對應的蛋白多肽序列跟一系列的次級 代謝產物的鹵化酶有高度相似性。于是將這兩個片段用地高辛標記為探針,從指囊孢菌NRRL 18085的基因組文庫 1920個克隆中篩選,用PKS探針獲得了 16個陽性克隆,其中的8個用鹵化酶探針能夠同時篩選獲得,但用鹵化酶探針未能篩選到其他陽性克隆。這些陽性克隆經酶切分析表明涵蓋 了染色體約1001Λ的區域(圖幻。在此基礎上,再經過染色體步移獲得了 2個交疊的質粒 PCSG17和pCSG18。這18個涵蓋了染色體約130kb的區域。DNA序列測定了 110,633bp的 染色體區域,通過生物信息學分析包含了 50個開放讀碼框(圖3),其中31個可能與臺勾 霉素B的生物合成有關(表1)。根據基因編碼蛋白的功能分析,臺勾霉素的生物合成基因 簇被初步確定為從基因tiaGl到tiaR2(圖3)涵蓋染色體82. 5kb的區域,包含31個開放 讀碼框。整個臺勾霉素的生物合成基因簇共31個基因,其中4個聚酮合成酶基因tiaAl、 tiaA2、tiaA3、tiaA4用于編碼I型聚酮合成酶((PKS),共包含9個模塊,40個功能域,負責 催化臺勾霉素大環骨架部分聚酮鏈的生物合成;8個脫氧糖基生物合成基因tiaSl、tiaS2、 tiaS3、tiaS4、tiaS5、tiaS6、tiaGl、tiaG2編碼的蛋白負責脫氧甘露糖的生物合成,并進一 步與大環骨架縮合;4個2,4- 二羥基-3,5- 二氯-6-乙基苯甲酸合成酶基因tiaE、tiaF、 tiaB、tiaM用于編碼重復使用的PKS及氯化修飾酶,負責催化2,4_ 二羥基-3,5- 二氯-6-乙 基苯甲酸的生物合成;2個異丁酰基合成基因tiaC、tiaD用于編碼支鏈α酮酸脫氫酶的α 和β組分,負責異丁酰基合成;4個甲基丙二酰輔酶A和乙基丙二酰輔酶A合成基因tiaj、 tiaK、tiaL、tiaN用于編碼甲基丙二酰輔酶A和乙基丙二酰輔酶A合成;2個環骨架后修飾 基因tiaPl、tiaP2編碼氧化酶,催化臺勾霉素大環骨架的后修飾;7個調節、抗性和未知功 能基因tiaI、tiaRl、tiaR2、tiaTl、tiaT2、tiaT3、tiaT4負責還編碼2個調節基因產物和4 個抗性基因產物和一個未知功能的蛋白。表1 臺勾霉素的生物合成基因簇的基因及其功能分析
權利要求
1. 一種臺勾霉素的生物合成基因簇,其特征在于,該生物合成基因簇的核苷酸序列如 SEQ IDN0. 1所示,包含31個基因,具體為1)聚酮合成酶基因,即tiaAl、tiaA2、tiaA3、tiaA4共4個基因tiaAl位于基因簇核苷酸序列第41491-57180個堿基處,長度為15690個堿基對,編碼 聚酮合成酶,52 個氨基酸;tiaA2位于基因簇核苷酸序列第57186-66803個堿基處,長度為9618個堿基對,編碼聚 酮合成酶,3205個氨基酸;tiaA3位于基因簇核苷酸序列第66擬9-71337個堿基處,長度為4509個堿基對,編碼聚 酮合成酶,1502個氨基酸;tiaA4位于基因簇核苷酸序列第71361-81746個堿基處,長度為10386個堿基對,編碼 聚酮合成酶,3461個氨基酸;2)脫氧糖基的生物合成基因,即tiaSl、tiaS2、tiaS3、tiaS4、tiaS5、tiaS6、tiaGl、 tiaG2共8個基因tiaSl位于基因簇核苷酸序列第8508-7492個堿基處,長度為1017個堿基對,編碼 ⑶P-D-甘露糖4,6-脫水酶,338個氨基酸;tiaS2位于基因簇核苷酸序列第9742-8534個堿基處,長度為1209個堿基對,編碼 C-甲基轉移酶,402個氨基酸;tiaS3位于基因簇核苷酸序列第10785-9787個堿基處,長度為999個堿基對,編碼 ⑶P-甘露糖4,6-脫水酶,332個氨基酸;tiaS4位于基因簇核苷酸序列第21789-2^20個堿基處,長度為1032個堿基對,編碼 ⑶P-甘露糖4,6-脫水酶,343個氨基酸;tiaS5位于基因簇核苷酸序列第33022-34347個堿基處,長度為13 個堿基對,編碼糖 0-甲基轉移酶,441個氨基酸;tiaS6位于基因簇核苷酸序列第38882-40021個堿基處,長度為1140個堿基對,編碼 0-酰基轉移酶,379個氨基酸;tiaGl位于基因簇核苷酸序列第7441-6044個堿基處,長度為1398個堿基對,編碼糖基 轉移酶,465個氨基酸;tiaG2位于基因簇核苷酸序列第20351-21772個堿基處,長度為1422個堿基對,編碼糖 基轉移酶,473個氨基酸;3)2,4-二羥基-3,5- 二氯-6-乙基苯甲酸合成酶基因,即tiaE、tiaF、tiaB、tiaM共4 個基因tiaE位于基因簇核苷酸序列第14006-13260個堿基處,長度為747個堿基對,編碼II 型硫酯酶,248個氨基酸;tiaF位于基因簇核苷酸序列第14189-15220個堿基處,長度為1032個堿基對,編碼酰 基載體蛋白合成酶/縮合酶,343個氨基酸;tiaB位于基因簇核苷酸序列第15220-20349個堿基處,長度為5130個堿基對,編碼可 重復利用的聚酮合成酶,1709個氨基酸;tiaM位于基因簇核苷酸序列第37305-38789個堿基處,長度為1485個堿基對,編碼鹵 化酶,494個氨基酸;4)異丁酰基合成基因,即tiaC、tiaD共2個基因tiaC位于基因簇核苷酸序列第11219-12280個堿基處,長度為1062個堿基對,編碼支 鏈α酮酸脫氫酶的El α亞單元,353個氨基酸;tiaD位于基因簇核苷酸序列第12277-132Μ個堿基處,長度為978個堿基對,編碼支鏈 α酮酸脫氫酶的El β亞單元,325個氨基酸;5)甲基丙二酰輔酶A和乙基丙二酰輔酶A合成基因,即tiaJ、tiaK、tiaL、tiaN共4個 基因tiaj位于基因簇核苷酸序列第2716648398個堿基處,長度為1233個堿基對,編碼 3-羥乙酰基-輔酶A脫氫酶,410個氨基酸;tiaK位于基因簇核苷酸序列第28395-29759個堿基處,長度為1368個堿基對,編碼巴 豆酰基-輔酶A還原酶/羧化酶,454個氨基酸;tiaL位于基因簇核苷酸序列第29770-31200個堿基處,長度為1431個堿基對,編碼丙 酰-輔酶A羧化酶,476個氨基酸;tiaN位于基因簇核苷酸序列第82097-83296個堿基處,長度為1200個堿基對,編碼烯 酰-輔酶A水合酶/異構酶,399個氨基酸;6)環骨架后修飾基因,即tiaPl、tiaP2,共2個基因tiaPl位于基因簇核苷酸序列第3M79-31301個堿基處,長度為1179個堿基對,編碼細 胞色素P-450氧化酶,392個氨基酸;tiaP2位于基因簇核苷酸序列第41304-40105個堿基處,長度為1200個堿基對,編碼細 胞色素P-450氧化酶,399個氨基酸;7)調節、抗性和未知功能基因,即tial、tiaRl、tiaR2、tiaTl、tiaT2、tiaT3、tiaT4 共 7個基因tial位于基因簇核苷酸序列第26853-24502個堿基處,長度為2352個堿基對,編碼 ATP-依賴的DNA解螺旋酶,783個氨基酸;tiaRl位于基因簇核苷酸序列第34415-37186個堿基處,長度為2772個堿基對,編碼 LuxR家族轉錄調節因子,923個氨基酸;tiaR2位于基因簇核苷酸序列第88114-88527個堿基處,長度為414個堿基對,編碼 TetR家族轉錄調節因子,137個氨基酸;tiaTl位于基因簇核苷酸序列第24505-2^80個堿基處,長度為16 個堿基對,編碼膜 轉運蛋白,541個氨基酸;tiaT2位于基因簇核苷酸序列第83304-84590個堿基處,長度為1287個堿基對,編碼膜 轉運蛋白,4 個氨基酸;tiaT3位于基因簇核苷酸序列第85955-84642個堿基處,長度為1314個堿基對,編碼 NitT/TauT家族ABC轉運蛋白,437個氨基酸;tiaT4位于基因簇核苷酸序列第87757-86003個堿基處,長度為1755個堿基對,編碼 NitT/TauT家族ABC轉運蛋白,584個氨基酸。
2.權利要求1所述的臺勾霉素的生物合成基因簇在制備臺勾霉素及其類似物中的應用。
3.權利要求1所述的臺勾霉素的生物合成基因簇在制備2,4_二羥基-3,5-二氯-6-乙基苯甲酸及其類似物中的應用。
4.權利要求1所述的臺勾霉素的生物合成基因簇在制備脫氧甘露糖及其類似物中的 應用。
5.權利要求1所述的臺勾霉素的生物合成基因簇在制備臺勾霉素聚酮大環骨架及其 類似物中的應用。
全文摘要
本發明公開了一種臺勾霉素的生物合成基因簇及其應用。整個基因簇飽含31個基因聚酮合成酶基因,即tiaA1、tiaA2、tiaA3、tiaA4脫氧糖基的生物合成基因,即tiaS1、tiaS2、tiaS3、tiaS4、tiaS5、tiaS6、tiaG1、tiaG22,4-二羥基-3,5-二氯-6-乙基苯甲酸合成酶基因,即tiaE、tiaF、tiaB、tiaM異丁酰基合成基因,即tiaC、tiaD甲基丙二酰輔酶A和乙基丙二酰輔酶A合成基因,即tiaJ、tiaK、tiaL、tiaN環骨架后修飾基因,即tiaP1、tiaP2,共2個基因調節、抗性和未知功能基因,即tiaI、tiaR1、tiaR2、tiaT1、tiaT2、tiaT3、tiaT4。通過對上述生物合成基因進行遺傳改造可以得到臺勾霉素的結構類似物。本發明提供的基因及其蛋白可以用來尋找和發現可用于醫藥、工業或農業的化合物或基因、蛋白。
文檔編號C12P7/42GK102115757SQ20101059241
公開日2011年7月6日 申請日期2010年12月16日 優先權日2010年12月14日
發明者張光濤, 張海波, 張長生, 李蘇梅, 牛四文, 肖毅, 胡濤, 鞠建華 申請人:中國科學院南海海洋研究所
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 新昌县| 辽源市| 慈溪市| 大连市| 阿合奇县| 南通市| 竹溪县| 清水河县| 镇安县| 乌兰浩特市| 同德县| 永顺县| 镇巴县| 红原县| 竹溪县| 盖州市| 江门市| 静宁县| 尉犁县| 长顺县| 云梦县| 安乡县| 吴堡县| 博乐市| 大宁县| 务川| 江北区| 鄂托克旗| 图片| 根河市| 广元市| 普格县| 云林县| 湖州市| 仁布县| 荔浦县| 绥阳县| 县级市| 临沧市| 永修县| 香格里拉县|