麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

改進的2-脫氧-d-核糖-5-磷酸醛縮酶及其用于生產2,4,6-三脫氧己糖或其6-鹵...的制作方法

文檔序號:555108閱讀:493來源:國知局
專利名稱:改進的2-脫氧-d-核糖-5-磷酸醛縮酶及其用于生產2,4,6-三脫氧己糖或其6-鹵 ...的制作方法
技術領域
本發明涉及下述酶的經過分離的突變體,所述酶來自2-脫氧-D-核糖-5-磷酸醛縮酶野生型酶的組,所述野生型酶來自屬于由真核物種和原核物種構成的組的天然來源,此類野生型酶每種都具有特定的生產率因子(productivity factor),這是通過在由乙醛和氯乙醛的至少等摩爾混合物對6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(下文中也稱為CTeHP)的生產過程中進行DERA生產率因子檢驗測定的。在本文中,提高的生產率因子指下述變化的組合(且有利的)結果此類醛縮酶針對α-離去基團取代的乙醛和乙醛的抗性、催化活性和親和性方面的變化。測定所述生產率因子的方法被描述于本文實驗部分,在下文中將被稱為“DERA生產率因子檢驗”(下文中一些時候也稱為DPFT)。野生型酶是可從天然來源或環境樣品分離出的酶;此類酶的天然存在的突變體(即,也可從天然來源或環境樣品分離出的突變體,在本專利申請范圍內也被認為是野生型酶)。因此,對本專利申請而言,術語“突變體”僅用于表示,它們是通過對編碼野生型酶的DNA(核酸)進行有目的的突變,已從或正從野生型酶獲得的(通過隨機誘變,例如,在PCR協助下、或通過UV照射的手段;或通過定點突變,例如,通過PCR方法、飽和誘變等本領域技術人員公知的,可選地,采用此類突變的重組,例如,通過WO/010311所述的重組技術)。
在自然界中,2-脫氧-D-核糖-5-磷酸醛縮酶,例如,來自E.coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(DERA,EC 4.1.2.4)已知能以對映異構體選擇性方式催化乙醛和D-甘油醛-3-磷酸酯之間的(可逆)醛醇縮合反應,形成2-脫氧-D-核糖-5-磷酸酯。就本專利申請的目的而言,能以對映異構體選擇性方式催化該反應,或能對映異構體選擇性方式催化從α-離去基團取代的乙醛和乙醛的反應形成2,4,6-三脫氧己糖的任何酶都被認為具有DERA活性。
如,例如US-A-5,795,749所述,某些2,4,6-三脫氧己糖的合成可通過使用2-脫氧-D-核糖-5-磷酸醛縮酶作為對映異構體選擇性催化劑來完成。在所述方法中,使用乙醛和2-取代的乙醛作為反應物,通過4-取代的-3-羥基正丁醛中間產物來進行反應。因此,例如,按照Gijsen&Wong in JACS116(1994),8422頁所述,2-脫氧-D-核糖-5-磷酸醛縮酶可被用于合成半縮醛6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷的過程。如上所述,該半縮醛化合物在本文中也被稱為CTeHP。其在對某些(4R,6S)-2-(6-取代的-1,3-二氧雜環己烷-4-基)乙酸衍生物(本申請中其將被成為CtBDAc)(例如,其叔丁酯)的生產過程中是合適的中間產物。此類2,4,6-三脫氧己糖和6-鹵代或6-氰基取代的其衍生物,以及此類(4R,6S)-2-(6-取代的-1,3-二氧雜環己烷-4-基)乙酸衍生物,和可被認為與它們等同的其它化合物,在對具有降膽固醇性質或抗腫瘤性質的重要藥物產品組的生產中,是有價值的手性構建基材(building block)。此類藥物的重要例子是所謂的斯達汀(statin),例如,伐他汀(vastatin),瑞舒伐他汀(rosuvastatin)(Crestor_,AstraZeneca的商品名)或阿托伐他汀(atorvastatin)(Lipitor_,Pfizer的商品名)。斯達汀的其它例子是洛伐他汀(lovastatin)、西立伐他汀(cerivastatin)、辛伐他汀(simvastatin)、普伐他汀(pravastatin)和氟伐他汀(fluvastatin)。這些斯達汀通常已知作為所謂的HMG-CoA還原酶抑制劑發揮作用。此外,此類藥物化合物(或其中間產物)的多種衍生物也已知是人們有興趣的,例如,半縮醛6-氰基-2,4,6-三脫氧-D-赤六吡喃糖苷(在本申請中其被稱為CyTeHP),其可能是生產阿托斯達汀的替代性中間產物。
如WO 03/006656所述,US-A-5,795,749(上文所述)的酶催化的醛醇縮合的已知缺點是,生產能力低。因此WO 03/006656中成功地克服了此類生產能力低的問題,這是通過以相對高濃度的反應物來進行反應,以及通過優選使用來自E.coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(DERA,EC 4.1.2.4)組合α-氯乙醛作為乙醛之外的優選底物來實現的。
但是,如本發明的發明人在他們得到本發明的研究中所觀察到的,不幸的是,DERA酶迄今為止顯示出對醛類底物僅具有相當低的抗性(特別是對于乙醛,對于α-L-取代的乙醛甚至更顯著)。具體而言,如果離去基團L是氯的話,在有用于生物合成三脫氧己糖的濃度下,觀察到了DERA酶的非常高的失活。此外,如本發明的發明人所發現的,已知的2-脫氧-D-核糖-5-磷酸醛縮酶對氯乙醛底物看起來具有非常低的親和性和活性。就這些理由而言,事實上,需要相對大量的(昂貴的)DERA酶來獲得良好的合成反應產量。因此,人們非常需要找到具有提高的生產率因子(即,此類酶針對α-L-取代的乙醛和乙醛的抗性、催化活性的變化的組合結果應當是有利的)的DERA酶。當然,優選地,還應當提高向三脫氧己糖的合成路徑的生產能力。
應當注意到,W.A.Greenberg et al.,in PNAS,vol.101,p.5788-5793(2004)的近來文章描述了下述嘗試發現在DERA反應中具有提高的定體積生產率的野生型DERA酶,并且公開了來自一種未知來源的生物的野生型DERA的氨基酸序列。如下文將要討論的,該文章還描述了用于發現DERA酶的篩選方法的特定途徑。但是,作者主要關注底物抑制,而沒有真正解決DERA酶與(相對高)濃度的例如氯乙醛組合使用時固有的問題,即,酶的強烈失活。事實上,作者試圖通過以等同于底物被反應消耗的速率補充底物,來最小化底物抑制的問題。
如上所述,自然界中,2-脫氧-D-核糖-5-磷酸醛縮酶能以對映異構體選擇性方式催化乙醛和D-甘油醛-3-磷酸酯之間的(可逆)醛醇縮合反應,形成2-脫氧-D-核糖-5-磷酸酯。就本專利申請的目的而言,該天然反應,更準確地,其逆反應(即,2-脫氧-D-核糖-5-磷酸酯降解為乙醛和D-甘油醛-3-磷酸酯)將被用作為參照反應之一,以建立針對提供的突變體酶的抗性(即,穩定性)數據。因此,該降解反應在下文中被稱為DERA天然底物反應。但是,為評估突變體酶的生產率,除DERA天然底物反應之外,還將使用另外的檢驗分析反應,即,DERA生產率因子檢驗(DPFT),其用氯乙醛和乙醛作為底物。如前文所述,生產率表示活性、抗性(穩定性)和親和性的改變的組合(即,綜合(net))效果。
在本發明的上下文中,每種情況下,DERA突變體在所述DERA天然底物反應和/或DPFT反應中的抗性和生產率將與從中獲得突變體的野生型酶的相比,和/或將與E.coli K12 DERA(野生型DERA)相比。
優選地,在對兩種酶的特定生產率因子加以比較時,使用相同條件。“相同條件”表示,除了編碼兩種不同的酶的不同核酸序列之外,兩種DERA生產率因子檢驗之間,設置上沒有任何實質性不同。這意味著,例如溫度、pH、不含細胞的提取物(cfe)、氯乙醛和乙醛的濃度的參數,遺傳背景(例如表達系統,即表達載體和宿主細胞等)優選保持為一樣的。
在本文中,術語“提高的生產率因子”由此指,在本文實驗部分所述的標準檢驗條件下,抗性、催化活性和親和性改變的(有利)結果,尤其要考慮DPFT反應結果。本申請中使用的生產率因子因此更為準確地對應于CTeHP形成值。在DERA天然底物反應和/或DPFT反應中,根據本發明提供的DERA突變體比突變體來源的野生型DERA酶,和/或比E.coliK12 DERA至少高產10%。因此,在存在α-離去基團取代的乙醛和乙醛的情況下,它們具有實質上更好的抗性(即,在給定的時間段,它們的活性水平保持為更高的百分比),或者在天然底物DERA反應中通常實質上更具活性。
本發明還特別涉及一種方法,用于從2-脫氧-D-核糖-5-磷酸醛縮酶的組中篩選出下述野生型酶,在從乙醛和氯乙醛的至少等摩爾混合物對6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)的生產過程中,通過DERA生產率因子檢驗測定時,所述野生型酶的生產率因子比來自Escherichia coliK12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4)(具有SEQ ID NO.1野生型酶序列)的生產率因子高至少10%。
本發明還特別涉及一種方法,從2-脫氧-D-核糖-5-磷酸醛縮酶的組中篩選出下述突變體酶,在從乙醛和氯乙醛的至少等摩爾混合物對6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)的生產過程中,通過DERA生產率因子檢驗測定時,所述突變體酶的生產率因子比相應野生型酶的生產率因子高至少10%。更具體地,其還涉及一種方法,從2-脫氧-D-核糖-5-磷酸醛縮酶的組中篩選出下述酶,所述酶的生產率因子比來自Echerichiacoli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4)(具有SEQ ID NO.1野生型酶序列)的生產率因子高至少10%。SEQ ID NO.1的序列在下文序列表中<400>1下示出。
在本文中,術語“突變體(酶)”被用來包括下述突變體通過對編碼野生型DERA酶的DNA(核酸)進行遺傳工程改造,導致在編碼野生型DERA酶(例如,E.coli K12 DERA)的氨基酸序列中出現替換或取代、缺失、截短和/或插入而獲得的突變體,所述核酸序列例如SEQ IDNO.6(見序列表,<400>6下)的核酸,其編碼來自E.coli K12的野生型DERA酶。
本發明還將涉及經過分離的核酸,其編碼上述突變體2-脫氧-D-核糖-5-磷酸醛縮酶,當與獲得突變體的野生型DERA酶相比,和/或與E.coliK12 DERA相比時,所述突變體酶具有更高的和提高的生產率因子;本發明還涉及包含此類經過分離的核酸的載體,所述核酸編碼根據本發明的突變體2-脫氧-D-核糖-5-磷酸醛縮酶;涉及包含此類核酸和/或載體的宿主細胞。
最后,本發明還涉及對前文提到的藥物產品或其衍生物和中間產物的改進合成方法,這是通過使用根據本發明的突變體2-脫氧-D-核糖-5-磷酸醛縮酶,或通過使用編碼此類突變體的核酸,或通過使用包含此類核酸的載體,或通過使用包含此類核酸和/或載體的宿主細胞來實現的。
經過詳細研究后,本發明的發明人已發現,已可獲得大量的突變體DERA酶,在用于生產6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)時,所述酶具有提高的生產率因子。即,本發明的發明人已發現,可從屬于由真核物種和原核物種構成的組的天然來源獲得下述酶的經過分離的突變體,所述酶來自2-脫氧-D-核糖-5-磷酸醛縮酶野生型酶的組,所述野生型酶每種都具有特定的生產率因子,這是通過在由乙醛和氯乙醛的至少等摩爾混合物對CTeHP的生產過程中進行DERA生產率因子檢驗測定的,其中,所述經過分離的突變體具有比從中獲得突變體的相應野生型酶的生產率因子高至少10%的生產率因子,并且其中,突變體和相應野生型酶兩者的生產率因子都是在相同條件下測量的。
根據本發明的、來自2-脫氧-D-核糖-5-磷酸醛縮酶野生型酶的組的酶的經過分離的突變體可從來自真核生物來源的DERA獲得,或者更優選地,可從原核生物來源的DERA獲得。當DERA來自真核生物來源時,它們是從含有由膜束縛的細胞核和細胞器的一種或多種真核細胞構成的生物體獲得的。真核細胞,例如,可以是來自人、動物(例如,小鼠)、植物和真菌以及來自被統稱為“原生生物界(Protista)”的其它組的細胞。合適的DERA,例如,可從屬于后生生物界(Metazoa)的真核來源獲得,即,從海綿和原生動物之外的動物獲得,例如,從線蟲、節肢動物和脊椎動物獲得,例如,來自Caenorhabditis elegans、Drosophila melanogaster、Mus musculus和Homo sapiens。
但是,更優選地,根據本發明的經過分離的突變體DERA來自原核生物來源,即,來自沒有細胞核的單細胞生物,通常屬于古生菌(Archaea,包含Crenarchaeota和Euryarchaeota門)和細菌界。
對從中獲得根據本發明的合適的DERA突變體的、屬于古生菌界的物種的系統發育樹的調查展示于表1中。最優選地,根據本發明得經過分離的突變體DERA來自細菌來源。對從中獲得根據本發明的合適的DERA突變體的、屬于古生菌界的物種的系統發育樹的調查展示于表1中。表1和表2中,GI代表用于從NCBI Entrez瀏覽器獲取氨基酸序列的通用標識符;GI之后的數字可被用于訪問野生型DERA的氨基酸序列和編碼所述氨基酸序列的核酸序列,例如,通過在可由下述站點/搜索引擎NCBI(http://www.ncbi.nlm.nih.gov)訪問的數據庫中使用這些數字來訪問。
本領域技術人員知道,通過本身已知的方法,在蛋白質和核酸數據庫中,例如使用上述站點/搜索引擎,可以容易地發現除了表1和標2中所提到的那些之外的野生型DERA氨基酸序列和編碼這些野生型DERA的核酸序列。
在細菌界中,突變體DERA最優選基于來自Proteobacteria門的野生型DERA,其中,更具體地,來自Gamma-proteobacteria綱,尤其是來自Enterobacteriaceae科所屬于的Enterobacteriales目。所述科包括Escherichia等屬。
因此,用于本發明上下文的合適的突變體DERA,例如可通過對編碼來自下述原核生物來源的野生型酶的DNA進行有目的的突變來獲得,所述原核生物來源被概括于表3中,其排列順序大致為與Escherichia coliK12的相同性百分比升序(從大約20%的相同性至大約100%的相同性)。
表1古生菌
表2細菌
表2(續)細菌
表3用于合適的突變體的原核生物來源Thermoplasma volcanium、Thermoplasma acidophilum、Aeropyrumpernix、Aquifex aeolicus、Sinorhizobium meliloti、Oceanobacillusiheyensis,、Pyrobaculum aerophilum、Thermococcus kodakaraensis、Lactobacillus plantarum、Methanothermobacter thermoautotrophicus、Mycoplasma pneumoniae、Mycoplasma pirum、Mycoplasma genitalium、Mycoplasma hominis、Mycoplasma pulmonis、Thermotoga maritima、Synechocystis sp.PCC 6803、Treponema pallidum、Streptococcus pyogenes、Streptococcus pneumoniae、Nostoc sp.PCC 7120、Halobacterium sp.NRC-1、Haemophilus influenzae、Haemophilus ducreyi、Yersinia pestis、Ureaplasma parvum、Staphylococcus aureus subsp.aureus Mu50、respectively subsp.aureus MW2、Staphylococcus epidermidis、Pasteurellamulticoda、Mycobacterium tuberculosis、Mycobacterium leprae、Lactococcus lactis subsp.lactis、Enterococcus faecalis、Corynebacteriumglutamicum、Thermoanaerobacter tengcongensis、Bacillus subtilis、Bacillushalodurans、Bacillus cereus、Bacillus anthracis菌株Ames、Listeriainnocua、Listeria monocytogenes、Clostridium perfringens、Clostridiumacetobutylicum、W.A.Greenberg et al.in PNAS,vol.101,p.5788-5793(2004)的文章中提到的環境樣品、Deinococcus radiodurans、Pseudomonassyringae、Streptomyces coelicolor、Agrobacterium tumefaciens strain C58、Burkholderia mallei、Burkholderia pseudomallei、Chromobacteriumviolaceum、Shewanella oneidensis、Vibrio cholerae、Vibrio vulnificus、Vibrio parahaemolyticus、Photorhabdus luminescens、Salmonella typhi、Salmonella typhimurium、Shigella flexneri、Escherichia coli O157:H7、Escherichia coli CFT073、Escherichia coli K12。
根據本發明獲得的、用于比較突變體的特定生產率因子的非常合適的野生型參照DERA是來自Escherichia coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4),其從N-末端到C-末端具有SEQ ID NO.1的野生型酶序列
1020 30 40 50 60MTDLKASSLR ALKLMDLNTL NDDDTDEKVI ALCHQAKTPV GNTAAICIYP RFIPIARKTL7080 90100110120KEQGTPEIRI ATVTNFPHGN DDIDIALAET RAAIAYGADE VDVVFPYRAL MAGNEQVGFD130 140150160170180LVKACKEACA AANVLLKVII ETGELKDEAL IRKASEISIK AGADFIKTST GKVAVNATPE190 200210220230240SARIMMEVIR DMGVEKTVGF KPAGGVRTAE DAQKYLAIAD ELFGADWADA RHYRFGASSL250 259LASLLKALGH GDGKSASSY因此,本發明還涉及下述酶的經過分離的突變體,所述酶來自2-脫氧-D-核糖-5-磷酸醛縮酶野生型酶的組,所述野生型酶來自屬于由真核物種和原核物種構成的組的天然來源,此類野生型酶每種都具有特定的生產率因子,這是通過在由乙醛和氯乙醛的至少等摩爾混合物對6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)的生產過程中進行DERA生產率因子檢驗測定的,其中,經過分離的突變體具有比突變體來源的相應野生型酶的生產率因子高至少10%的生產率因子,并且其中,突變體和相應野生型酶兩者的生產率因子都是在相同條件下測量的,并且其中,經過分離的突變體具有比來自Escherichia coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4)(具有SEQ ID NO.1的野生型酶序列)的生產率因子高至少10%的生產率因子,并且其中,突變體和Escherichia coli K12酶兩者的生產率因子都是在相同條件下測量的。
應當注意,E.coli K12(W3110)DERA酶的野生型序列(259個氨基酸;SEQ ID NO.1),以及編碼所述DERA酶的核苷酸序列(780個核苷酸,SEQ ID NO.6,見序列表),已由P.Valentin-Hansen et al.在“Nucleotide sequence of the deoC gene and the amino acid sequence of theenzyme”,Eur.J.Biochem.125(3),561-566(1982)中進行了描述。
DeSantis et al.,2003,Bioorganic&Medicinal Chemistry 11,pp 43-52公開了對來自E.coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4)進行的五處定點突變的設計,所述突變位于E.coli DERA的磷酸酯結合袋中K172E、R207E、G205E、S238D和S239E。這些突變體DERA酶中,S238D和S239E顯示出較之野生型酶,其針對非磷酸化的天然底物(2-脫氧-D-核糖)具有更高的活性。US 2003/0232416中也公開了E.coli的2-脫氧-D-核糖-5-磷酸醛縮酶的這些同樣的突變體。
本發明的發明人已經發現,在以缺省設置(矩陣Gonnet 250;GAPOPEN10;END GAPS10;GAP EXTENSION0.05;GAPDISTANCES8),使用ClustalW,版本1.82 http://www.ebi.ac.uk/clustalw多序列比對進行的序列比對研究中,可被用于獲得根據本發明的經過分離的突變體的、真核和原核生物來源的DERA與來自Escherichia coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4)的SEQ ID NO.1的野生型酶序列的相同性百分比可在很寬的范圍內變化。甚至在大約20%的相同性百分比處,仍能發現非常合適的、可用作為獲得本發明突變體的起始點的DERA。
發明人已發現,當與SEQ ID NO.1的野生型酶序列比較時,可用于本發明的所有DERA(以及由其獲得的突變體)都共同具有至少八個保守的氨基酸,即,F76、G79、E100、D102、K167、T170、K201和G204。因此,下文所述的所有突變都發生于不同于這些保守位點的位點。可能注意到,按照Heine et al.in“Observation of covalent intermediates in an enzymemechanism at atomic resolution”,Science 294,369-374(2001),K167是重要的活性位點賴氨酸,其與乙醛形成Schiff堿中間產物;K201和D102涉及“激活”K167的催化性質子傳遞(proton relay)系統。其它五個殘基迄今還未被描述為保守的,或對于例如底物識別或催化來說重要的。
優選地,經過分離的突變體DERA具有比突變體來源的相應野生型酶的生產率因子高至少10%的生產率因子。所述生產率因子比相應野生型酶優選高至少20%,更優選至少30%,進一步更優選至少40%,進一步更優選至少50%,更優選至少100%,進一步更優選至少200%,進一步更優選至少500%,進一步更優選至少1000%,進一步更優選至少1500%。
更優選地,經過分離的突變體DERA具有比E.coli K12 DERA的生產率因子高至少10%的生產率因子。所述生產率因子比E.coli K12 DERA優選高至少20%,更優選至少30%,進一步更優選至少40%,進一步更優選至少50%,更優選至少100%,進一步更優選至少200%,進一步更優選至少500%,進一步更優選至少1000%,進一步更優選至少1500%。
已被發現為非常有用于目標反應的、一組非常重要的經過分離的突變體是來自Escherichia coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC4.1.2.4)(具有SEQ ID NO.1野生型酶序列)的經過分離的突變體。這些經過分離的突變體DERA具有比SEQ ID NO.1的酶序列的生產率因子高至少10%的生產率因子。所述生產率因子比SEQ ID NO.1的酶序列優選高至少20%,更優選至少30%,進一步更優選至少40%,進一步更優選至少50%,以及進一步更優選至少100%,進一步更優選至少200%,進一步更優選至少500%,進一步更優選至少1000%,進一步更優選至少1500%。
本發明的發明人已發現,非常合適的經過分離的突變體DERA是這樣獲得的,其中,突變體在SEQ ID NO.1的K13、T19、Y49、N80、D84、A93、E127、A128、K146、K160、I166、A174、M185、K196、F200或S239位點,或與之對應的位點中的一處或多處,優選地,在位點F200或與之相對應的位點,具有至少一種氨基酸取代,和/或在SEQ ID NO.1的位點S258或Y259的至少一個氨基酸缺失,可選地,組合C-末端延伸,優選地,延伸為片段TTKTQLSCTKW(SEQ ID NO.2)和KTQLSCTKW(SEQ ID NO.3)之一;和/或組合N-末端延伸。
編碼SEQ ID NO.2的核酸序列的一種例子被給為SEQ ID NO.7。編碼SEQ ID NO.3的核酸序列的一種例子被給為SEQ ID NO.8。
在本發明的一種實施方式中,可通過對在SEQ ID NO.1中的上述位點或其對應位點之一,例如,在F200位點(或對應位點)進行飽和誘變來進行定點突變。飽和誘變指,氨基酸被每種可能的蛋白質原氨基酸所取代,例如,被丙氨酸、精氨酸、天冬氨酸、天冬酰胺、半胱氨酸、谷氨酸、谷氨酰胺、甘氨酸、組氨酸、異亮氨酸、亮氨酸、賴氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、絲氨酸、蘇氨酸、色氨酸、酪氨酸或纈氨酸所取代,例如,通過產生變體酶文庫來進行,其中,每種變體在SEQ ID NO.1的第200位含有特定的氨基酸交換。優選地,飽和誘變是通過用每種可能的核酸三體去替換編碼氨基酸的核酸三體來進行的,例如,按照實施例4所述。因此,這些突變體在上述位置中的一處或多處具有不同于SEQ IDNO.1(或按照上述ClustalW程序發現的相同性百分比與其相對應的、來自另一種天然來源的任何其它野生型酶的氨基酸序列)的序列,而仍具有至少八個保守氨基酸,即上述F76、G79、E100、D102、K167、T170、K201和G204。因此,“相應突變”被用來表示這些突變發生于特定的“相應野生型酶的氨基酸序列”(即,具有DERA活性的酶的序列)中。
通過以缺省設置(矩陣Gonnet 250;GAP OPEN10;ENDGAPS10;GAP EXTENSION0.05;GAP DISTANCES8),運行ClustalW,版本1.82多序列比對(http://www.ebi.ac.uk/clustalw),可鑒定出野生型或突變的蛋白序列中,對應于E.coli K12 DERA野生型氨基酸序列(SEQ ID NO.1)中氨基酸殘基位點的氨基酸殘基。此類比對中,被放置于與E.coli K12野生型DERA序列(SEQ ID NO.1給出的)的氨基酸殘基同一列的氨基酸殘基被確定為與E.coli K12野生型DERA(SEQ IDNO.1)的該個別氨基酸殘基對應的位點。
本文中使用的序列以及其中不同位點中的氨基酸被表示為它們的單字母編碼(分別地,表示為它們的三字母編碼),如下所示
可按照不同性質對上面列出的氨基酸加以分類,這對于序列特定位點可能是重要的。例如,一些氨基酸屬于帶正電荷的氨基酸的類,即,尤其是賴氨酸、精氨酸和組氨酸。另一類氨基酸是親水性氨基酸,由絲氨酸、蘇氨酸、半胱氨酸、谷氨酰胺和天冬酰胺構成。疏水性氨基酸是異亮氨酸、亮氨酸、甲硫氨酸、纈氨酸、苯丙氨酸和酪氨酸。還有一類芳香族氨基酸,即,苯丙氨酸、酪氨酸和色氨酸。另有一種可能,將氨基酸按照其大小分類以大小減少的順序,氨基酸可被列為W>Y>F>R>K>L,I>H>Q>V>E>T>N>P>D>C>S>A>G。
因此,要求保護的每種突變體將與其來源的野生型序列相比。這意味著,僅當下述標準中的至少前兩條滿足時,根據本發明的突變體才可被認為是突變體(a)突變應當對應于針對E.coli K12示出的突變之一;(b)突變在突變體來源的野生型酶中不存在;(c)至少八個保守氨基酸,即F76、G79、E100、D102、K167、T170、K201和G204仍存在于對應位點上。
最優選地,根據本發明的經過分離的突變體DERA具有在SEQ IDNO.1中進行的下述氨基酸取代或對應于這些取代的取代中的至少一種,所述氨基酸取代選自由下述取代構成的組a.K13和/或K196被帶正電荷氨基酸替換,優選地,被R或H替換;b.T19和/或M185被另一種氨基酸替換,優選地,被選自由下述組的另一種氨基酸所替換,所述組由親水氨基酸和/或疏水氨基酸構成,其中,親水氨基酸特別是由S、T、C、Q和N構成的,疏水氨基酸特別是由V、L和I構成的;c.Y49被選自由F和W構成的組的芳香族氨基酸所取代;d.N80和/或I166和/或S239被選自由T、S、C、Q和N構成的親水氨基酸組的另一種氨基酸替換;e.D84和/或A93和/或E127被選自下述小氨基酸組的另一種、優選更小的氨基酸所替換,所述組由按照大小降序的E、T、N、P、D、C、S、A和G構成;f.A128和/或K146和/或K160和/或A174和/或F200被選自由L、M、V、F和Y構成的疏水氨基酸組的另一種氨基酸所替換;和/或在SEQ ID NO.1的S258和Y259位點,或與之對應的位點處,至少一個氨基酸的缺失,可選地,組合C-末端延伸,優選地,延伸為片段TTKTQLSCTKW(SEQ ID NO.2)和KTQLSCTKW(SEQ ID NO.3)之一;和/或組合N-末端延伸。
在本發明的一種實施方式中,在本發明的經過分離的突變體中,可通過缺失至少一個氨基酸殘基來截短C-末端,例如,通過缺失S258和/或Y259或與之對應的位點,然后延伸C-末端,優選地,通過片段TTKTQLSCTKW(SEQ ID NO.2)和KTQLSCTKW(SEQ ID NO.3)之一來延伸。
為清楚之故,短句“在SEQ ID NO.1中進行的氨基酸取代或對應于這些取代的取代”指,這些取代是SEQ ID NO.1中的取代,或是在并非E.coli K12的野生型序列中,在對應于E.coli中上述編號位點的位點發生的取代。
最優選地,經過分離的突變體DERA具有SEQ ID NO.1中的下述突變或對應于這些突變的突變中的一種或多種,所述突變選自下述組K13R、T19S、Y49F、N80S、D84G、A93G、E127G、A128V、K146V、K160M、I166T、A174V、M185T、M185V、K196R、F200I、F200M、F200V、S239C、ΔS258、ΔY259、TTKTQLSCTKW(SEQ ID NO.2)的C-末端延伸和KTQLSCTKW(SEQ ID NO.3)的C末端延伸。
在本文中,SEQ ID NO.1中氨基酸位點編號前的單字母編碼表示存在于所述野生型E.coli酶中的氨基酸,SEQ ID NO.1中氨基酸位點編號之后的單字母編碼表示存在于突變體中的氨基酸。氨基酸位點編號反映了SEQID NO.1的DERA中的位點編號,以及來自其它來源的其它DERA野生型中與之對應的任何位點。
更具體地,經過分離的突變體DERA具有SEQ ID NO.1中的下述兩種突變或對應于這兩種突變的突變,所述突變選自下述組F200I和ΔY259、F200M和ΔY259、F200V和ΔY259、F200I和KTQLSCTKW(SEQ ID NO.3)的C末端延伸、F200M和KTQLSCTKW(SEQ ID NO.3)的C末端延伸以及F200V和KTQLSCTKW(SEQ ID NO.3)的C末端延伸。
本發明還涉及一種方法,用于從2-脫氧-D-核糖-5-磷酸醛縮酶的組中篩選出下述野生型酶,在從乙醛和氯乙醛的至少等摩爾混合物對6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)的生產過程中,通過DERA生產率因子檢驗測定時,所述野生型酶的生產率因子比來自Escherichia coliK12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4)(具有SEQ ID NO.1野生型酶序列)的生產率因子高至少10%,其中(A)依次地,(i)分離總和/或基因組DNA和/或cDNA;(ii)制備所述經過分離的DNA的表達文庫,所述文庫由包含所述經過分離的DNA的個體克隆構成;(iii)將來自獲得的表達文庫的個體克隆與底物乙醛和氯乙醛的混合物一起培養;(iv)分離出來自下述一種或多種克隆的一種或多種基因,所述克隆顯示能將這些底物轉化為4-氯-3-(S)-羥基-丁醛(CHBA)和/或6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP),將所述一種或多種基因再克隆進與SEQ ID NO.16同樣的遺傳背景;
以及,其中(B)表達步驟(iv)中獲得的再克隆的基因編碼的DERA酶,通過DERA生產率因子檢驗的方法對其加以檢驗,由此獲得針對每種此類野生型酶的生產率因子;以及,其中(C)將來自步驟(B)的針對這些野生型酶的生產率因子與來自Escherichia coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4)(具有SEQ ID NO.1野生型酶序列)的生產率因子相比較,選出編碼下述DERA酶的一種或多種基因并進行分離,所述DERA酶在所述比較中具有至少高10%的生產率因子。
如上文中步驟(i)所示的對總和/或基因組DNA和/或cDNA的分離可以,例如從微生物或從環境樣品,例如土壤和水來進行。步驟(ii)中制備的經過分離的DNA的表達文庫由個體克隆構成,所述克隆包含所述經過分離的DNA,所述DNA編碼一種或多種不同的酶。上述步驟(iii)中所述的與乙醛和氯乙醛的混合物一起培養,可用下述混合物來進行,所述混合物中上述底物分子比例范圍較寬,例如,0.2∶1至5∶1。將清楚對這些底物向4-氯-3-(S)-羥基-丁醛(CHBA)和/或6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)的轉化的定量評估,已可提供對來自步驟(ii)表達文庫的個體克隆中存在的基因的有效性的第一種指示。
因此,在此階段,可對編碼DERA酶的多種基因的活性建立一些排序。這種評估允許分離出最有前途的基因。但是,鑒于篩選方法的最終目的是發現下述(野生型)DERA,即在從乙醛和氯乙醛的至少等摩爾混合物對6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)的生產過程中,通過DERA生產率因子檢驗測定時,所述DERA的生產率因子比來自Escherichia coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶的生產率因子高至少10%,因此,這些選出的基因,或其中理想的更小數量,被分離出來并被再克隆進與SEQ ID NO.6相同的遺傳背景。該步驟確保了待檢驗的酶以與來自Escherichia coli K12的野生型DERA酶的表達可相比較的方式正確表達。通過DPFT的方法進行篩選和檢驗,并與來自Escherichia coli K12的野生型DERA酶的DPFT結果進行正確比較之后,非常容易找到合適的野生型DERA,例如,接著可被用作為獲得根據本發明的突變體的起始點的那些DERA。
此外,本發明涉及一種方法,從2-脫氧-D-核糖-5-磷酸醛縮酶的組中篩選出下述突變體酶,在從乙醛和氯乙醛的至少等摩爾混合物對6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)的生產過程中,通過DERA生產率因子檢驗測定時,所述突變體酶的生產率因子比相應野生型酶的生產率因子高至少10%,或比來自Escherichia coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4)(具有SEQ ID NO.1野生型酶序列)的生產率因子高至少10%。在所述方法中,(A)依次地,(i)用本身已知的手段,對編碼野生型2-脫氧-D-核糖-5-磷酸醛縮酶的基因進行突變,并將其克隆進與編碼E.coli K12 DERA的基因(具有SEQ ID NO.6)相同的遺傳背景,分別克隆進與突變體來源的相應野生型基因相同的遺傳背景,由此獲得克隆的表達文庫,所述克隆來自由此制備的突變體;以及,其中(B)表達克隆中的DERA酶,通過DERA生產率因子檢驗的方法對其加以檢驗,由此獲得針對每種突變體酶的生產率因子;以及,其中(C)將針對突變體酶的生產率因子與相應野生型酶的生產率因子,或與來自Escherichia coliK12的野生型酶(EC 4.1.2.4)(具有SEQ ID NO.1)的生產率因子相比較,選出編碼下述DERA突變體的一種或多種基因并進行分離,所述DERA突變體在分別的比較中具有至少高10%的生產率因子。
更具體地,本發明涉及一種方法,其中,(A)依次地,(i)用本身已知的手段,對編碼野生型2-脫氧-D-核糖-5-磷酸醛縮酶的基因進行突變,并將其克隆進與E.coli K12 DERA相同的遺傳背景,分別克隆進與突變體來源的相應野生型基因相同的遺傳背景,由此獲得克隆的表達文庫,所述克隆來自由此制備的突變體;(ii)將來自獲得的表達文庫的個體克隆與底物乙醛和氯乙醛的混合物一起培養;(iii)選出下述一種或多種克隆,所述克隆顯示了將這些底物轉化為4-氯-3-(S)-羥基-丁醛(CHBA)和/或6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)的最高轉化率;(B)表達從步驟(iii)選出的克隆中的DERA基因,通過DERA生產率因子檢驗的方法對其加以檢驗,由此獲得針對每種突變體酶的生產率因子;以及,(C)將針對篩選出的突變體酶的生產率因子與相應野生型酶的生產率因子,或與來自Escherichia coli K12的野生型酶(EC 4.1.2.4)(具有SEQID NO.1)的生產率因子相比較,選出編碼下述DERA突變體的一種或多種基因并進行分離,所述DERA突變體在分別的比較中具有至少高10%的生產率因子。
上述第二種類型的突變體篩選,是從已知編碼野生型2-脫氧-D-核糖-5-磷酸醛縮酶的基因(例如,使用根據本發明篩選野生型DERA酶的方法獲得的),或是從編碼,例如,表1或2提到的DERA酶的基因開始的。首先用本身已知的手段對這些基因進行突變,并將其克隆進與E.coli K12DERA相同的遺傳背景,分別克隆進與突變體來源的相應野生型基因相同的遺傳背景。所述基因,例如,可從微生物或從環境樣品,例如土壤或水來獲得。前述突變和克隆產生了來自由此制備的突變體的克隆的表達文庫。事實上,如本領域技術人員所公知的,此類表達文庫可通過如下方法來制備依次地,制備突變體的DNA文庫,將每種個體DNA克隆進載體,將載體轉入合適的表達宿主。上述步驟(ii)中所述的與乙醛和氯乙醛的混合物一起培養,可用下述混合物來進行,所述混合物中上述底物分子比例范圍較寬,例如,0.2∶1至5∶1。接著,對這些底物向4-氯-3-(S)-羥基-丁醛(CHBA)和/或6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)的轉化的定量評估,可提供對這些底物向4-氯-3-(S)-羥基-丁醛(CHBA)和/或6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)的轉化程度的第一種排序,展示出最高轉化率的克隆中的一種或多種可被選出,用于通過DPFT手段進行進一步的評價。無須說明,待檢驗酶的正確表達應被確保,使得檢驗結果可以很容易地與針對來自Escherichia coli K12的野生型DERA酶表達的結果,分別針對突變體來源的相應野生型基因的結果進行比較。用這種方式,非常容易找到并分離隨后可合適地用于對有價值的藥物產品(例如,斯達汀)進行商業生產的、編碼突變體DERA的合適基因。
應當注意到,上文所述的篩選方法不同于前面提到的W.A.Greenberget al.,in PNAS,vol.101,p.5788-5793(2004)所用的。所述文章的作者使用了熒光探測試驗,這是R.Pérez Carlón et al.in Chem.Eur.J.,6,p.4154-4162(2000)已描述過的。所述探測試驗是非常間接的方法,其中,通過2-脫氧-D-核糖底物的熒光傘形酮來確定DERA活性。但是,所述方法不太適合(因為,需要額外的試驗,用于測定用被取代的醛進行的目標反應中的目標活性)用于在從乙醛和氯乙醛的至少等摩爾混合物對6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)的生產過程中來測定DERA生產率(以及活性),因為,首先,僅獲得了展示出非常類似于DERA天然底物反應的逆醛醇縮合反應的酶,在額外的、第二次篩選中針對目標反應來對它們進行檢驗。為克服此類問題,本發明的發明人開發了他們自己的、直接的篩選方法,并且還開發了所謂的DERA生產率因子檢驗。
合適地,在針對第一步中突變體的所述篩選中,對編碼野生型2-脫氧-D-核糖-5-磷酸醛縮酶的基因加以突變,所述基因來自表1、2和3中示出的來源之一。
本發明因此還涉及可通過上述篩選方法中的任何方法獲得的經過分離的核酸,特別是可通過下述篩選方法獲得的,所述方法被應用于編碼下述野生型2-脫氧-D-核糖-5-磷酸醛縮酶的基因,所述來自表1、2和3中示出的來源之一。
本發明還涉及編碼突變體2-脫氧-D-核糖-5-磷酸醛縮酶的經過分離的核酸,其中,所述經過分離的核酸編碼下述突變體,其中,所述經過分離的突變體具有比從中獲得突變體的相應野生型酶的生產率因子高至少10%的生產率因子,并且其中,突變體和相應野生型酶兩者的生產率因子都是在相同條件下測量的。
此外,還涉及編碼突變體2-脫氧-D-核糖-5-磷酸醛縮酶的經過分離的核酸,其中,所述經過分離的核酸編碼下述突變體,其中,經過分離的突變體具有比突變體來源的相應野生型酶的生產率因子高至少10%的生產率因子,以及其中,突變體和相應野生型酶兩者的生產率因子都是在相同條件下測量的,以及其中,經過分離的突變體具有比來自Escherichia coliK12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4)(具有SEQ ID NO.1的野生型酶序列)的生產率因子高至少10%的生產率因子,以及其中,突變體和Escherichia coli K12酶兩者的生產率因子都是在相同條件下測量的。
此外,本發明還涉及編碼下述突變體的經過分離的核酸,所述突變體來自Escherichia coli K12(EC 4.1.2.4)(具有SEQ ID NO.1的野生型酶序列)。此外,本發明還涉及下述經過分離的核酸,其編碼突變體2-脫氧-D-核糖-5-磷酸醛縮酶,所述酶在SEQ ID NO.1的K13、T19、Y49、N80、D84、A93、E127、A128、K146、K160、I166、A174、M185、K196、F200或S239位點,或與之對應的位點中的一處或多處,優選地,在位點F200或與之相對應的位點,具有至少一種氨基酸取代,和/或在SEQ ID NO.1的位點S258或Y259或與之相對應的位點,具有至少一個氨基酸缺失,可選地,組合C-末端延伸,優選地,延伸為片段TTKTQLSCTKW(SEQ ID NO.2)和KTQLSCTKW(SEQ ID NO.3)之一;和/或組合N-末端延伸。
優選地,所述經過分離的核酸編碼下述突變體2-脫氧-D-核糖-5-磷酸醛縮酶,所述酶具有在SEQ ID NO.1中進行的下述氨基酸取代或對應于這些取代的取代中的至少一種,所述氨基酸取代選自由下述取代構成的組a.K13和/或K196被帶正電荷氨基酸替換,優選地,被R或H替換;b.T19和/或M185被另一種氨基酸替換,優選地,被選自由下述組的另一種氨基酸所替換,所述組由親水氨基酸和/或疏水氨基酸構成,其中,親水氨基酸特別是由S、T、C、Q和N構成的,疏水氨基酸特別是由V、L和I構成的;c.Y49被選自由F和W構成的組的芳香族氨基酸所取代;d.N80和/或I166和/或S239被選自由T、S、C、Q和N構成的親水氨基酸組的另一種氨基酸替換;e.D84和/或A93和/或E127被選自下述小氨基酸組的另一種、優選更小的氨基酸所替換,所述組由按照大小降序的E、T、N、P、D、C、S、A和G構成;f.A128和/或K146和/或K160和/或A174和/或F200被選自由L、M、V、F和Y構成的疏水氨基酸組的另一種氨基酸所替換;
和/或在SEQ ID NO.1的S258和Y259位點,或與之對應的位點處,至少一個氨基酸的缺失,可選地,組合C-末端延伸,優選地,延伸為片段TTKTQLSCTKW(SEQ ID NO.2)和KTQLSCTKW(SEQ ID NO.3)之一;和/或組合N-末端延伸。
最優選地,根據本發明的經過分離的核酸編碼下述突變體2-脫氧-D-核糖-5-磷酸醛縮酶,所述酶具有SEQ ID NO.1中的下述突變或對應于這些突變的突變中的一種或多種,所述突變選自下述組K13R、T19S、Y49F、N80S、D84G、A93G、E127G、A128V、K146V、K160M、I166T、A174V、M185T、M185V、K196R、F200I、F200V、F200M和S239C,和/或在SEQ ID NO.1的ΔS258和ΔY259位點,或與之對應的位點處,至少一個氨基酸的缺失,可選地,組合片段TTKTQLSCTKW(SEQ ID NO.2)和KTQLSCTKW(SEQ ID NO.3)之一的C末端延伸。
更具體地,根據本發明的經過分離的核酸編碼下述突變體2-脫氧-D-核糖-5-磷酸醛縮酶,所述酶具有SEQ ID NO.1中的下述兩種突變或對應于這兩種突變的突變,所述突變選自下述組F200I和ΔY259、F200M和ΔY259、F200V和ΔY259、F200I和KTQLSCTKW(SEQ ID NO.3)的C末端延伸、F200M和KTQLSCTKW(SEQ ID NO.3)的C末端延伸以及F200V和KTQLSCTKW(SEQ ID NO.3)的C末端延伸。
此外,本發明涉及包含上述此類核酸中任何核酸的載體,以及涉及包含下述突變體的宿主細胞,所述突變體來自前述2-脫氧-D-核糖-5-磷酸醛縮酶野生型酶的組,或者涉及可根據前述篩選方法獲得的此類突變體酶,和/或宿主細胞,其包含前文所述的經過分離的核酸和/或包含前述載體。
本發明還涉及一種方法,用于制備突變體2-脫氧-D-核糖-5-磷酸醛縮酶,所述酶的生產率因子比相應野生型酶的生產率因子和/或來自Escherichia coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4)(具有SEQ ID NO.1野生型酶序列)的生產率因子高至少10%,其中,使用如前文所述的核酸,或如前文所述的載體,或前述宿主細胞。
本發明還涉及一種改進方法,用于生產結構式1的2,4,6-三脫氧己糖或2,4-二脫氧己糖, 其中,R1和Rx每種獨立代表H或保護基團,其中,X代表鹵素;甲苯磺酸(tosylate)基;甲磺酸(mesylate)基;酰氧基;苯乙酰氧基;烷氧基或芳氧基,所述生產是從乙醛和結構式為HC(O)CH2X的相應被取代的乙醛來生產的,其中,X如上文所定義,其中使用根據本發明的、或根據本發明的方法生產的、或可由根據本發明的篩選突變體酶的方法獲得的突變體酶,以及其中,R1和/或Rx代表保護基團的情況下,形成的化合物中的羥基以本身已知的方式被保護基團保護。
優選地,X代表鹵素,更優選地,Cl、Br或I;或者代表酰氧基,更優選地,乙酰氧基。
在上述反應中,可使用本領域中針對用野生型DERA酶進行的反應所述的反應條件,來利用突變體DERA酶,例如,使用US 5,795,749,例如其中第4欄第1-18行中所述的反應條件,或例如使用W.A.Greenberg etal.,PNAS,vol.101,pp 5788-5793,(2004)所述的補料分批反應條件。
優選地,使用WO03/006656中所述的條件,來在上述反應中使用本發明的突變體DERA酶羰基濃度,這是醛、2-取代的醛和醛與2-取代的醛之間的反應中形成的中間產物(即,4-取代的-3-羥基-丁醛中間產物)濃度的總和,合成過程期間優選保持為小于6摩爾/1的值。本領域技術人員清楚知道,(非常)短時間內濃度略高幾乎沒有影響。更優選地,羰基濃度被選用為每升反應混合物0.1至5摩爾之間,最優選地,每升反應混合物0.6至4摩爾之間。
反應溫度和pH并不重要,它們作為底物的函數被選用。優選地,反應在液相進行。反應可在例如-5至+45℃之間的反應溫度下,以及大約5.5至9之間,優選6至8之間的pH下進行。
反應優選在或多或少恒定的pH下進行,例如使用緩沖液或自動滴定來實現。緩沖液例如可以使用碳酸氫鈉和碳酸氫鉀,磷酸鈉和磷酸鉀,三乙醇胺/HCl,bis-tris-丙烷/HCl以及HEPES/KOH。優選地,應用碳酸氫鉀或碳酸氫鈉,例如,以20至400mmol/l反應混合物的濃度使用。
醛的總量和2-取代的醛的總量之間的摩爾比并不非常重要,其優選在1.5∶1至4∶1之間,特別是1.8∶1和2.2∶1之間。
用于本發明方法中的突變體DERA酶的量原則上并不重要。針對酶反應確定酶的最優濃度是常規實驗,所以本領域技術人員能夠容易地確定將使用的突變體DERA酶的量。
在本發明的一種優選實施方式中,R1和Rx都表示H。在本發明的一種進一步優選的實施方式中,結構式(1)的化合物是富含對映異構體的。
可被R1和Rx所代表的保護基團包括醇保護基團,其例子是本領域內公知的。具體例子包括四氫吡喃基團。優選的保護基團是甲硅烷基(例如,三芳基和優選地三烷基甲硅烷基)以及烴基。進一步更優選的保護基團是苯甲基、甲基、三乙基甲硅烷基、叔丁基甲基甲硅烷基和叔丁基二苯基甲硅烷基。
可被R1和Rx所代表的保護基團可以是相同的或不同的。當保護基團R1和Rx不同時,有利地,這可以允許選擇性地僅除去R1和Rx。優選地,當保護基團R1和Rx不同時,R1是苯基或甲硅烷基,Rx是甲基。
其中Rx代表H的結構式(1)的化合物可用于WO04/096788、WO05/012246或WO04/027075所述的方法(或類似方法)。因此,本發明還涉及一種方法,其中,可根據本發明生產結構式(1)的化合物,其中X和R1如上文所定義,并且其中Rx代表H,隨后將上述化合物與氧化劑反應,形成相應的結構式(2)的化合物,
其中,X和R1如上文所定義,隨后結構式(2)的化合物與氰離子反應,形成結構式(3)的化合物 其中,R1如上文定義。
就此反應而言,可使用WO04/096788中第2頁第10行-第3頁第13行關于該工藝步驟所述的工藝條件。或者,可以使用WO 05/012246(見,例如,第5頁第19-26行)所述的或WO 04/027075(例如,實施例2所述)所述的工藝條件。
在本發明的一種不同實施方式中,可先將結構式(1)的化合物與氰離子反應,例如,在WO 05/012246所述的工藝條件下進行,或使用WO04/096788或WO 04/027075的工藝條件,形成結構式(4)的化合物 其中,R1和Rx獨立代表H或保護基團,之后,在Rx代表保護基團的情況下,除去保護基團Rx后,結構式(4)的化合物可與氧化劑反應,形成相應的結構式(3)的化合物,其中,R1如上文所定義。
對上述氰化反應而言,水可作為溶劑與其它溶劑組合使用,例如,組合四氫呋喃、CH3CN、醇、二氧雜環己烷、二甲基亞砜、二甲基甲酰胺、N-甲基吡咯烷酮、甲苯、二乙醚和/或甲基叔丁基醚。優選地,使用在其它溶劑中的至少5%w/w,更優選至少10%w/w,進一步更優選至少20%w/w,進一步更優選至少30%w/w,進一步更優選至少40%w/w,進一步更優選至少50%w/w,進一步更優選至少60%w/w,進一步更優選至少70%w/w,進一步更優選至少80%w/w,最優選至少90%w/w的水。就實踐理由而言,特別優選用水作為唯一的溶劑。
使用WO04/096788(例如,第5頁第14行-第7頁第3行)所述的方法和反應條件,隨后可將結構式(4)的化合物轉化為結構式(5)的化合物 其中,R2、R3和R4每個獨立代表具有例如1至12個C原子,優選1-6個C原子的烷基,具有例如1至12個C原子,優選1-6個C原子的烯烴基,具有例如3-7個C原子的環烷基,具有例如3-7個C原子的環烯基,具有例如6-10個C原子的芳香基,或者具有例如7至12個C原子的芳烷基,R2、R3和R4可被取代,其中,R2和R3可與將它們連接起來的C原子一起形成環,所述轉化使用合適的縮醛形成試劑,在酸催化劑存在的情況下來進行,例如,如WO 02/06266所述。
根據WO 04/096788,其中R2、R3和R4如上文定義的結構式5的化合物隨后可被水解,形成相應的結構式6的鹽,
其中,Y代表堿金屬,例如,鋰、鈉、鉀,優選地,鈉;堿土金屬,例如,鎂或鈣,優選地,鈣;或被取代的或未被取代的銨基,優選地,四烷基銨基,例如,WO04/096788中第7頁第4行-第8頁第16行所述的。可選地,水解之后向其中Y是H的相應的結構式(6)的化合物轉化,例如,如WO 02/06266所述。
根據WO04/096788,結構式(6)的鹽還可以以本身已知的方式(例如,如WO 02/06266所述)轉化為相應的結構式(7)的酯 其中,R2和R3如上文所定義,并且其中,R5可以代表與針對R2和R3給出的基團相同的基團。
例如,R5可以代表甲基、乙基、丙基、異丁基或叔丁基。可通過根據本發明的方法制備的一組重要的結構式8的酯是叔丁基酯(R5代表叔丁基)。
在本發明的一個特別的方面,通過下述方法將結構式(6)的鹽轉化為相應的結構式(7)的酯按照WO03/106447和WO04/096788中第9頁第2行-第10頁第2行所述的方法,在惰性溶劑(例如甲苯)中將結構式(6)的鹽與氯化物形成試劑接觸,以形成相應的酸性氯化物,以及在存在N-甲基嗎啉(NMM)的情況下,將形成的酸性氯化物與結構式R5OH的醇接觸,其中,R5如上文所定義。
使用本發明的方法制備的化合物特別有用于制備藥物制劑的活性成分,例如,制備HMG-CoA還原酶抑制劑,更具體地,用于制備斯達汀,例如,洛伐他汀、西立伐他汀、瑞舒伐他汀、辛伐他汀、普伐他汀和氟伐他汀,特別用于ZD-4522,其被描述于Drugs of the future(1999),24(5),511-513 by M.Watanabe et al.,Bioorg&Med.Chem.(1997),5(2),437-444中。本發明因此提供了一種有經濟吸引力的新路徑,用于制備化合物,特別是結構式(1)的化合物,其可被用于合成斯達汀。此類制劑的特別令人感興趣的例子是阿托伐他汀鈣的制劑,如A.Kleemann,J.Engel;pharmaceutical substances,synthesis,patents,applications 4th edition,2001Georg Thieme Verlag,p.146-150所述。
因此,本發明還涉及一種方法,其中,使用本發明的方法和本身已知的其它工藝步驟,降根據本發明的方法獲得的化合物進一步轉化為斯達汀,優選地,阿托伐他汀或其鹽,例如,其鈣鹽。此類工藝是本領域公知的。
現在將通過下述實驗結果對本發明加以解釋,而并非以任何方式加以限制。
實驗通用部分鑒定具有提高的抗性或生產率的DERA突變體的方法可以使用兩種方法來鑒定具有提高的抗性或生產率的DERA突變體。一種方法檢查DERA突變體針對氯乙醛的抗性,另一種評估使用氯乙醛和乙醛作為底物對6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)的生產中DERA突變體的生產率。第一種方法使用標準DERA天然底物活性試驗的基于微滴定的形式,來檢查DERA突變體對氯乙醛的抗性,其中使用天然DERA的底物2-脫氧-D-核糖-5-磷酸酯作為底物。第二種方法使用與質譜分析方法偶聯的高通量氣相色譜(GC/MS),分析在用乙醛和氯乙醛作為底物生產4-氯-3-(S)-羥基-丁醛(CHBA)的過程中DERA突變體的生產率,CHBA是DERA催化的乙醛和氯乙醛每種一個分子進行的醛醇縮合反應的產物,因此也是向CTeHP的反應中的中間產物。
測定溶液中的蛋白濃度使用經改良的蛋白染料結合方法(如Bradford in Anal.Biochem.72248-254(1976)所述),來測定溶液,例如,不含細胞的提取物(cfe)中的蛋白濃度。在室溫下,每種樣品取50μl的適當稀釋液,與950μl試劑(100mg Brilliant Blue G250,溶解于46ml乙醇和100ml 85%正磷酸中,補充milli-Q水至1,000ml)一起孵育至少五分鐘。在Perkin ElmerLambda20 UV/VIS分光光度計中測量595nm的波長處每種樣品的吸光度。使用用含有已知濃度的牛血清清蛋白(BSA,范圍從0.025mg/ml至0.25mg/ml)測定的校正線,對樣品中的蛋白濃度加以校正。
DERA生產率因子檢驗可使用DERA生產率因子檢驗,針對其在CTeHP形成中的生產率,對從兩種方法選出的克隆(其展示出對氯乙醛的提高的抗性,或增加的CHBA形成)加以分析。為進行此分析,將含有1.0至1.4mg cfe的一定體積的cfe與0.1M NaHCO3緩沖液(終pH=7.2)中的0.093mmol乙醛和0.04mmol氯乙醛在攪拌下一起孵育于0.2ml的總體積中。16h后,通過加入9倍體積的丙酮或乙腈來終止反應,在16,000xg下離心10分鐘。通過使用FID探測器在Chrompack CP-SIL8CB柱(Varian)上進行氣相色譜,對上清液中CTeHP和CHBA含量來進行分析。采用0.2M氯乙醛和0.4M乙醛的底物濃度,室溫(25℃)、pH7.2下,16小時內,通過1mg不含細胞的提取物蛋白(含有野生型或突變的DERA)形成的CTeHP的以mmol表示的量被定義為“DERA生產率因子”。
DERA天然底物活性試驗為評估DERA活性,可在室溫(RT)下測定DERA天然底物反應,2-脫氧-D-核糖-5-磷酸酯向乙醛和D-甘油醛-3-磷酸酯的醛醇分解中的起始活性。將10μl不含細胞的提取物轉移到140μl50mM三乙醇胺緩沖液(pH7.5)中。通過加入50μl輔助酶和底物的混合溶液(0.8mMNADH、2mM 2-脫氧-D-核糖-5-磷酸酯、丙糖磷酸異構酶(30U/ml,Roche Diagnostics)和甘油磷酸脫氫酶(10U/ml,Roche Diagnostics))來起始活性試驗。30秒后,通過加入50μl終止溶液(6M鹽酸胍、100mM磷酸氫鈉、10mM TrisHCl pH7.5)來終止反應。通過測量樣品在340nm波長的UV吸收來測定存在的起始DERA活性。一分子NADH的消耗對應于一分子2-脫氧-D-核糖-5-磷酸酯的分解。
實施例1 具有提高的針對氯乙醛的抗性的DERA突變體通過隨機誘變來構建E.coli變體deoC文庫為構建E.coli K12 deoC基因(SEQ ID NO.6)(其編碼E.coli K12DERA酶(SEQ ID NO.1))的隨機誘變文庫,使用Clonetech DiversifyPCR隨機誘變試劑盒。按照廠商說明書,以變動的MnSO4濃度(其中,上述濃度越高,引入的突變越多)來進行多個反應,從而將1至3個點突變引入Escherichia coli K12 deoC基因,導致DERA酶氨基酸序列中1至2個氨基酸替換。為擴增編碼E.coli 2-脫氧-D-核糖-5-磷酸醛縮酶(SEQ IDNO.1)的E.coli deoC基因(SEQ ID NO.6),引物DAI 13600和DAI13465(分別對應SEQ ID NO.4和SEQ ID NO.5)被分別用作為正向和反向引物。兩個引物都含有與使用Gateway Technology(Invitrogen)通過定點重組克隆獲得的PCR擴增deoC基因片段相容的位點。
正向引物(DAI 13600)的序列5’GGG GAC AAG TTT GTA CAA AAA AGC AGG CTT CGA AGG AGATAG AAC CAT GAC TGA TCT GAA AGC AAG CAG CC 3’SEQ ID NO.4反向引物(DAI 13465)的序列5’GGG GAC CAC TTT GTA CAA GAA AGC TGG GTC TTA GTA GCTGCT GGC GCT C3’ SEQ ID NO.5易錯(error-prone)PCR擴增使用下述溫度程序94℃ 2分鐘,94℃30秒和68℃ 1分鐘的25個循環,接著68℃ 10分鐘。首先將易錯PCR片段克隆進pDONR(Invitrogen)載體,制備大規模pENTR克隆載體制備物,起始超過20,000個菌落。然后使用pDEST14載體(Invitrogen),用這些pENTR制備物構建表達構建體。然后將表達構建圖轉入化學感受態E.coli BL21 Star(DE3),用于表達突變的E.coli K12 deoC基因,其編碼DERA酶突變體。
突變的deoC基因在深孔微滴定板中的表達使用Genetix Q-pics從Q-trays上挑取菌落,接種微滴定板(MTP)中的200μl 2*TY培養基(含有100μg/ml的氨芐青霉素),然后在旋轉搖床上于25℃對這些預培養物進行2天的培養,或在37℃過夜培養。從預培養物取100μl用于接種深孔板中的500μl表達培養物(2*TY,100μg/ml氨芐青霉素,1mM IPTG);然后將這些表達培養物在旋轉搖床上于37℃培養24小時。
微滴定板DERA穩定性試驗為檢查突變的DERA酶針對氯乙醛的抗性,進行一項試驗,所述試驗基于DERA天然底物反應。以每分鐘4,000轉(rpm)對深孔表達培養物進行15分鐘的離心,在400μl B-PER裂解緩沖液(25%v/v B-PERII(Pierce),75%(v/v)50mM三乙醇胺緩沖液,pH7.5加100mg/lRNAse A)中對獲得的E.coli細胞沉淀進行裂解。對高于120mM氯乙醛的氯乙醛濃度,使用200mM三乙醇胺。通過離心(4,000rpm,4℃,進行15分鐘)移除細胞殘骸,從每個孔中轉出210μl不含細胞的提取物進新的微滴定板。為評估DERA活性,使用上文所述的DERA天然底物活性試驗測定DERA天然底物反應中的起始活性。通過取殘余的200μl體積的不含細胞的提取物,加入50μl氯乙醛溶液,來檢查DERA突變體對氯乙醛的抗性。
在第一輪篩選中,使用600mM的氯乙醛貯液,對篩選第一次重組的突變體文庫,使用1.0M的貯液,針對篩選第二次重組的突變體文庫,使用1.5M的貯液,分別得到終濃度為120、200和300mM的氯乙醛。在所有情況下,暴露時間為2分鐘。之后,分別取50μl樣品(易錯PCR文庫)、30μl樣品(第一次重組的突變體文庫)或25μl樣品(第二次重組的突變體文庫),將它們轉入含有50mM三乙醇胺緩沖液(pH7.5,終體積為200μl)的微滴定板。類似起始DERA活性,通過加入50μl輔助酶/底物混合武來測定針對DERA天然底物反應的剩余DERA活性。令DERA天然反應試驗進行30秒,之后加入50μl終止溶液終止反應。為測定消耗的NADH的量,在340nm處測量樣品的UV吸收。
使用平末端(blunt-end)限制性酶(BERE)重組來重組有利的突變(根據WO03/010311)將從易錯PCR文庫選出的突變體克隆用作為基礎,通過重組它們的突變來進行對DERA的進一步改進。從貯液培養物中分離出選出的突變體克隆的質粒DNA,將其用作為模板以擴增突變的基因。用平末端切割的限制性內切酶去消化得到的突變體基因PCR片段,使用連接酶(ampligase)和Hercules DNA聚合酶將獲得的基因片段重新裝配進全長基因。為進行重組,使用限制性內切酶HaeIII、HinCII和FspI(庫A)和CacI8或BstUI(庫B)來制備兩個基因片段庫。為進行連接酶反應(總體積為50μl),從每個庫中取0.5μg基因片段DNA,使用下述溫度程序94℃ 2分鐘,94℃ 30秒和60℃ 1分鐘的30個循環,以及最后的60℃ 10分鐘的循環。對20μl連接酶反應物進行乙醇沉淀,將DNA沉淀(大約0.4μgDNA)溶解于40μl滅菌水中,將其作為模板用于重組突變體基因的PCR擴增。針對使用Hercules DNA聚合酶(5 U)進行的PCR反應(50μl體積),使用引物DAI 13600(SEQ ID NO.4)和DAI 13465(SEQ ID NO.5)分別作為正向和反向引物。使用下述PCR程序72℃ 5分鐘,94℃ 30秒、50℃ 30秒和72℃ 45秒的15個循環,最后循環為72℃ 10分鐘。使用Qiagen PCR純化試劑盒純化獲得的全長突變體基因片段,使用上文所述的定點重組將其克隆進pDEST14載體。
對具有提高的氯乙醛抗性的DERA突變體進行再檢查從冷凍的甘油樣板(master plate)接種DERA酶突變體預培養物,180rpm的振蕩下于25℃培養過夜。將預培養物小份用于接種25ml表達培養物(2*TY培養基,100μg/ml氨芐青霉素,1mM IPTG),在25℃(以180rpm振蕩)培養36小時。通過離心(5,000rpm,15分鐘)收獲細胞,使用2.5ml B-PER II來裂解細胞沉淀。首先通過在5,000rpm離心15分鐘去除細胞殘骸,然后使用Eppendorf臺式離心機離心15分鐘(4℃)。用獲得的不含細胞的提取物在時間段實驗中以及多種濃度范圍上去檢查表達的DERA突變體酶對氯乙醛的抗性。
為進行時間段實驗,以四份重復來測定樣品中存在的初始DERA天然底物反應活性。將具有合適量的DERA活性的定體積提取物暴露給200mM氯乙醛,在加入氯乙醛后的時間點t=1、t=5、t=10、t=15和t=20分鐘時,撤出小份,采用四份重復進行DERA天然底物活性試驗,來測量DERA活性的殘值。測得的初始DERA天然底物活性被設定為100%,在指定時間點測得的活性被表示為相對于所述初始起點DERA天然底物活性的百分比。
氯乙醛抗性方法的結果使用上述抗性方法,對大約10,000個克隆進行了檢查。在初始穩定性檢測活動中,將易錯PCR獲得的突變體,DERA酶暴露給150mM氯乙醛,暴露2分鐘。為篩選重組變體,在第一輪和第二輪重組中,將氯乙醛的濃度分別增加為200mM和300mM。采用同樣的設置,以三份重復對選出的突變體克隆進行重復檢測。選出表現類似于初始結果的克隆,對其進行分離。
使用BERE方法(如上所述),對這些選出的克隆的庫突變deoC基因進行隨機重組。在第一輪重組中,以200mM氯乙醛對1,000個克隆進行了研究。分離出22個克隆,它們展示出至少提高了50%的對氯乙醛的抗性。然后再從樣板中分離出這些突變體克隆,純化表達載體,通過PCR擴增突變基因,建庫。在第二輪篩選中,鑒定出了41個DERA酶突變體,2分鐘培養時間后,這些酶突變體顯示出對300mM氯乙醛的抗性較之E.coli K12野生型DERA增加了至少兩倍。
應用DERA天然底物反應活性試驗,針對對200mM氯乙醛的抗性,從25ml表達培養物對第二輪的10個最好的突變體進行了再次檢驗,檢驗平行于E.coli K12野生型DERA進行。結果是三次獨立實驗的平均值,其作為殘余DERA活性較之0mM氯乙醛時的分別的值的百分比,被展示于表4中,表4包括了對DERA酶突變體的命名和氨基酸改變。
表4Escherichia coli K12 DERA酶突變體和E.coli K12野生型
DERA對氯乙醛的抗性和DERA生產率因子
實施例2 具體提高的針對CHBA的生產率的DERA突變體酶為篩選出具有提高的對4-氯-3-(S)-羥基-丁醛(CHBA,氯乙醛和乙醛每種一個分子醛醇縮合形成的)的生產率的DERA突變體,構建出大約3,000個突變體克隆的文庫。按照實施例1所述來進行易錯PCR、Gateway克隆和DERA突變體的表達,不同之處在于,不分離pENTR載體就將易錯PCR片段被直接克隆進pDEST14載體,以使表達文庫的遺傳多樣性最大化。
樣品制備,用于使用GC/MS進行的生產率方法為進行基于GC/MS的生產率方法(使用200mM氯乙醛和乙醛作為底物,檢查CHBA產物形成),采用類似于氯乙醛抗性篩選中使用的方法,從600μl表達培養物制備不含細胞的提取物。對已在深孔板中于振蕩搖床上培養了24小時的表達培養物進行離心(4000rpm,15分鐘)。在350μl 50%(v/v)B-PER II、50%(v/v)250mM NaCO3、pH7.5中對獲得的細胞沉淀加以裂解。按照上文所述通過離心去除細胞殘骸。將含有突變的E.coli K12 DERA酶的100μl cfe與100μl 400mM乙醛和氯乙醛溶液混合。RT下1小時的培養后,每種反應體系取100μl,加入到900μl含有0.05%(w/w)環己基苯的乙腈中,其被用作為針對產物定量的內部標準(IS)。通過離心去除蛋白沉淀,每種樣品取500μl轉移到新的深孔微滴定板中。
通過高通量GC/MS對4-氯-3-羥基-丁醛進行分析在偶聯HP 5973質量探測儀(Agilent)的Hewlett Packard 6890型氣相色譜上,針對其CHBA含量對樣品進行分析。通過自動注射器,直接從微滴定板將樣品注射到Chrompack CP-SIL 13CB(Varian)柱上。以1.1ml/分鐘的恒定流速,用氦作為載氣,在兩分鐘內進行從100℃到250℃的溫度程序。通過單離子監測(SIM)來探測內部標準(M=45,從t=0至2.80分鐘)和CHBA(M=160,從t=2.80分鐘至方法結束)的特征離子。對于一種樣品而言,總循環時間(從注射到注射)小于五分鐘。
生產率方法提供了E.coli K12 DERA的7種酶突變體,它們較之E.coli K12野生型DERA,具有至少3倍的CHBA濃度增加。使用上述DERA生產率因子檢驗,對選出的突變體克隆進行再次檢測,將它們與E.coli K12野生型DERA相比,并測定它們的DERA生產率因子(以16小時中,cfe中每mg蛋白產生的以mmol表示的CTeHP)。
用每種重轉化突變體克隆的單個菌落去接種2.5ml Luria Bertani培養基(LB)預培養物(含有100μg/ml羧芐青霉素),在每分鐘180轉(rpm)的振蕩及28℃下培養過夜。用這些預培養物接種50ml LB表達培養物,至細胞密度為OD620nm等于0.05,在旋轉搖床上(180rpm)于28℃進行培養。三小時培養后,于大約0.4的光密度,通過加入1mM異丙基-β-D-硫代半乳糖苷(IPTG)來誘導突變體DERA的表達。21小時后,通過離心(5,000xg下,5分鐘)收獲細胞,將其重新懸浮于1ml 50mM三乙醇胺緩沖液(pH7.2)中。通過對細胞懸浮液進行5分鐘(10秒脈沖,接著10秒暫停)的超聲波處理,以及在4℃和16,000xg下離心1小時來獲得不含細胞的提取物(cfe)。將cfe貯藏于4℃,直到在DERA生產率因子檢驗中進一步使用。對所述生產率方法發現的DERA酶突變體的命名和氨基酸改變列于表5中。
表5Escherichia coli K12 DERA酶突變體和E.coli K12野生型DERA的CHBA形成和DERA生產率因子
實施例3 用DERA突變體9-11H進行規模擴大的CTeHP合成按照實施例2所述,分別用質粒pDEST14-Ecol-deoC和pDEST14_9-11H(F200I突變體)對化學感受態E.coli BL21 Star(DE3)(Invitrogen)進行新鮮轉化。用來自分別的轉化瓊脂平板的單個菌落接種兩份50ml的LB預培養物(含有100μg/ml羧芐青霉素),在旋轉搖床上(180rpm)于28℃培養過夜。
第二天,用50ml預培養物去接種含有1l LB培養基的滅菌Erlenmeyer瓶(每瓶具有100μg/ml羧芐青霉素),至起始細菌密度為OD620=0.05,在振蕩(180rpm)下于28℃進行培養。細胞密度為OD620≈0.6時,通過加入1mM IPTG來誘導E.coli K12野生型DERA和由此獲得的突變體DERA 9-11H(含有氨基酸改變F200I)的表達。在同樣條件下進一步培養培養物,直到總培養時間達到21小時。在該時間點,通過離心(5000xg下,5分鐘)收獲兩種培養物,將細胞沉淀重新懸浮于25ml 50mM三乙醇胺緩沖液(pH7.2)中。通過對細胞懸浮液進行2次5分鐘(10秒脈沖接著10秒暫停,大探針)的超聲波處理,并于4℃、39,000xg離心1小時來獲得不含細胞的提取物。將cfe貯藏于4℃直到進一步使用。用上述所述的DERA天然底物活性試驗(但其中使用5mM2-脫氧-D-核糖-5-磷酸酯)測得的兩種cfe的特定活性在相同范圍內。
對規模擴大的反應而言,在室溫及輕柔攪拌下,于總體積為50ml的含有0.1M NaHCO3緩沖液(pH7.2)中,將10mmol氯乙醛和23mmol乙醛與1.5kU的野生型和突變體DERA F200I分別進行培養。反應進行五小時,在反應過程中不同的時間點取100μl樣品。5小時后,通過加入900μl乙腈,以及在16,000xg離心10分鐘來終止樣品中的酶反應。通過使用FID探測器在Chrompack CP-SIL8CB柱(Varian)上進行氣相色譜,對上清液中CTeHP和CHBA含量進行分析。這些樣品中測得的分別濃度可在表6中找到。
使用每mmol氯乙醛150U時,兩小時和四小時后,E coli K12 DERA突變體F200I分別展示出從存在的氯乙醛向CTeHP的轉化率為81%和86%。U表示酶的一個單位,這是在DERA天然底物活性試驗條件下,1分鐘內轉化1μmol 2-脫氧-D-核糖-5-磷酸酯所必需的酶的量。僅在反應的開始時,可探測到少量的中間產物CHBA。在用每mmol氯乙醛150U野生型E coli K12 DERA進行的反應中,不能探測到CHBA,僅能探測到少量的CTeHP。對野生型DERA而言,兩小時和四小時的培養時間后,野生型DERA的從氯乙醛到CTeHP的轉化率分別為7%和8%。因此,在同樣的時間段內,發現的E coli K12突變體DERA F200I展示出是來自E coliK12的野生型DERA的大約11至12倍高的轉化率。
表6采用每mmol氯乙醛150U,通過E coli K12野生型和突變體DERA F200I形成的CTeHP和CHBA。(-=低于探測極限)
實施例4 對野生型E coli K12 DERA的F200進行飽和誘變F200X位點突變的引入按照廠商說明書,使用QuikChange定點誘變試劑盒(Stratagene)來將E coli K12野生型deoC基因(SEQ ID NO.6)中編碼E coli K12野生型DERA氨基酸序列(SEQ ID NO.1)的第200位處氨基酸殘基苯丙氨酸的DNA序列改變為全部64種可能的編碼序列(X被定義為前文列出的20種蛋白原性氨基酸和3個終止密碼子),其中使用下述誘變引物F200X_for435’GC GTA GAA AAA ACC GTT GGT NNN AAA CCG GCG GGC GGC GTG CG 3’SEQ ID NO.9F200X_rev435’CG CAC GCC GCC CGC CGG TIT NNN ACC AAC GGT TTT TTC TAC GC3’SEQ ID NO.10(N代表A、C、G和T四種核苷酸中的任何一種)。E coli K12野生型deoC基因作為模板使用,已按照WO03/006656所述的方案,將其克隆進了質粒pBAD/Myc-HisC(Invitrogen)的多克隆位點的NcoI和EcoRI限制性位點。涂布到含有100μg/ml羧芐青霉素的選擇性LB培養基上之后,用隨機選出的、獨立的菌落去接種4塊深孔微滴定板(含有1ml 2*TY培養基,其中補充有100μg/ml羧芐青霉素),每孔用一種獨立菌落。在每塊板上,對三個孔接種含有下述pBAD/Myc-HisC的E coli TOP10菌落用作為對照,下述pBAD/Myc-HisC中分別具有克隆的E coli野生型deoC基因(SEQ ID No.6)和顯示出SEQ ID No.6中T706A突變(導致E coliDERA氨基酸序列(SEQ ID No.1)中第200位處發生從苯丙氨酸到異亮氨酸的氨基酸改變)的E coli deoC基因。
對F200X文庫的培養、表達和篩選在Kühner ISF-1-W旋轉搖床上(50mm的振蕩幅度)于25℃和300rpm下,對接種的深孔微滴定板進行2天的培養,將其作為預培養物,用于在深孔微滴定板中對突變的deoC變體的表達培養物。為此目的而言,從每個孔中取65μl轉移進深孔微滴定板(含有935μl滅菌的2*TY培養基,其中補充有100μg/ml羧芐青霉素和0.02%(w/v)L-阿拉伯糖)的相應孔中,誘導基因表達。
隨后在在Kühner ISF-1-W旋轉搖床上(50mm的振蕩幅度;37℃;300rpm)對表達培養物進行24小時的培養。按照實施例2所述來進行細胞收獲和裂解,不同之處在于每個孔使用總體積為500μl的裂解緩沖液。按照實施例2所述來進行底物培養,但是進行20小時。通過向每個孔中加入1ml含有1000ppm環己基苯的乙腈(其在GC/MS分析中被用作為針對產物定量的內部標準)來終止反應。在按照實施例2所述通過GC/MS分析進行產物定量之前,通過離心沉淀蛋白(5,000rpm,于4℃,進行30分鐘)。
鑒定出了總共14個克隆中具有至少2.5倍升高的CTeHP形成(見表7)。這14個克隆中,7個含有突變為纈氨酸的F200突變,6個突變為異亮氨酸,1個突變為甲硫氨酸,分別具有對這三種氨基酸的每種來說都是全部可能的密碼子。根據DNA測序結果,所有這14種克隆中,deoC基因中沒有發生其它額外突變。
用DERA生產率因子檢驗對F200X“擊中(hit)”進行再次檢測按照上文所述的DERA生產率因子檢驗,對這14種克隆進行再次檢測,與E coli K12野生型DERA進行比較。為此目的而言,以50ml的規模培養14種克隆,按照實施例2所述來制備不含細胞的提取物,不同之處在于,使用基于E coli TOP10/pBAD/Myc-HisC的系統,在對數生長中期,通過加入0.02%(w/v)L-阿拉伯糖代替1mM IPTG來誘導E coli K12deoC基因變體的表達。
F200V變體顯示出與從該篩選獲得的F200I變體可相比較的篩選中CTeHP形成和DERA生產率因子。F200M變體顯示出比F200V和F200I變體略低的DERA生產率因子,但較之E coli K12野生型DERA生產率因子仍高出10倍(超過1000%)。
表7Escherichia coli K12 DERA F200X酶突變體和E coli K12野生型DERA的篩選CTeHP形成和DERA生產率因子
擴大規模的F200X反應為更為詳細地研究通過對E coli K12 DERA的F200位點進行的飽和誘變發現的三種氨基酸取代F200I、F200V和F200M,對選出的克隆的確定量的不含細胞的提取物加以研究,研究針對它們在0.6M的氯乙醛濃度和1.2M的乙醛濃度下進行的CTeHP形成中的表現。
通過對其分別的cfe中15μg蛋白進行SDS-PAGE分析,針對其表達水平對克隆1-D10(F200M)、2-H8(F200V)和3-C10(F200I)進行研究。突變體酶的表達水平被證明為與野生型E coli K12 DERA相同。采用2-脫氧-D-核糖-5-磷酸酯的DERA天然底物反應中,酶活性分別為F200M,29U/mg;F200V,38U/mg;F200I,36U/mg;以及E coli K12的野生型DERA,54U/mg。
為進行CIAA反應,將來自分別的不含細胞的提取物的3mg總蛋白用于1ml的總體積。所有反應都在室溫和輕柔攪拌下于0.1M NaHCO3緩沖液(pH7.2)中進行。為對CTeHP形成進行定量,在反應期間不同時間點取100μl樣品。通過加入900μl乙腈(含有1,000ppm環己基苯作為內部標準)以及在16,000xg下離心10分鐘來終止樣品中的酶反應。通過使用FID探測器在Chrompack CP-SIL8CB柱(Varian)上進行氣相色譜,對上清液的CTeHP含量加以分析。該分析結果示于表8中。
表8通過以每ml反應體積3mg蛋白含有野生型DERA和DERA突變體F200M(克隆1-D10)、F200V(克隆2-H8)和F200I(3-C10)的不含細胞的提取物,從0.6M CIAA和1.2M乙醛進行CTeHP形成的時間過程。(-=低于探測極限)
這些結果證明,F200I、F200V和F200M取代是在F200位點進行的有利于CIAA和乙醛向CTeHP轉化的突變。
實施例5 F200I突變組合ΔY259;F200I突變組合Δ259以及SEQ ID No.3的C末端延伸使用基于PCR的定點誘變技術,將F200I改變與(i)C-末端Y259殘基的缺失和(ii)其取代加氨基酸序列KTQLSCTKW(SEQ ID No.3)對E.coli K12 DERA C-末端的延伸重組。分別以正向和反向,合成包含分別的突變的PCR引物,所述引物為大約30至50個核苷酸。在兩種單獨的PCR反應中,將這些引物分別組合Gateway系統(Invitrogen)特異性正向和反向引物,或其它誘變正向或反向引物,在pDEST14(Invitrogen)中克隆的來自E.coli K12的野生型deoC基因(SEQ ID No.6)上使用。
Gateway系統特異性正向引物序列5’GGG GAC AAG TTT GTA CAA AAA AGC AGG CTT CGA AGG 3’SEQ ID No.11Gateway系統特異性反向引物序列5’GGG GAC CAC TTT GTA CAA GAA AGC TGG GTC 3’SEQ ID No.12F200I正向5′CCG TTG GTA TCA AAC CGG CGG GCG G 3’SEQ ID No.13F200I反向5′CCG CCC GCC GGT TTG ATA CCA ACG G 3’SEQ ID No.14
ΔY259反向5′GGG GAC CAC TTT GTA CAA GAA AGC TGG GTC TTA GTAGTG CTG GCG CTC TTA CC 3’SEQ ID No.15C-延伸3反向5′GGG GAC CAC TTT GTA CAA GAA AGC TGG GTC CTA TTAGTT AGC TGC TGG CGC TC 3’SEQ ID No.16對產生的部分deoC基因進行凝膠純化,防止對隨后用模板deoC片段DNA進行的PCR反應造成污染。獲得的片段被用于PCR反應,以重新裝配含有目標突變的變體全長deoC基因。然后按照廠商提供的一管法方案,將全長變體deoC片段亞克隆進pDEST14載體。對插入進行完全測序,以證實在想要的E.coli K12 deoC突變體表達構建體中,沒有發生不想要的改變。
在不存在氯乙醛時,根據DERA天然底物活性試驗,獲得的E.coliK12 DERA變體F200I/ΔY259和F200I/ΔY259+SEQ ID No.3針對2-脫氧-D-核糖-5-磷酸酯幾乎沒有顯示出催化活性。因此,按照Wong及其同事在J.Am.Chem.Soc.117(12),3333-3339(1995)中所述的方法,通過離子交換色譜和硫酸銨分級分離(fractionation)來純化過量表達的DERA變體。按照實施例3所述,針對CTeHP合成,將重組變體F200I+ΔY259和F200I+ΔY259+SEQ ID No.3與DERA變體F200I和E.coli K12野生型DERA相比較,不同之處在于,每ml反應體積中使用給定量為2.5mg的分別的純化DERA(野生型或變體),來代替實施例3和4中所述的不含細胞的提取物。在底物濃度為0.5M CIAA和1.0M乙醛的情況下,用純化的F200I/ΔY259和F200I/ΔY259+SEQ ID No.3,在8小時后,分別獲得了61%和70%的從提供的醛向CTeHP的轉化率(表9)。用純化的F200I,在8小時后獲得了0.11M的CTeHP濃度,這對應于23%的向目標產物的轉化率。用純化的E.coli K12野生型DERA,僅形成了非常非常少的CTeHP。此時,提供的醛中僅有不到7%被轉化。
表9針對使用0.5M CIAA和1.0M乙醛和每ml反應體積中2.5mg經純化的DERA,用DERA變體F200I、F200I/ΔY259和F200I/ΔY259+SEQ ID No.3與E.coli K12野生型DERA進行的比較
實施例6 針對CTeHP生產篩選野生型DERA對編碼Aeropyrum pernix K1(GI:24638457)、Bacillus subtilis str.168(GI:1706363)、Deinococcus radiodurans R1(GI:24636816)和Thermotogamaritima MSB8(GI:7674000)的野生型DERA的deoC基因進行PCR擴增,其中使用含有attB識別序列(用于Gateway克隆)的基因特異性引物。
A.pernix5’正向5’GGG GAC AAG TTT GTA CAA AAA AGC AGG CTT CGA AGGAGA TAG AAC CAT GAG AGA GGC GTC GGA CGG 3’SEQ ID No.17A.pernix3’反向5′GGG GAC CAC TTT GTA CAA GAA AGC TGG GTC TTA GACTAG GGA TTT GAA GCT CTC CAA AAC C 3’SEQ ID No.18
B.subtilis 5’正向5’GGG GAC AAG TTT GTA CAA AAA AGC AGG CTT CGA AGGAGA TAG AAC CAT GTC ATT AGC CAA CAT A AT TGA TCA TAC AG3’SEQ ID No.19B.subtilis 3’反向5′GGG GAC CAC TTT GTA CAA GAA AGC TGG GTC TTA ATAGTT GTC TCC GCC TGA TGC 3’SEQ ID No.20D.radiodurans 5’正向5’GGG GAC AAG TTT GTA CAA AAA AGC AGG CTT CGA AGGAGA TAG AAC CAT GTC ACT CGC CTC CTA CAT CGA CC 3’SEQ ID No.21D.radiodurans 3’反向5′GGG GAC CAC TTT GTA CAA GAA AGC TGG GTC TCA GTAGCC GGC TCC GTT TTC GC 3’SEQ ID No.22T.maritima 5’正向5’GGG GAC AAG TTT GTA CAA AAA AGC AGG CTT CGA AGGAGA TAG AAC C ATG ATA GAG TAC AGG ATT GAG GAG G 3’SEQ ID NO.23T.maritima 3’反向5′GGG GAC CAC TTT GTA CAA GAA AGC TGG GTC TCA ACCTCC ATA TCT CTC TTC TCC 3’
SEQ ID NO.24按照廠商的方法,將四種野生型deoC基因克隆進pDEST14,用分別的pDEST14-deoC構建體去轉化化學感受態E.coli Rosetta(DE3)(Novagen)。將含有pDEST14-Ecol-deoC和pDEST14_9-11H的E.coliRosetta(DE3)菌株用作為對照,上述兩種載體分別含有E coli野生型deoC基因(SEQ ID No.6)和顯示出SEQ ID No.6中T706A突變(導致Ecoli DERA氨基酸序列(SEQ ID No.1)中第200位處發生從苯丙氨酸到異亮氨酸的氨基酸改變)的E coli K12 deoC基因。從LB瓊脂平板(含有100μg/ml羧芐青霉素和35μg/ml氯霉素)上,對上述六種菌株中的每種都取八個隨機選出的、獨立的菌落,用于接種深孔微滴定板(含有1ml2*YT培養基,其中補充有100μg/ml羧芐青霉素和35μg/ml氯霉素)。
對野生型DERA的培養、表達和篩選在Kühner ISF-1-W旋轉搖床上(50mm的振蕩幅度)于20℃和300rpm下,對接種的深孔微滴定板進行2天的培養,將其作為預培養物,用于在深孔微滴定板中對突變的deoC變體的表達培養物。為此目的而言,從每個孔中取65μl轉移進深孔微滴定板(含有935μl滅菌的2*TY培養基,其中補充有100μg/ml羧芐青霉素、35μg/ml氯霉素和1mM IPTG)的相應孔中,誘導基因表達。
隨后在在Kühner ISF-1-W旋轉搖床上(50mm的振蕩幅度;25℃;300rpm)對表達培養物進行24小時的培養。按照實施例2所述來進行細胞收獲和裂解,不同之處在于每個孔使用總體積為500μl的裂解緩沖液,并且,裂解緩沖液由50mM MOPS緩沖液構成,其pH為7.5,其中含有0.1mg/ml的DNAse I(Roche)、2mg/ml的溶菌酶(Sigma)、10mM二硫代蘇糖醇(DTT)和5mg MgSO4。按照實施例2所述來進行底物培養,但是是用0.2M氯乙醛和0.4M乙醛的底物濃度進行2.5小時。通過向每個孔中加入1ml含有1000ppm環己基苯的乙腈(其在GC/MS分析中被用作為針對產物定量的內部標準)來終止反應。在按照實施例2所述通過GC/MS分析進行產物定量之前,通過離心沉淀蛋白(5,000rpm,于4℃,進行30分鐘)。
在所用的篩選條件下,在使用E.coli K12野生型DERA、E.coli K12DERA變體F200I和Bacillus subtilis str.168 DERA的孔中,可探測到顯著的DERA活性和CHBA形成。在該篩選條件下,其它野生型DERA既沒有在DERA天然底物試驗中顯示出活性,也沒有在生產率篩選方法中顯示出對CHBA或CTeHP的生產。E.coli K12變體F200I的CHBA形成平均值為E.coli K12野生型DERA的CHBA形成的大約四倍高,因此,與實施例2中以相同菌株背景獲得的值相當。此外,B.subtilis str.168野生型DERA展示出比來自E.coli K12的野生型DERA高50%的CHBA生產,而在DERA天然底物活性方面略低(表10)。這表明,通過實施例2使用并描述的基于GC/MS的生產率方法,也能找到下述野生型DERA,它們具有比E.coli K12 DERA(具有SEQ ID No.1)更高的生產率,并能合成CHBA和CTeHP。
表10對能更好地形成CHBA的野生型DERA的篩選DERA天然底物活性和相對CHBA形成
序 列 表<110>帝斯曼知識產權資產管理有限公司<120>改進的2-脫氧-D-核糖-5-磷酸醛縮酶及其用于生產2,4,6-三脫氧己糖或其6-鹵代或6-氰基取代的衍生物的用途<130>21805WO<160>24<170>PatentIn version 3.1<210>1<211>259<212>PRT<213>Escherichia coli K12<400>1Met Thr Asp Leu Lys Ala Ser Ser Leu Arg Ala Leu Lys Leu Met Asp1 5 10 15Leu Asn Thr Leu Asn Asp Asp Asp Thr Asp Glu Lys Val Ile Ala Leu20 25 30Cys His Gln Ala Lys Thr Pro Val Gly Asn Thr Ala Ala Ile Cys Ile35 40 45Tyr Pro Arg Phe Ile Pro Ile Ala Arg Lys Thr Leu Lys Glu Gln Gly50 55 60Thr Pro Glu Ile Arg Ile Ala Thr Val Thr Asn Phe Pro His Gly Ash65 70 75 80Asp Asp Ile Asp Ile Ala Leu Ala Glu Thr Arg Ala Ala Ile Ala Tyr85 90 95Gly Ala Asp Glu Val Asp Val Val Phe Pro Tyr Arg Ala Leu Met Ala100 105 110Gly Ash Glu Gln Val Gly Phe Asp Leu Val Lys Ala Cys Lys Glu Ala115 120 125
Cys Ala Ala Ala Asn Val Leu Leu Lys Val Ile Ile Glu Thr Gly Glu130 135 140Leu Lys Asp Glu Ala Leu Ile Arg Lys Ala Ser Glu Ile Ser Ile Lys145 150 155 160Ala Gly Ala Asp Phe Ile Lys Thr Ser Thr Gly Lys Val Ala Val Asn165 170 175Ala Thr Pro Glu Ser Ala Arg Ile Met Met Glu Val Ile Arg Asp Met180 185 190Gly Val Glu Lys Thr Val Gly Phe Lys pro Ala Gly Gly Val Arg Thr195 200 205Ala Glu Asp Ala Gln Lys Tyr Leu Ala Ile Ala Asp Glu Leu Phe Gly210 215 220Ala Asp Trp Ala Asp Ala Arg His Tyr Arg Phe Gly Ala Ser Ser Leu225 230 235 240Leu Ala Ser Leu Leu Lys Ala Leu Gly His Gly Asp Gly Lys Ser Ala245 250 255Ser Ser Tyr<210>2<211>11<212>PRT<213>人工序列<220>
<223>來自合成DNA的序列<400>2Thr Thr Lys Thr Gln Leu Ser Cys Thr Lys Trp1 5 10<210>3
<211>9<212>PRT<213>人工序列<220>
<223>來自合成DNA的序列<400>3Lys Thr Gln Leu Ser Cys Thr Lys Trp1 5<210>4<211>71<212>DNA<213>人工序列<220>
<223>引物<400>4ggggacaagt ttgtacaaaa aagcaggctt cgaaggagat agaaccatga ctgatctgaa60agcaagcagc c71<210>5<211>50<212>DNA<213>人工序列<220>
<223>引物<400>5gggggaccac tttgtacaag aaagctgggt cttagtagct gctggcgctc50<210>6<211>780<212>DNA<213>Escherichia coli Kl2<400>6atgactgatc tgaaagcaag cagcctgcgt gcactgaaat tgatggacct gaacaccctg60aatgacgacg acaccgacga gaaagtgatc gccctgtgtc atcaggccaa aactccggtc
120ggcaataccg ccgctatctg tatctatcct cgctttatcc cgattgctcg caaaactctg180aaagagcagg gcaccccgga aatccgtatc gctacggtaa ccaacttccc acacggtaac240gacgacatcg acatcgcgct ggcagaaacc cgtgcggcaa tcgcctacgg tgctgatgaa300gttgacgttg tgttcccgta ccgcgcgctg atggcgggta acgagcaggt tggttttgac360ctggtgaaag cctgtaaaga ggcttgcgcg gcagcgaatg tactgctgaa agtgatcatc420gaaaccggcg aactgaaaga cgaagcgctg atccgtaaag cgtctgaaat ctccatcaaa480gcgggtgcgg acttcatcaa aacctctacc ggtaaagtgg ctgtgaacgc gacgccggaa540agcgcgcgca tcatgatgga agtgatccgt gatatgggcg tagaaaaaac cgttggtttc600aaaccggcgg gcggcgtgcg tactgcggaa gatgcgcaga aatatctcgc cattgcagat660gaactgttcg gtgctgactg ggcagatgcg cgtcactacc gctttggcgc ttccagcctg720ctggcaagcc tgctgaaagc gctgggtcac ggcgacggta agagcgccag cagctactaa780<210>7<211>35<212>DNA<213>人工序列<220>
<223>合成DNA<400>7ctactaagac ccagctttct tgtacaaagt ggtga35<210>8<211>30<212>DNA
<213>人工序列<220>
<223>合成DNA<400>8aagacccagc tttcttgtac aaagtggtga30<210>9<211>43<212>DNA<213>人工序列<220>
<223>引物<220>
<221>misc feature<222>(21)..(23)<223>用于在F200位點進行飽和誘變的可變核苷酸<400>9gcgtagaaaa aaccgttggt nnnaaaccgg cgggcggcgt gcg43<210>10<211>43<212>DNA<213>人工序列<220>
<223>引物<220>
<221>misc feature<222>(21)..(23)<223>在F200位點上進行的飽和誘變<400>10cgcacgccgc ccgccggttt nnnaccaacg gttttttcta cgc43<210>11<211>36<212>DNA
<213>人工序列<220>
<223>引物<400>11ggggacaagt ttgtacaaaa aagcaggctt cgaagg36<210>12<211>30<212>DNA<213>人工序列<220>
<223>引物<400>12ggggaccact ttgtacaaga aagctgggtc30<210>13<211>25<212>DNA<213>人工序列<220>
<223>引物<400>13ccgttggtat caaaccggcg ggcgg25<210>14<211>25<212>DNA<213>人工序列<220>
<223>引物<400>14ccgcccgccg gtttgatacc aacgg25<210>15<211>53<212>DNA
<213>人工序列<220>
<223>引物<400>15ggggaccact ttgtacaaga aagctgggtc ttagtagtgc tggcgctctt acc53<210>16<211>53<212>DNA<213>人工序列<220>
<223>引物<400>16ggggaccact ttgtacaaga aagctgggtc ctattagtta gctgctggcg ctc53<210>17<211>66<212>DNA<213>人工序列<220>
<223>引物<400>17ggggacaagt ttgtacaaaa aagcaggctt cgaaggagat agaaccatga gagaggcgtc60ggacgg66<210>18<211>61<212>DNA<213>人工序列<220>
<223>引物<400>18ggggaccact ttgtacaaga aagctgggtc ttagactagg gatttgaagc tctccaaaac60c
<210>19<211>77<212>DNA<213>人工序列<220>
<223>引物<400>19ggggacaagt ttgtacaaaa aagcaggctt cgaaggagat agaaccatgt cattagccaa60cataattgat catacag77<210>20<211>54<212>DNA<213>人工序列<220>
<223>引物<400>20ggggaccact ttgtacaaga aagctgggtc ttaatagttg tctccgcctg atgc54<210>21<211>71<212>DNA<213>人工序列<220>
<223>引物<400>21ggggacaagt ttgtacaaaa aagcaggctt cgaaggagat agaaccatgt cactcgcctc60ctacatcgac c71<210>22<211>53<212>DNA<213>人工序列
<220>
<223>引物<400>22ggggaccact ttgtacaaga aagctgggtc tcagtagccg gctccgtttt cgc53<210>23<211>71<212>DNA<213>人工序列<220>
<223>引物<400>23ggggacaagt ttgtacaaaa aagcaggctt cgaaggagat agaaccatga tagagtacag60gattgaggag g71<210>24<211>54<212>DNA<213>人工序列<220>
<223>引物<400>24ggggaccact ttgtacaaga aagctgggtc tcaacctcca tatctctctt ctcc5權利要求
1.酶的經過分離的突變體,所述酶來自2-脫氧-D-核糖-5-磷酸醛縮酶野生型酶的組,所述野生型酶來自屬于由真核物種和原核物種構成的組的天然來源,此類野生型酶每種都具有特定的生產率因子,這是通過在由乙醛和氯乙醛的至少等摩爾混合物對6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)的生產過程中進行DERA生產率因子檢驗測定的,其中,所述經過分離的突變體具有比突變體來源的相應野生型酶的生產率因子高至少10%的生產率因子,并且其中,所述突變體和所述相應野生型酶兩者的所述生產率因子都是在相同條件下測量的。
2.如權利要求1所述的經過分離的突變體,來自2-脫氧-D-核糖-5-磷酸醛縮酶野生型酶的組,其中,所述經過分離的突變體具有比具有SEQID NO.1的野生型酶序列的、來自Escherichia coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4)的生產率因子高至少10%的生產率因子,并且其中,所述突變體和所述Escherichia coli K12酶兩者的所述生產率因子都是在相同條件下測量的。
3.如權利要求1或2所述的經過分離的突變體,來自2-脫氧-D-核糖-5-磷酸醛縮酶野生型酶的組,其中,所述突變體是具有SEQ ID NO.1的野生型酶序列的、來自Escherichia coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4)的突變體。
4.如權利要求1-3中任意一項所述的經過分離的突變體,來自2-脫氧-D-核糖-5-磷酸醛縮酶野生型酶的組,其中,所述突變體在SEQ ID NO.1的K13、T19、Y49、N80、D84、A93、E127、A128、K146、K160、I166、A174、M185、K196、F200或S239位點,或與上述位點對應的位點中的一處或多處,具有至少一種氨基酸取代,和/或在SEQ ID NO.1的位點S258或Y259,或與所述SEQ ID NO.1的位點S258或Y259相對應的位點,具有至少一個氨基酸缺失,可選地,組合C-末端延伸和/或組合N-末端延伸。
5.如權利要求1-4中任意一項所述的經過分離的突變體,來自2-脫氧-D-核糖-5-磷酸醛縮酶野生型酶的組,其中,所述突變體具有在SEQ IDNO.1中進行的下述氨基酸取代或對應于這些取代的取代構成的組中的至少一種a.K13和/或K196被帶正電荷氨基酸替換,優選地,被R或H替換;b.T19和/或M185被另一種氨基酸替換,優選地,被選自由下述組的另一種氨基酸所替換,所述組由親水氨基酸和/或疏水氨基酸構成,其中,親水氨基酸特別是由S、T、C、Q和N構成的,疏水氨基酸特別是由V、L和I構成的;c.Y49被選自由F和W構成的組的芳香族氨基酸所取代;d.N80和/或I166和/或S239被選自由T、S、C、Q和N構成的親水氨基酸組的另一種氨基酸替換;e.D84和/或A93和/或E127被選自下述小氨基酸組的另一種、優選更小的氨基酸所替換,所述組由按照大小降序的E、T、N、P、D、C、S、A和G構成;f.A128和/或K146和/或K160和/或A174和/或F200被選自由L、M、V、F和Y構成的疏水氨基酸組的另一種氨基酸所替換;和/或在SEQ ID NO.1的S258和Y259位點,或與之對應的位點處,至少一個氨基酸的缺失,可選地,組合C-末端延伸,和/或組合N-末端延伸。
6.如權利要求4或5所述的經過分離的突變體,其中,所述C-末端被片段TTKTQLSCTKW(SEQ ID NO.2)和KTQLSCTKW(SEQ ID NO.3)之一延伸。
7.如權利要求5或6所述的經過分離的突變體,來自2-脫氧-D-核糖-5-磷酸醛縮酶野生型酶的組,其中,所述突變體具有SEQ ID NO.1中的下述突變或對應于這些突變的突變中的一種或多種,所述突變選自下述組K13R、T19S、Y49F、N80S、D84G、A93G、E127G、A128V、K146V、K160M、I166T、A174V、M185T、M185V、K196R、F200I、F200M、F200V、S239C、ΔS258、ΔY259、TTKTQLSCTKW(SEQ ID NO.2)造成的C-末端延伸和KTQLSCTKW(SEQ ID NO.3)造成的C末端延伸。
8.如權利要求7所述的經過分離的突變體,來自2-脫氧-D-核糖-5-磷酸醛縮酶野生型酶的組,其中,所述突變體具有選自下述組的SEQ ID NO.1中的下述兩種突變或對應于這兩種突變的突變F200I和ΔY259、F200M和ΔY259、F200V和ΔY259、F200I和KTQLSCTKW(SEQ ID NO.3)造成的C末端延伸、F200M和KTQLSCTKW(SEQ ID NO.3)造成的C末端延伸,以及F200V和KTQLSCTKW(SEQ ID NO.3)的造成C末端延伸。
9.一種方法,用于從2-脫氧-D-核糖-5-磷酸醛縮酶的組中篩選出下述野生型酶,在從乙醛和氯乙醛的至少等摩爾混合物對6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)的生產過程中,通過DERA生產率因子檢驗測定時,所述野生型酶的生產率因子比具有SEQ ID NO.1野生型酶序列的、來自Escherichia coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4)的生產率因子高至少10%,其中(A)依次地,(i)分離總和/或基因組DNA和/或cDNA;(ii)制備所述經過分離的DNA的表達文庫,所述文庫由包含所述經過分離的DNA的個體克隆構成;(iii)將來自獲得的表達文庫的個體克隆與底物乙醛和氯乙醛的混合物一起培養;(iv)分離出來自下述一種或多種克隆的一種或多種基因,所述克隆顯示能將這些底物轉化為4-氯-3-(S)-羥基-丁醛(CHBA)和/或6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP),將所述一種或多種基因再克隆進與SEQ ID NO.16同樣的遺傳背景;以及,其中(B)表達步驟(iv)中獲得的再克隆的基因編碼的DERA酶,通過DERA生產率因子檢驗的方法對其加以檢驗,由此獲得針對每種此類野生型酶的生產率因子;以及,其中(C)將來自步驟(B)的針對這些野生型酶的生產率因子與具有SEQID NO.1野生型酶序列的、來自Escherichia coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4)的生產率因子相比較,選出編碼下述DERA酶的一種或多種基因并進行分離,所述DERA酶在所述比較中具有至少高10%的生產率因子。
10.一種方法,用于從2-脫氧-D-核糖-5-磷酸醛縮酶的組中篩選出下述突變體酶,在從乙醛和氯乙醛的至少等摩爾混合物對6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)的生產過程中,通過DERA生產率因子檢驗測定時,所述突變體酶的生產率因子比相應野生型酶的生產率因子高至少10%,或比具有SEQ ID NO.1野生型酶序列的、來自Escherichia coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4)的生產率因子高至少10%,其中,(A)依次地,(i)用本身已知的手段,對編碼野生型2-脫氧-D-核糖-5-磷酸醛縮酶的基因進行突變,并將其克隆進與編碼E.coli K12 DERA的基因(具有SEQ ID NO.6)相同的遺傳背景,分別克隆進與突變體來源的相應野生型基因相同的遺傳背景,由此獲得克隆的表達文庫,所述克隆來自由此制備的突變體;以及,其中(B)表達克隆中的DERA酶,通過DERA生產率因子檢驗的方法對其加以檢驗,由此獲得針對每種突變體酶的生產率因子;以及,其中(C)將針對所述突變體酶的生產率因子與所述相應野生型酶的生產率因子,或與具有SEQ ID NO.1的、來自Escherichia coli K12的野生型酶(EC 4.1.2.4)的生產率因子相比較,選出編碼下述DERA突變體的一種或多種基因并進行分離,所述DERA突變體在分別的比較中具有至少高10%的生產率因子。
11.如權利要求10所述的方法,其中,在步驟(A)(i)后,步驟(A)(ii)中,將來自獲得的表達文庫的個體克隆與底物乙醛和氯乙醛的混合物一起培養;之后,在步驟(A)(iii)中,選出下述一種或多種克隆,所述克隆顯示了將這些底物轉化為4-氯-3-(S)-羥基-丁醛(CHBA)和/或6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷(CTeHP)的最高轉化率;以及,其中,選出的所述克隆被用于步驟B;
12.可通過權利要求10或11所述的篩選方法獲得的經過分離的核酸。
13.一種經過分離的核酸,編碼如權利要求1至8中任意一項所述的突變體2-脫氧-D-核糖-5-磷酸醛縮酶,其中
14.一種載體,包含如權利要求12或13所述的核酸。
15.宿主細胞,其中包含如權利要求1-8中任意一項所述的、來自2-脫氧-D-核糖-5-磷酸醛縮酶野生型酶的組的突變體,或可根據權利要求10或11所述的篩選方法獲得的此類突變體酶,和/或宿主細胞,其中包含權利要求12或13所述的經過分離的核酸,和/或包含權利要求14所述的載體。
16.一種方法,用于制備突變體2-脫氧-D-核糖-5-磷酸醛縮酶,所述酶的生產率因子比相應野生型酶的生產率因子和/或具有SEQ ID NO.1野生型酶序列的、來自Escherichia coli K12的2-脫氧-D-核糖-5-磷酸醛縮酶(EC 4.1.2.4)的生產率因子高至少10%,其中,使用權利要求12或13所述的核酸,或權利要求14所述的載體,或權利要求15所述的宿主細胞。
17.一種方法,用于生產結構式1的2,4,6-三脫氧己糖或2,4-二脫氧己糖, 其中,R1和Rx每種獨立代表H或保護基團,其中,X代表鹵素;甲苯磺酸基;甲磺酸基;酰氧基;苯乙酰氧基;烷氧基或芳氧基,所述生產是從乙醛和結構式為HC(O)CH2X的相應被取代的乙醛來生產的,其中,X如上文所定義,其中使用權利要求1-8中任意一項所述的突變體DERA酶,或通過可通過權利要求10或11所述的方法獲得的核酸表達可獲得的突變體DERA酶,或權利要求16所述的方法獲得的突變體DERA酶,并且其中,R1和/或Rx代表保護基團的情況下,形成的化合物中的羥基以本身已知的方式被保護基團保護。
18.如權利要求17所述的方法,其中,羰基濃度,即醛、2-取代的醛和醛與2-取代的醛之間的反應中形成的中間產物(即,4-取代的-3-羥基-丁醛中間產物)濃度的總和,在合成過程期間被選用為每升反應混合物0.1至5摩爾之間。
19.如權利要求17或18所述的方法,其中,R1和Rx代表H。
20.使用權利要求17至19中任意一項所述的方法以及本身已知的其它工藝步驟來制備斯達汀的方法。
全文摘要
本發明涉及下述酶的經過分離的突變體,所述酶來自2-脫氧-D-核糖-5-磷酸醛縮酶野生型酶的組,所述突變體的生產率因子(通過特定檢驗測定)比突變體來源的相應野生型酶的生產率因子高至少10%。突變體在對應于Escherichia coli K12(EC 4.1.2.4)野生型酶序列中K13、T19、Y49、N80、D84、A93、E127、A128、K146、K160、I166、A174、M185、K196、F200和S239位點中的一處或多處具有至少一種氨基酸取代,和/或在對應于其中S258和Y259的位點有至少一處氨基酸缺失,可選地,與特定C-末端延伸和/或N-末端延伸組合。本發明還涉及篩選方法,用于找到下述2-脫氧-D-核糖-5-磷酸醛縮酶(原樣或作為突變體),所述酶具有比對照值高至少10%的生產率因子(由所述特定檢驗測定,其形成篩選的重要部分)。此外,本發明涉及由所述篩選方法獲得的突變體酶以及編碼此類突變體的核酸,還涉及分別包含此類核酸或突變體的載體和宿主細胞。最后,本發明涉及此類(優選地,突變體)酶、核酸、載體和宿主細胞在生產,例如,6-氯-2,4,6-三脫氧-D-赤六吡喃糖苷中的用途。
文檔編號C12P19/02GK1965084SQ200580018062
公開日2007年5月16日 申請日期2005年6月2日 優先權日2004年6月4日
發明者斯特凡·馬丁·詹尼維恩, 馬丁·舒爾曼, 約翰內斯·海倫娜·邁克爾·默梅爾斯, 丹尼爾·米恩科, 麥克爾·沃爾波吉, 馬塞爾·格哈杜斯·烏博爾特斯 申請人:帝斯曼知識產權資產管理有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 襄樊市| 资源县| 济宁市| 金坛市| 达拉特旗| 乾安县| 商南县| 新宁县| 海门市| 那坡县| 青冈县| 牟定县| 曲周县| 贵德县| 玉环县| 康乐县| 永康市| 宜兴市| 巫溪县| 永清县| 老河口市| 黄骅市| 金寨县| 大理市| 陇南市| 六安市| 峨眉山市| 集安市| 淮阳县| 云阳县| 毕节市| 岫岩| 襄汾县| 凤阳县| 法库县| 瑞昌市| 河南省| 全州县| 商城县| 麻城市| 万州区|