麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

纖維素酶cel5h相關試劑及其在微生物中的應用的制作方法

文檔序號:581341閱讀:649來源:國知局
專利名稱:纖維素酶cel5h相關試劑及其在微生物中的應用的制作方法
技術領域
本發明涉及生物技術和遺傳工程的領域,并且特別地關注借助于合適的酶試劑和表達所述酶試劑的微生物利用纖維素和木質素纖維素材料的策略。更特別地,本發明涉及 Saccharophagus degradans的纖維素酶Cel5H和其同源物、功能片段和/或變體在產溶劑微生物(solventogenic microorganism)的背景中的應用,以及涉及來源于Cel5H和其同源物的新結構域和試劑。
背景技術
纖維素和木質素纖維素材料是植物生物量的主要成分,并且其中發現的纖維素聚合物可以提供大量的葡萄糖或其他可發酵的單糖或寡糖的來源,它們可以隨之被產溶劑微生物代謝以產生有用的溶劑,諸如乙醇、丙酮或丁醇。纖維素聚合物可以被纖維素解聚酶水解,所述纖維素解聚酶通常被稱為纖維素水解酶(cellulolytic enzyme)或纖維素酶。例如,天然纖維素的水解主要涉及4種類型的纖維素酶纖維二糖水解酶(cellobiohydrolase) (1,4_β-D-葡聚糖纖維二糖水解酶, EC 3.2. 1.91),內切-β-1,4-葡聚糖酶(內切_1,4-β-D-葡聚糖4-葡聚糖水解酶,EC 3.2. 1.4),內切-加工性(processive)纖維素酶(EC 3.2. 1. 4. /3. 2. 1.91),和 β -葡萄糖苷酶(EC 3. 2. 1. 21)。纖維素酶和相關的酶已經廣泛地用于生物技術的各個領域包括食品, 啤酒,葡萄酒,動物飼料,紡織品和洗滌品,紙漿和紙工業,農業生產和其他領域(關于綜述參見 Bhat 2000. Biotechnical Advances (生物技術進展)18 :355-383)。纖維素酶的性質可以不同,諸如尤其是,它們可以充當內切葡聚糖酶或加工性外切葡聚糖酶,它們可以產生多種長度的單體或低聚體,它們可以具有水解不同的纖維素形式諸如結晶纖維素、半結晶纖維素、無定形纖維素或半纖維素的不同能力,它們可以進一步顯示結合纖維素物質的不同的強度,不同的動力學參數等。因此,需要投入大量的努力來進一步表征纖維素酶,從而鑒定其功能部分或結構域,這些功能部分或結構域可能是這些酶的感興趣的特性的基礎。這樣的功能結構域可以有利地與其他纖維素酶或其結構域組合以產生具有所需活性的嵌合酶。此外,在產溶劑微生物中重組表達纖維素酶,從而允許通過這些微生物直接從含纖維素材料中生產有用的溶劑包括,尤其是乙醇尚未得到滿意的進展。為了實現進一步的改進,需要識別、表征和選擇特別適合用于此類應用或在此類應用中有利的纖維素酶。Saccharophagus degradans 2-40 _ 以 Ilf 己失口為 Microbifulber degradans 2-40株,并且在美國典型培養物保藏中心(American Type Culture Collection)中以ATCC 43961的保藏號保藏,其是一種能夠降解至少10種不同的復雜多糖包括尤其 M^f ^ # Y-7^W-M (proteobacterium) (Andrykovitch & Marx 1988. Appl Environ Microbiol (應用與環境微生物學)54 :3_4 ;Ensor 等.1999. J Ind Microbiol Biotechnol (工業微生物學和生物技術雜志)23 :123-126)。S. degradans基因組已經被測序并且其纖維素酶系統也被鑒定,其中包括被稱為 Cel5H 的纖維素酶(Taylor 等 2006. J Bacteriol (細菌學雜志)188 :3849-61)。此外,US2007/0292929 一般性地設想包括表達來自S. degradans的纖維素降解蛋白的產乙醇 (ethanologenic)細菌的重組微生物。然而,僅證明了由S. degradans表達的酶的活性,且不清楚當在產乙醇細菌中表達時這些酶的任一種是否將適當地發揮作用。發明概述本發明人已經對S. degradans 2-40株的Cel5H纖維素酶的結構和活性進行了充分的表征并且已經結論性地確定Cel5H對結晶纖維素顯示較高的活性。因此,Cel5H有利于在產生溶劑的(產溶劑)微生物,更特別地在產乙醇微生物諸如梭菌屬(Clostridium species)的產乙醇細菌包括丙酮丁醇梭菌(C. acetobutylicum)中的異源制備。因此, Cel5H在這些微生物中的表達(和任選地分泌)使它們能夠在包含或富含結晶、半結晶或無定形纖維素的纖維素物質上生長,從而允許從含纖維素的物質中直接產生有用的溶劑諸如乙醇。本發明人得到的更多數據已經表明Cel5H可以充當外切葡聚糖酶或內切加工性 (endoprocessive)纖維素酶,而不是如從其糖苷水解酶家族5 (GH5)催化結構域所預期的那樣充當內切葡聚糖酶。此外,Cel5H似乎主要從纖維素中釋放葡萄糖,纖維二糖和纖維三糖。假定Cel5H似乎具有的加工性天性并且因此產生低復雜度的纖維素衍生物,則其在產溶劑細菌中的重組表達可以是非常有利的。例如,Cel5H作用的產物可以直接被產溶劑微生物利用或需要其他異源纖維素的最小作用,從而簡化了重組微生物的設計并增加了該過程的有效性。本發明在其多個方面中結合了上述出人意料的認識。因此,一個方面提供了一種重組微生物,其表達&iccharophagus degradans 2-40 株的Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或變體。更特別地,本發明提供了這樣的重組微生物,其能夠通過所述表達的Cel5H多肽降解纖維素或含纖維素材料。根據具體的實施方案,所述微生物是細菌,更特別地是產溶劑細菌。在具體的實施方案中,所述重組微生物包含編碼Cel5H多肽或其同源物的重組核酸分子,或編碼所述Cel5H多肽或所述同源物的功能片段和/或變體的重組核酸分子,所述重組核酸分子可操作地連接至允許在所述微生物中的表達的調節序列。在進一步具體的實施方案中,所述重組微生物產生一種或多種溶劑、燃料和/或化學中間體,更具體地選自乙醇,丙酮,丁醇,丙酸,丁酸,醚和甘油的溶劑。在進一步的實施方案中,重組產溶劑微生物可以產生,或可以被改造以產生,至少或主要乙醇。由于其作為環境可接受的燃料的效用,乙醇的工業重要性在很大程度上迅速地不斷增加。因此,在一個實施方案中,所述重組產溶劑微生物可以是產乙醇微生物。在具體的實施方案中,所述重組微生物可以是細菌。在一個實施方案中,所述重組產溶劑細菌可以是產乙醇細菌。備選地,所述重組產溶劑微生物可以是酵母,更具體地,產乙醇酵母。例如,所述細菌可以是革蘭氏陽性的,諸如例如梭菌屬的細菌。因此本發明還包括將來源于革蘭氏陰性細菌的纖維素酶引入至革蘭氏陽性細菌中,這在以前沒有被提過。備選地,所述細菌可以是革蘭氏陰性的。在具體的實施方案中,所述重組的產溶劑微生物和優選的產乙醇微生物是梭菌屬,優選丙酮丁醇梭菌(Clostridium acetobutylicum)。這些細菌特別地專用作產生溶劑和具體地產生乙醇的細菌。在一個實施方案中,Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或變體,可以由所述微生物分泌。這樣分泌的多肽可以有利地直接作用于并且由此解聚所述微生物暴露在其中的纖維素聚合物或否則與該纖維素聚合物相互作用或改變該纖維素聚合物。然而,也考慮其中所述多肽在細胞內表達的實施方案。例如,這樣表達的多肽可以作用于否則被微生物內化的纖維素聚合物,或可以在所述微生物的至少一部分溶解時被釋放。本文設想的重組微生物可以包含編碼Cel5H多肽或其同源物的重組核酸分子,或編碼所述Cel5H多肽或所述同源物的功能片段和/或變體的重組核酸分子,所述重組核酸分子可操作地連接至允許在所述微生物中的分泌的分泌信號序列,任選地與一個或多個其他組件組合,并且所述重組核酸分子可操作地連接至允許在所述微生物中的表達的調節序列。如所述的那樣,本發明還教導了 Cel5H的同源物和所述同源物的功能片段和/或變體,以及它們在重組微生物,更特別地產溶劑微生物中的應用。優選地,如本文中所考慮的Cel5H同源物可以包含與Cel5H的DZ結構域同源的結構域。具體實施方案提供了本文教導的重組微生物,其中Cel5H多肽的所述同源物是假單胞菌屬物種(Pseudomonas sp. )ND137的ACLA多肽。此外,如由本發明人所認識到地,天然Ce 15H多肽的結構域結構可概括為 GH5-PSL-CBM6-EPR-DZ,其中GH5代表其糖苷水解酶家族5結構域,PSL代表聚絲氨酸接頭, CBM6代表糖-結合組件(module)家族6結構域,EPR代表富含谷氨酸-脯氨酸的區域,以及不被這種解釋所限制,DZ表示被本發明人鑒定為推測的糖-結合組件的C-末端結構域。因此,在具體實施方案中,本文教導的重組微生物可以表達包含一個或多個結構域的功能片段,所述結構域選自或對應于Cel5H的GH5結構域,CBM6結構域和DZ結構域。 在該片段中一個或多個所述結構域的存在可以賦予該片段以由各結構域引起的功能性。本發明進一步考慮Cel5H多肽、其同源物、功能片段和/或變體與一個或多個異源結構域融合的改造形式,所述異源結構域可以提供在糖聚合物代謝和特別地纖維素代謝中有用的其他功能和活性,諸如解聚纖維素的活性,結合纖維素的活性,形成多纖維素酶體 (cellulosome)的活性或其他活性。因此,具體實施方案提供了本文教導的重組產溶劑微生物,其中所述Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或變體,與一個或多個與所述Cel5H多肽或其同源物異源的結構域融合,所述結構域選自多纖維素酶體支架蛋白(eellulosomal scaffoldin protein)的糖苷水解酶(GH)催化結構域, 糖結合組件(CBM)結構域,黏結蛋白(cohesion)結合結構域諸如錨定(dockerin)結構域, 和親水(X組件)結構域。另外地或備選地,該Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或變體與異源的或其天然信號肽融合。此外,本發明還考慮了共同表達Cel5H或相關多肽和其他多肽或酶的優勢,所述其他多肽或酶優選地為重組多肽或酶,其有效用于糖聚合物代謝和特別地纖維素代謝中, 諸如解聚纖維素的多肽,結合纖維素的多肽,形成多纖維素酶體的多肽(諸如,例如,支架蛋白(scaffoldin))或其他多肽。這樣的共表達,和任選地和特別地共分泌可以提供附加的或補充的活性和功能,導致本發明的微生物更有效地解聚和利用纖維素。因此進一步的實施方案提供了本文教導的重組微生物,其共表達和任選地共分泌 Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或變體,和一種或多種多肽(在本文中也稱為共表達的多肽),所述一種或多種多肽優選地是參與糖聚合物代謝和特別地纖維素代謝的重組多肽,特別地是一種或多種能夠降解木質素纖維素材料的酶,更特別地是一種或多種糖苷水解酶,甚至更特別地是一種或多種纖維素酶。在具體實施方案中,所述一種或多種共表達的多肽諸如共表達的酶,更特別地共表達的纖維素酶的催化作用對于Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或變體的酶活性可以是附加的或補充的,優選是補充的。通過舉例而非限制,如果第一和第二纖維素酶優先作用于不同的物質(諸如,例如,結晶纖維素,半結晶纖維素,無定形纖維素或半纖維素),或如果第一和第二纖維素酶產生不同的產物(例如,糖單體和/或低聚體的不同群體),或如果第一纖維素酶優先地作用于第二纖維素酶的反應產物或反之亦然等,則第一纖維素酶可以被認為具有對第二纖維素酶補充的活性。在進一步的實施方案中,所述一種或多種共表達的纖維素酶可以選自家族_5, 6,8,9和48纖維素酶。在進一步的具體實施方案中,所述一種或多種共表達的纖維素酶可以選自解纖維素梭菌(Clostridium cellulolyticum)纖維素酶Cel48F,Cel9G, Cel9R, Cel9P, Cel9E, Cel9H, Cel9J, Cel9M, Cel8C, Cel5N 禾口 Cel5A,以及 Saccharophagus degradans 2-40 株纖維素酶 Cel9A,Cel9B, Cel5J, Cel5I, Cel5F, Cel5D, Cel5B, Cel9G, Cel5E, Cel5A, Cel5C和Cel6A,以及任一種所述纖維素酶的功能片段和/或變體。進一步的實施方案提供了本文教導的重組微生物,更特別地產溶劑重組微生物, 其中Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或變體,和任選地如上教導的一種或多種共表達的多肽,更特別地一種或多種共表達的纖維素酶,包含在雜交的和/或共價的多纖維素酶體或小型多纖維素酶體中(在此說明書全文中多纖維素酶體的總稱中始終包括兩者)。多纖維素酶體可以提供尤其是結合纖維素活性和解聚纖維素活性的超分子組織結構(organisation),從而實現糖聚合物代謝,特別地纖維素代謝的更高效率。在進一步的方面,本發明提供了降解包含纖維素的物質的方法,所述物質諸如木質素纖維素或纖維素材料或生物量,所述方法包括使所述物質與本文教導的重組生物體接觸。在具體的實施方案中,該物質包含或富含結晶纖維素。相關的方面提供了從包含纖維素的物質中產生溶劑、燃料或化學中間體的方法, 所述物質諸如木質素纖維素或纖維素材料或生物量,所述方法包括用一種或多種本文教導的微生物處理所述物質。在具體的實施方案中,該物質包含或富含結晶纖維素。在最具體的實施方案中,該溶劑為乙醇,且該微生物為產乙醇微生物。在具體實施方案中,本發明的方法包括在纖維素物質上生長本文所述的重組微生物,從而確保從含纖維素的物質中直接產生有用的溶劑諸如乙醇,所述纖維素物質包含或富含結晶、半結晶或無定形纖維素。還應該理解盡管在前述的方面和實施方案中已經主要結合重組微生物公開了本發明,但本發明還包括涉及有效用于獲得該重組微生物的重組手段和試劑,使用所述重組手段和試劑獲得該重組微生物的方法,用于在該重組微生物中表達所需多肽的方法,以及表達的多肽及其組合本身和它們的制備方法的多個方面。因此,進一步的方面提供了 Saccharophagus degradans 2-40株的分離的Cel5H 多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或變體。另一個方面提供了重組核酸分子,所述重組核酸分子編碼Cel5H多肽或其同源物,或編碼所述Cel5H多肽或所述同源物的功能片段和/或變體。本發明此方面的進一步的實施方案提供了編碼Cel5H多肽或其同源物的重組核酸分子,或編碼所述Cel5H多肽或所述同源物的功能片段和/或變體的重組核酸分子,所述重組核酸分子可操作地連接至允許在目的宿主微生物中的表達的調節序列。在具體的實施方案中,所述宿主為產溶劑微生物。在更具體的實施方案中,所述宿主為本說明書中其他地方教導的產乙醇微生物。在本文提供的重組核酸分子的具體實施方案中,編碼Cel5H多肽或其同源物,或編碼所述Cel5H多肽或所述同源物的功能片段和/或變體的核酸序列適應宿主微生物的密碼子偏倚。進一步的實施方案提供了編碼Cel5H多肽或其同源物的重組核酸分子,或編碼所述Cel5H多肽或所述同源物的功能片段和/或變體的重組核酸分子,所述重組核酸分子可操作地連接至允許在目的宿主微生物,特別地在重組微生物,更特別地在本說明書中其他地方教導的產溶劑微生物和更優選地產乙醇微生物中的分泌的分泌信號序列。進一步的實施方案提供了編碼Cel5H多肽或其同源物的重組核酸分子,或編碼所述Cel5H多肽或所述同源物的功能片段和/或變體的重組核酸分子,所述重組核酸分子可操作地連接至允許在目的宿主微生物中的分泌的分泌信號序列,且可操作地連接至允許在目的宿主微生物,特別地在本說明書中其他地方教導的產溶劑微生物和更特別地產乙醇微生物中的表達的調節序列。一個進一步的方面是載體,諸如例如克隆載體,穿梭載體和/或表達載體,其包含上面公開的一種或多種重組核酸。一個進一步的方面提供了用一種或多種所述重組核酸或用上述的載體轉化的目的宿主微生物。在一個實施方案中,該微生物可以是細菌,更特別地選自下列的細菌 大腸桿菌(Escherichia coli), Salmonella tymphimurium,粘質沙雷氏菌(Serratia marcescens),鼠傷寒沙門氏菌(Salmonella typhimurium)禾口枯草芽孢桿菌(Bacillus subtilis)。所述細菌特別適合于過量產生重組多肽,例如為了純化的目的。在具體實施方案中,該宿主微生物為本說明書中其他地方教導的產溶劑微生物且優選產乙醇微生物。一個進一步的方面提供了由這樣轉化的微生物直接獲得或可由其獲得的細胞溶胞產物或細胞提取物。因此,還提供了用于獲得根據本發明的重組微生物,優選本說明書其他地方教導的產溶劑微生物和更優選產乙醇微生物的方法,該方法包括用本文教導的重組核酸或載體轉化宿主微生物。進一步提供了用于產生,和任選地和最特別地分泌一種或多種Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或變體的方法,所述方法包括用本文教導的各種重組核酸或載體中的一種或多種轉化宿主微生物,并且在有效引起所述各種多肽表達的條件下培養或保持這樣轉化的微生物。有利地,所述各種多肽以生物活性形式產生。任選地,該方法可以包括分離各種多肽的步驟。
因此,還考慮本文公開的重組核酸、載體或宿主細胞在產生,和任選地和特別地分泌Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或變體中的應用。優選所述各種多肽以生物活性形式產生。在上述多肽的具體實施方案中,重組核酸、載體、轉化的宿主微生物、方法和應用的特征在于下面特征中的一種或多種-所述Cel5H同源物包含與Cel5H的DZ結構域同源的結構域;和/或-所述Cel5H同源物為假單胞菌屬物種(I^seudomonassp. )ND137的ACLA多肽; 和/或-所述功能片段包含一個或多個結構域,所述結構域選自或對應于Cel5的GH5結構域,CBM6結構域和DZ結構域;和/或-所述一種或多種Cel5H多肽或其同源物,或所述一種或多種Cel5H多肽或所述同源物的功能片段和/或變體與一個或多個與Cel5H多肽或其同源物異源的結構域融合,所述異源的結構域選自多纖維素酶體支架蛋白的GH催化結構域,CBM結構域,黏結蛋白結合結構域諸如錨定結構域,和X組件結構域;和/或-所述一種或多種Cel5H多肽或其同源物,或所述一種或多種Cel5H多肽或所述同源物的功能片段和/或變體可以與一種或多種參與糖聚合物代謝,特別地參與纖維素代謝的多肽,優選重組多肽或酶,優選地與一種或多種能夠降解木質素纖維素材料的酶,更優選地與一種或多種本文教導的異源纖維素酶共表達和任選地共分泌;和/或-所述一種或多種Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或變體,和任選地(如上面所教導的)一種或多種共表達的多肽,更特別地共表達的纖維素酶包含在雜交的和/或共價的多纖維素酶體中。因此,一個方面提供了分離的組合物,其包含Cel5H多肽或其同源物,或所述 Cel5H多肽或所述同源物的功能片段和/或變體,且還包含一種或多種參與糖聚合物代謝, 和特別地參與纖維素代謝的多肽,優選一種或多種能夠降解木質素纖維素材料的酶,更優選本文教導的一種或多種異源纖維素酶。在所述組合物的具體實施方案中,所列舉的組分作為離散的或游離的多肽存在。在其他實施方案中,所列舉的多肽包含在雜交的和/或共價的多纖維素酶體中。本發明人對Cel5H多肽的結構和組織已經進一步進行了全面的分析,并且已經鑒定了在Cel5H多肽的C-末端附近存在以前未曾同樣鑒定到的新結構域(此后稱為結構域 DZ)。不受限制地,本發明人的數據提示了針對該DZ結構域的推測的糖結合組件(和/或低聚組件功能)并且指示其存在可能至少部分地是Cel5H解聚結晶纖維素的良好能力的原因。因此,本發明進一步認識到DZ結構域或Cel5H多肽的包含DZ結構域的部分可以用于多種酶體系中以改善它們消化和降解結晶纖維素的能力。因此,進一步的方面是Saccharophagus degradans 2-40株的Cel5H多肽的分離的結構域(DZ結構域),即所述Cel5H多肽(諸如,例如,在圖IC中顯示的示例性的成熟 Cel5H多肽SEQ ID NO :3中)的氨基酸496至氨基酸596或與其同源的分離的結構域,或所述DZ結構域或所述同源結構域的功能片段和/或變體。在具體實施方案中,與Cel5H DZ同源的結構域是假單胞菌屬物種ND137的ACLA 多肽(諸如,例如,在圖IE中顯示的示例性的成熟ACLA多肽SEQ ID NO :5中)的從氨基酸463延伸至氨基酸558的結構域。具體實施方案提供了 Cel5H多肽或其同源物或變體的分離片段,其具有結構 EPR-DZ, CBM6-EPR-DZ或PSL-CBM6-EPR-DZ,其中EPR, CBM6和PSL具有本說明書中他處所解釋的含義。這樣的片段包含DZ結構域,所述DZ結構域提供其有利的功能,和任選地,這樣的片段可以包括Cel5H糖結合組件CBM6,所述CBM6可以進一步促進降解結晶纖維素或半纖維素物質的能力。此外,內源性接頭序列可以為將DZ和任選地CBM6結構域與其他多肽融合同時保留它們的結構和功能提供有利的手段。因此,具體實施方案提供ACLA多肽的分離片段,其包含與Cel5H的DZ結構域同源的結構域。此外考慮的是分離的DZ結構域或其功能片段和/或變體,或如上教導的分 離片段作為糖結合組件的應用。這樣的應用可以對多種酶體系賦予新的糖_或纖維素_結合特性。另一個方面涉及嵌合多肽,所述嵌合多肽包含分離的DZ結構域,最特別地Cel5H 的分離的DZ結構域,或其功能片段和/或變體,或包含含有DZ結構域的Cel5H的分離片段, 并且還包含與Cel5H多肽或其同源物異源的一個或多個結構域,所述一個或多個結構域選自多纖維素酶體支架蛋白的GH催化結構域,CBM結構域,黏結蛋白結合結構域諸如錨定結構域,和X組件結構域。這樣的組件組合允許生成新的纖維素降解酶,所述纖維素降解酶具有針對結晶纖維素或半纖維素物質的有用活性。其他方面提供了嵌合多肽,所述嵌合多肽包含分離的DZ結構域或其功能片段和/ 或變體,或包含DZ結構域的Cel5H的分離片段,所述嵌合多肽融合于與Cel5H多肽或其同源物異源的一種或多種參與糖聚合物代謝,特別地參與纖維素代謝的多肽,優選地融合于一種或多種能夠降解木質素纖維素材料的酶,更優選融合于一種或多種糖苷水解酶,甚至更優選地融合于一種或多種纖維素酶。然而,也考慮另外的一個或多個DZ結構域與如本文所述的Cel5H多肽或其同源物,或其片段和/或變體的融合。一個進一步的方面提供了重組核酸分子,所述重組核酸分子編碼分離的DZ結構域或與其同源的分離的結構域或其功能片段和/或變體,或編碼包含DZ結構域或其同源物的Cel5H的分離片段,或編碼如上所述的嵌合多肽。此方面的一個具體實施方案提供了重組核酸分子,所述重組核酸分子編碼分離的 DZ結構域或與其同源的分離的結構域或其功能片段和/或變體,或編碼包含DZ結構域或其同源物的Cel5H的分離片段,或編碼如上所述的嵌合多肽,所述重組核酸分子可操作地連接至允許在目的宿主微生物中,優選地在本說明書中其他地方教導的產溶劑微生物中和更優選地在產乙醇微生物中的表達的調節序列。一個進一步的實施方案提供了重組核酸分子,所述重組核酸分子編碼分離的DZ 結構域或與其同源的分離的結構域或其功能片段和/或變體,或編碼包含DZ結構域或其同源物的Cel5H的分離片段,或編碼如上所述的嵌合多肽,所述重組核酸分子可操作地連接至允許在目的宿主微生物中,優選地在本說明書中其他地方教導的產溶劑微生物中和更優選地在產乙醇微生物中的分泌的分泌信號序列。此方面的另一個進一步的實施方案提供了重組核酸分子,所述重組核酸分子編碼分離的DZ結構域或與其同源的分離的結構域或其功能片段和/或變體,或編碼包含DZ結構域或其同源物的Cel5H的分離片段,或編碼如上所述的嵌合多肽,所述重組核酸分子可操作地連接至允許在目的宿主微生物中的分泌的分泌信號序列,和可操作地連接至允許在目的宿主微生物中,優選地在本說明書中其他地方教導的產溶劑微生物中和更優選地在產乙醇微生物中的表達的調節序列。 一個進一步的方面提供了載體,諸如例如克隆載體,穿梭載體和/或表達載體,其包含任一種上述重組核酸分子。一個進一步的方面提供了用上述重組核酸分子或載體轉化的目的宿主微生物。 在具體實施方案中,該微生物是細菌,更優選地是選自下列的細菌大腸桿菌,Salmonella tymphimurium,粘質沙雷氏菌,鼠傷寒沙門氏菌和枯草芽孢桿菌。在具體實施方案中,該微生物可以是本說明書中其他地方教導的產溶劑微生物且優選產乙醇微生物。一個進一步的方面提供了由這樣轉化的微生物直接獲得或可由其獲得的細胞溶胞產物或細胞提取物。在具體實施方案中,分離的DZ結構域或與其同源的分離的結構域或其功能片段和/或變體,或包含DZ結構域或其同源物的Cel5H的分離片段,或如上所述的嵌合多肽,和任選地一種或多種共表達的參與糖聚合物代謝,特別地參與纖維素代謝的多肽可以包含在雜交的和/或共價的多纖維素酶體中。在進一步的方面,本發明提供了降解包含纖維素的物質諸如木質素纖維素或纖維素材料或生物量的方法,所述方法包括使所述物質與分離的DZ結構域或與其同源的分離的結構域或其功能片段和/或變體,或與包含DZ結構域或其同源物的Cel5H的分離片段, 或與如上所述的嵌合多肽,或與表達這些的重組微生物接觸。在一個實施方案中,所述物質可以包含或富含結晶纖維素,半結晶纖維素或無定形纖維素。相關的方面提供了從包含纖維素的物質諸如木質素纖維素或纖維素材料或生物量中產生溶劑、燃料或化學中間體的方法,所述方法包括用分離的DZ結構域或與其同源的分離的結構域或其功能片段和/或變體,或用包含DZ結構域或其同源物的Cel5H的分離片段,或用如上所述的嵌合多肽,或用表達這些的重組的產溶劑微生物處理所述物質。在一個實施方案中,所述物質可以包含或富含結晶纖維素。在具體實施方案中,提供了產生溶劑, 更特別地產生乙醇的方法,并且該微生物可以是產乙醇微生物。一個進一步的方面提供了通過本文所述的方法獲得的或可獲得的包含纖維素降解產物和/或溶劑,更特別地乙醇的組合物。所述組合物可以是粗制培養基或針對Cel5H 多肽(或其同源物或片段)的產物進行(至少)部分地富集和/或純化或針對溶劑、燃料或化學中間體進行部分地富集和/或純化。在具體實施方案中,這樣的組合物的特征在于增加的葡萄糖、纖維二糖和纖維三糖含量。在進一步具體的實施方案中,提供了這樣的組合物,其中葡萄糖、纖維二糖和/或纖維三糖的含量大于IOwt %,大于20wt %,大于30wt %,大于40wt%,大于50wt%,大于60wt%,大于70wt%,大于80wt%,大于90wt%以上。在進一步具體的實施方案中,這樣的組合物的特征在于高含量的目的溶劑、燃料或化學中間體。在進一步具體的實施方案中,提供了這樣的組合物,其中溶劑、燃料或化學中間體的含量大于IOwt%,大于20wt%,大于30wt%,大于40wt%,大于50wt%,大于 60wt %,大于 70wt %,大于 80wt %,大于 90wt %,大于 90wt %,或 96 % -99,9wt %。在具體實施方案中,該組合物中溶劑、燃料或化學中間體的濃度大于約10g/L,和優選大于約15g/ L0本發明的這些和其他方面和實施方案在下面和在所附的權利要求中進一步解釋,并通過非限制性實施例說明。附圖簡要說明

圖1圖示了 Saccharophagus degradans 2-40株的天然Cel5H多肽的示例性編碼核酸序列(A)和氨基酸序列(B-C),所述氨基酸序列含有(B)或不含有(C) N-末端分泌信號序列;假單胞菌屬物種ND137的天然ACLA蛋白的示例性氨基酸序列,所述序列含有(D)或不含有(E) N-末端分泌信號序列;示例性的改造的Cel5H-編碼核酸序列(F)和適應丙酮丁醇梭菌密碼子偏倚并在3’(C-末端)端處含有6xHis密碼子或標簽的氨基酸序列(G)。圖2示意性地圖示了根據本發明的具體實施方案,已被或被改造用于表達的 Cel5H的不同片段和衍生物。圖3圖示了根據本發明的具體實施方案,Cel5H的多種形式在37°下針對CMC的活性。圖4圖示了根據本發明的具體實施方案,Cel5H的多種形式在37°下針對磷酸溶脹纖維素(Phosphoric Acid Swollen Cellulose)的活性。圖5圖示了根據本發明的具體實施方案,Cel5H的多種形式在37°下針對Avicel PHlOl的活性。圖6圖示了根據本發明的具體實施方案,Cel5H微晶纖維素酶(avicelase)活性與來自解纖維素梭菌(C.cellulolyticum)的野生型和改造的纖維素酶的比較。圖7圖示了根據本發明的具體實施方案,來自解纖維素梭菌的Cel5A的改造形式的略圖,所述改造形式包含附加的Cel5H的結構域。圖例參見圖2。圖8圖示了根據本發明的具體實施方案,來自解纖維素梭菌的Cel5A的不同改造形式對Avicel (3. 5g/L 20mM Tris-馬來酸酯pH 6和ImM CaCl2)的降解,所述改造形式包含附加的Cel5H的結構域。圖例參見圖2。圖9顯示根據本發明的具體實施方案,Cel5H和至少一種其他的纖維素酶對 Avicel的降解。圖10示意性地圖示了根據本發明的具體實施方案,包含Cel5H的雜交小型多纖維素酶體(minicellulosome)。圖11顯示了根據本發明的具體實施方案,在含有3g/L 2YT-PASC和pH 5. 5的發酵罐中PASC的降解,剩余纖維二糖的消耗(consummation)和丙酮丁醇梭菌的細菌生長,其 Cel5H信號肽序列被解纖維素梭菌的Cel5H信號肽序列替換。圖12顯示了根據本發明的具體實施方案,在存在2YT和pH 5. 5但不含任何PASC 的發酵罐中剩余纖維二糖的消耗和丙酮丁醇梭菌的細菌生長,其Cel5H信號肽序列被解纖維素梭菌的Cel5H信號肽序列替換。圖13圖示了根據本發明具體實施方案的不同構建體。這些構建體包含融合到運載結構域(carrier domain)和信號序列的目的多肽(纖維素酶“Cel5H”)。運載結構域包含來自于多纖維素酶體支架蛋白的糖結合組件(CBM3a),該組件融合到一個或兩個X組件 (Xa)0纖維素酶Cel5H包含糖苷水解酶家族5結構域(“5”)、聚絲氨酸接頭(“sss”)、 糖-結合組件家族6結構域(“6”)、富含-谷氨酸-脯氨酸區(“印pv”)和C-末端結構域,該C-末端結構域被本發明人鑒定為推測的糖-結合組件(“DZ”)。圖14證明與對照菌株相比野生型Cel5H以及融合到運載結構域的Cel5H的分泌。運載結構域包含來自多纖維素酶體支架蛋白的糖結合組件(CBM3a),該組件融合到兩個親水結構域(Xa)。測量培養物上清對可溶性物質對-硝基苯基-纖維二糖 (para-nitrophenyl-cellobiose)白勺 舌十生°圖15證明不同蛋白(包括根據本發明具體實施方案的融合蛋白)對不同纖維素物質的活性;(a)包含Cel5H的蛋白對可溶性物質對-硝基苯基-纖維二糖的活性;野生型 Cel5H(實線),具有一個X組件的融合體(CBM-Xa-5H ;點線),具有兩個X組件的融合蛋白 (CBM-Xa-Xa-5H,虛線)(b)包含cel5H的蛋白對結晶纖維素Avicel的活性。圖16示意性地圖示了根據本發明的具體實施方案,Cel5H和ACLA的結構域的比較。發明詳述當用于本文時,單數形式“一個”、“一種”、和“所述”既包括單數也包括復數指示物,除非上下文另有清楚地說明。當用于本文時,術語“包含”(“comprising”、“comprises”和“comprisedof”)與 “包括”或“含有” (“including”、“includes” 或“containingWontains”)意思相同, 是包括的或開放式的,并且不排除另外的、未列舉的成員、要素或方法步驟。通過端值列舉的數值范圍包括該范圍內所包含的所有數字和分數,也包括所列舉的端值。術語“大約”用于本文時,當指可測量的數值如參數、量、時間期間等時,是指包括標示數值的和偏離標示數值的+/-10%或更少,優選地+/-5%或更少,更優選地+/-1%或更少,還更優選地+/-0. 或更少的差異,只要此類差異在所公開的發明中適合于實施。要理解修飾語“大約”所指的值本身也被明確地和優選地公開。本說明書中引用的所有文獻通過弓I用完整地并入本文。除非另外指定,用于公開本發明的所有術語,包括技術和科學術語具有本發明所屬領域中普通技術人員所普遍理解的含義。借助于進一步的指導,包括術語定義以更好地理解本發明的教導。當用于本文時,術語“Cel5H”,“Cel5H多肽”或“Cel5H蛋白”指根據本領域中這些命名所普遍公知的Mccharophagus degradans 2-40株的多肽或蛋白(參見,特別是Taylor等,2006,見上)。上述命名特別地指具有天然序列的此類多肽,S卩,其基本序列與自然界中存在的或來源于自然界的S. degradans 2-40株的Cel5H蛋白的基本序列相同的多肽。專業技術人員理解Cel5H的天然序列由于遺傳趨異或自發突變可能導致在 S. degradans 2_40株的不同次代菌株或傳代培養物之間發生差異。Cel5H的天然序列可能由于轉錄后或翻譯后修飾而進一步發生趨異。因此,自然界中存在或來源于自然界的所有 Cel5H序列均被認為是“天然的”。上述名稱包括形成活生物體、微生物或細胞的一部分時的Cel5H多肽,以及至少部分地分離自所述來源時的Cel5H多肽。這些術語也包括通過重組或合成方式生產時的 Cel5H多肽。Cel5H多肽正常是分泌性的,并且可以以前體形式存在,所述前體形式包含可切割的N-末端分泌信號序列,或以缺少所述信號序列的成熟形式存在。取決于容易被專業技術人員理解的背景,本文提及的Cel5H多肽可以包括所述成熟形式和/或所述前體形式。
示例性Cel5H多肽包括但不限于由在下列各處標注的核酸編碼序列編碼的多肽 NCBI Entrez 基因數據庫(http://www.ncbi.nlm.nih.gov/sites/entrez db = gene)基因座標簽 Sde_3237 (GeneID :3965710),和 NCBI Genbank (http //www. ncbi. nlm. nih. gov/ Genbank/index. html)登錄號NC 007912(序列版本1,數據庫錄入更新時間2008年7月 20目),也重現在圖IA中(SEQ ID NO 1);和在下列各處標注的Cel5H多肽NCBI Genbank 登錄號YP 528706(序列版本1,數據庫錄入更新時間:2008年7月20日)和Uniprot/ Swissprot (http://www. expasy. org/)登錄號 Q21FN5(于 2006 年 4 月 18 日輸入的序列版本1),如示例性地重現在圖IB (SEQ ID NO 2)中。此序列對應于包含信號序列的Cel5H前體。示例性的成熟Cel5H多肽,S卩,信號序列被加工掉的多肽由所述前體序列的氨基酸位置35-630表示,其示例性地重新在圖 IC(SEQ ID NO 3)中。人們將理解信號肽酶的實際切割可以潛在地在前體Cel5H的氨基酸34和35之間的預測切割位點附近的肽鍵處發生,所述前體Cel5H諸如圖IB中所示。例如,實際的切割可能在前體Cel5H的位置30-40,優選31-39,更優選32-38,甚至更優選32-37,還更優選 33-36的氨基酸區內的任一個肽鍵處發生,所述前體Cel5H如圖IB中所示。此外,除非明確地另外指明或通過上下文另外指明,每當本文參考氨基酸位置來鑒定Cel5H的結構域或其他基序時,這樣的參考針對Cel5H的成熟形式,諸如特別地以SEQ ID NO 3顯示的那種。當用于本文時,術語“同源性”是指來自相同或不同分類單位的兩種大分子之間, 尤其是兩種多肽或多核苷酸之間的結構相似性,其中所述相似性是由于共同祖先所產生的。因此,術語“同源物”是指具有所述結構相似性的如此相關的大分子。優選地,本文意指的Cel5H多肽的同源物包括所述具有天然序列的同源物。Cel5H多肽的多肽同源物可以優選地顯示與Cel5H多肽的如本說明書中其他地方定義的至少約30 %,更優選至少40 %,甚至更優選至少50 %,還更優選至少60 %,仍更優選至少70%,諸如非常優選至少80%或至少90%或至少95%的序列同一性。備選地或優選另外地,Cel5H多肽的多肽同源物可以顯示與Cel5H多肽的如本說明書中其他地方定義的至少約50 %,更優選至少60 %,甚至更優選至少70 %,還更優選至少80 %,仍更優選至少 90%,諸如非常優選至少95%的序列相似性。此外優選地,Cel5H多肽的多肽同源物可以包含與Cel5H多肽的結構域對應的一個或多個功能結構域,和優選地包含GH家族5催化結構域,CBM家族6結構域和DZ結構域中的一個或多個。優選地,所述結構域可以具有與Cel5H 類似的組織結構,尤其是GH5-CBM6-DZ,通常具有插入的接頭。需注意,Cel5H多肽的優選同源物為假單胞菌屬物種ND137的ACLA多肽。示例性的ACLA多肽包括但不限于Uniprot/Swissprot登錄號Q8VUT3 (于2002年3月1日輸入的序列版本1)所注釋的序列,該序列也重現在圖1D(SEQ ID NO 4)中。此序列對應于包含信號序列的ACLA前體。示例性的成熟ACLA多肽,即,信號序列被加工掉的多肽,由各個前體的氨基酸位置觀-585表示,其示例性地重現在圖IE (SEQ ID NO 5)中。人們將理解信號肽酶的實際切割可能潛在地在前體ACLA的氨基酸27和28之間的預測切割位點附近的肽鍵處發生,所述前體ACLA諸如圖1D(SEQ ID NO 4)中所示。例如, 實際的切割可能在前體ACLA的位置23-32,優選對_31,更優選25-30,甚至更優選沈-四的氨基酸區內的任一個肽鍵處發生,所述前體ACLA如圖ID中所示。取決于容易被專業技術人員理解的背景,本文提及的ACLA多肽可以包括所述成熟形式和/或所述前體形式。此外,除非明確地另外指明或通過上下文另外指明,每當本文參考氨基酸位置來鑒定ACLA的結構域或其他基序時,這樣的參考針對ACLA的成熟形式,諸如特別地SEQ ID NO :5中顯示的那種。術語“片段”當提及給定的多肽諸如Cel5H或其同源物,或提及給定的結構域諸如 Cel5H的DZ結構域或其同源物時,通常是指所述多肽的截短形式,其與所述多肽諸如所述 Cel5H或同源物或所述結構域相比具有一個或多個氨基酸殘基的N-末端和/或C-末端缺失,但該片段剩余的基本序列與所述多肽諸如所述Cel5H或同源物或所述結構域的氨基酸序列中的相應位置相同。例如,給定多肽諸如Cel5H或其同源物的片段可以包含所述多肽諸如所述Cel5H 或同源物的約> 5個連續氨基酸,優選> 10個連續氨基酸,更優選> 20個連續氨基酸,甚至更優選> 30個連續氨基酸,例如,^ 40個連續氨基酸,和最優選> 50個連續氨基酸,例如,彡60,彡70,彡80,彡90,彡100,彡200或彡500個連續氨基酸的序列。例如,Cel5H的DZ結構域或其同源物的片段可以包含所述DZ結構域或其同源物的約> 5個連續氨基酸,優選> 10個連續氨基酸,更優選> 20個連續氨基酸,甚至更優選 ^ 30個連續氨基酸,例如,^ 40個連續氨基酸,和最優選> 50個連續氨基酸,例如,^ 60, 彡70,彡80,或彡90個連續氨基酸的序列。此外,給定多肽諸如Cel5H或其同源物或DZ結構域的片段可以代表所述多肽諸如所述Ce 15H或同源物或DZ結構域的氨基酸序列的至少約30 %,例如,至少50 %或至少 70 %,優選至少80 %,例如,至少85 %,更優選至少90 %,和仍更優選至少95 %或甚至約 99%。術語給定多肽諸如Cel5H或其同源物或DZ結構域的“變體(variant),,是指這樣的多肽,其氨基酸序列與所述多肽諸如所述Cel5H或其同源物或DZ結構域的天然序列基本上相同(即,大部分但非全部相同)?!盎旧舷嗤笔侵钢辽偌s85%相同,例如,優選至少 90%相同,例如,至少91%相同,92%相同,更優選至少93%相同,例如,94%相同,甚至更優選至少95 %相同,例如,至少96 %相同,仍更優選至少97 %相同,例如,至少98 %相同,和最優選至少99%相同。兩個多肽之間的序列同一性可以通過多肽的氨基酸序列的最優比對(兩個蛋白序列的最優比對是使配對得分減去關于引入空位的任何罰分的總和最大化的比對;并且可以優選地通過算法的計算機化執行來進行,諸如“Gap”,使用Needleman和^msch 1970 (J Mol Biol (分子生物學雜志)48 :443-453)的算法,或“Bestfit”,使用Smith和 Waterman 1981 (J Mol Biol (分子生物學雜志)147 195-197)的算法,它們可獲自,例如, 來自Accelrys的GCG v. 11. 1. 2包),和一方面對該比對中多肽含有相同氨基酸殘基的位置數目和另一方面對該比對中兩個多肽的序列不同的位置數目評分來確定。當兩個多肽在比對中的給定位置處含有不同的氨基酸殘基(氨基酸置換)時或當多肽之一在比對中的給定位置處含有氨基酸殘基而另一個多肽不含氨基酸殘基或反之亦然(氨基酸插入或缺失) 時,這兩個多肽在比對中的該位置處的序列不同。序列同一性計算為比對中多肽含有相同氨基酸殘基的位置數相對于比對中的位置總數目的比例(百分比)。用于執行序列比對和確定序列同一性的更多合適的算法包括基于最初由Altschul等1990 (J Mol Biol(分子生物學雜志)215 :403-10)所述的基本局部比對搜索工具(Basic Local Alignment Search Tool) (BLAST)的那些,諸如由 Tatusova 和 Madden 1999 (FEMS Microbiol Lett (FEMS 微生物學通訊)174 :247-250)所述的〃 Blast 2序列"算法,諸如使用其缺省設置。給定多肽諸如Cel5H或其同源物或DZ結構域的變體當用于本文時也具體地包括與所述多肽諸如所述Cel5H或其同源物或DZ結構域具有一定程度的相似性的多肽。優選地,這樣的變體可以為至少約90%相似,例如,優選至少91%相似,例如,至少92%相似, 93 %相似,更優選至少94 %相似,例如,95 %相似,甚至更優選至少96 %相似,例如,至少 97%相似,仍更優選至少98%相似,例如,至少99%相似。兩個多肽之間的序列相似性可以通過多肽的氨基酸序列的最優比對(見上),和一方面對該比對中多肽含有相同或相似(即,保守置換的)氨基酸殘基的位置數目和另一方面對該比對中兩個多肽的序列另外不同的位置數目評分來確定。當兩個多肽在比對中的給定位置處含有非保守氨基酸殘基時或當多肽之一在比對中的給定位置處含有氨基酸殘基而另一個多肽不含氨基酸殘基或反之亦然(氨基酸插入或缺失)時,這兩個多肽在比對中該位置處的序列另外不同。序列相似性計算為比對中多肽含有相同或相似氨基酸殘基的位置數相對于比對中的位置總數目的比例(百分比)。應該理解提及片段和/或變體時,說明書也廣泛地考慮給定多肽諸如Cel5H或其同源物或DZ結構域的變體的片段,以及所述多肽的片段的變體。術語“功能”當提及給定多肽諸如Cel5H或其同源物或DZ結構域的片段和/或變體時是指這樣的片段和變體,其至少部分地保留了相應多肽諸如所述Cel5H或其同源物或 DZ結構域的生物活性或功能性。優選,這樣的功能片段和/或變體可以保留至少約20%, 例如,至少30%,或至少40%,或至少50%,例如,至少60%,更優選至少70%,例如,至少 80 %,仍更優選至少85 %,還更優選至少90 %,和最優選至少95 %或甚至100 %的相應多肽諸如所述Cel5H或其同源物或DZ結構域的活性。有可能,這樣的功能片段和/或變體可以甚至具有比相應多肽諸如所述Cel5H或同源物或DZ結構域更高的活性。給定多肽諸如Cel5H或其同源物或DZ結構域的功能片段和/或變體可以在其生物活性或功能的至少一個方面和優選更多或所有方面上與所述多肽的功能等同。所述 Cel5H或其同源物的生物學功能的相關方面包括特別地但不限于解聚纖維素活性或纖維素酶活性,關于不同纖維素物質(例如,結晶、半結晶或無定形纖維素或半纖維素)的活性譜, 降解結晶纖維素物質的能力或偏好,和與纖維素物質相互作用或結合的能力。Cel5H或其同源物的所述DZ結構域的生物學功能的相關方面包括特別地但不限于結合纖維素和特別地結合結晶纖維素,和/或低聚作用活性。Cel5H或其同源物或DZ結構域的給定片段和/或變體的生物活性,包括所述活性的上述方面,可以通過標準試驗,諸如例如實施例章節中給出的酶活性試驗來確定。術語“產溶劑的(solventogenic)” 或“產生溶劑的(solvent-producing) ” 具有其本領域已確定的含義并且特別地指微生物諸如細菌(即,產溶劑細菌)從糖源諸如例如己糖、戊糖或寡糖產生一種或多種非氣態有機液體或溶劑,諸如,尤其是乙醇,丙酮,丁醇, 丙酸,丁酸,醚或甘油的能力。特別地,該術語包含天然存在的產溶劑生物體,帶有天然存在的或誘導的突變的產溶劑生物體,和已經被遺傳修飾的產溶劑生物體。
術語“產乙醇的(ethanologenic)”或“產生乙醇的(ethanol-producing) ” 意在表示微生物諸如細菌(即,產乙醇細菌)從糖源諸如例如己糖、戊糖或寡糖產生至少或優選地主要乙醇的能力,更優選地從糖類產生乙醇作為最豐富的非氣態發酵產物的能力。特別地,該術語包括天然存在的產乙醇生物體,帶有天然存在的或誘導的突變的產乙醇生物體, 和已經被遺傳修飾的產乙醇生物體。合適的產溶劑微生物的實例包括但不限于梭菌屬和發酵單胞菌屬的菌株,諸如,但不限于本文例證的那些。術語“分離(isolating),,當提及具體組分時通常表示將該組分與組合物的至少一種其他組分分開,由此前一組分從該組合物中被“分離”。特別地,術語“分離”和“分離的(isolated)”在本文中可以指樣品中增加量的所需的一種或多種蛋白或一種或多種多肽。相對量可以表示為待分離的所需一種或多種蛋白或一種或多種多肽的濃度或量和樣品中總蛋白的濃度或量之間的比率。另外,該術語可以包括將所需的一種或多種蛋白或一種或多種多肽與非蛋白細胞組分(例如,細胞壁,液體,核酸,等)分開。術語“重組核酸”或“重組核酸分子”當用于本文時通常是指包含使用重組DNA技術(諸如例如分子克隆和核酸擴增)產生和/或連接在一起的區段的核酸分子(諸如,例如,DNA, cDNA或RNA分子)。通常,重組核酸分子可以包含一個或多個非天然存在的序列, 和/或可以包含與天然存在的序列對應的區段,所述區段不象它們在未被修飾的來源基因組中定位的那樣被定位。當重組核酸分子在已經引入其的宿主生物體中復制時,子代核酸分子也包括在術語“重組核酸分子”的范圍內。在具體實施方案中,重組核酸分子可以穩定地整合至宿主生物體的基因組中,諸如例如在一個或多個隨機位置處整合或以靶向的方式,諸如,例如,借助于同源重組整合, 或重組核酸分子可以作為染色體外元件存在或包含在染色體外元件內,其中后者可以是自復制的。提出重組DNA技術的一般原理的標準參考文獻包括Molecular Cloning =A Laboratory Manual (分子克隆實驗室指南),第二版,第1_3卷,Sambrook等編輯,Cold Spring Harbor Laboratory Press,Cold Spring Harbor, N. Y. ,1989 ;Current Protocols in Molecular Biology (現代分子生物學實驗技術),Ausubel 等編輯,Greene Publishing and ffiley-Interscience,New York (紐約),1992 (定期更新)Jnnis 等,PCR Protocols A Guide to Methods and Applications (PCR 實驗技術方法和應用指南),Academic Press =San Diego (圣地亞哥),1990。微生物學的一般原理見,例如,Davis,B. D.等, Microbiology (微生物學),第三版,Harper & Row, publishers, Philadelphia (費城), Pa. (1980)。術語“重組多肽”當用于本文中時是指通過重組核酸分子的表達由宿主生物體產生的多肽或蛋白,所述重組核酸分子已經引入至所述宿主生物體或其祖先中,并且其包含編碼所述多肽或蛋白的序列。此外,術語“重組的”或“轉化的”當在本文中用于提及宿主生物體、微生物或細胞時,包括其中已經引入了重組核酸分子的宿主生物體、微生物或細胞,以及所述宿主生物體、微生物或細胞的重組子代。在此,術語“轉化”包括將外來核酸諸如重組核酸引入或轉移至宿主生物體、微生物或細胞中。這樣引入的核酸可以優選地在所述宿主生物體、微生物或細胞的進一步生長和細胞分裂全程中得以保持??梢允褂萌魏纬R幍幕蜣D移方法來實現轉化,諸如而不限于電穿孔,電滲透,化學轉化,脂轉染(lipofection),病毒-或噬菌體-介導的轉染,等。“編碼”的意思是核酸序列或其部分依靠被研究的生物體的遺傳密碼對應于特定的氨基酸序列,例如,所需多肽或蛋白的氨基酸序列。通過舉例,“編碼”特定多肽或蛋白的核酸可以包括基因組,hnRNA,前-mRNA,mRNA, cDNA,重組或合成的核酸。優選,編碼特定多肽或蛋白的核酸可以包含編碼所述多肽或蛋白的可讀框(ORF)。 “可讀框”或“0RF”是指一連串編碼核苷酸三聯體(密碼子),其以本身已知的翻譯起始密碼子開始并以本身已知的翻譯終止密碼子結束,并且不包含任何內部的框內翻譯終止密碼子,和潛在地能夠編碼多肽。因此,該術語可以與本領域中使用的“編碼序列”同義。在一個實施方案中,編碼本發明的一種或多種多肽的核酸序列或ORF可以是以本身已知的方式為了在特定生物體例如,微生物,更特別地目的細菌中表達而最優化的密碼子??色@得多種生物體的密碼子使用偏好和密碼子頻率,例如,經由Nakamura等,2000 (Nucl Acids Res(核酸研究)28 : 所述的密碼子使用數據庫(Codon Usage Database) (http://www. kazusa. or. jp/codon/)。如本文教導的重組微生物中目的多肽的表達可以通過可操作地連接編碼所述多肽的核酸序列或ORF與允許在所述微生物中的表達的調節序列來實現。就此而言,術語“表達”多肽當指重組生物體時包括能夠,例如,在合適的培養條件下或在添加誘導物時(例如, 在使用可誘導的調節序列時)表達該多肽的重組生物體?!翱刹僮鞯倪B接”是其中調節性核酸序列和要表達的序列以允許所述表達的方式連接的連接。例如,序列,諸如,例如,啟動子和0RF,可以被稱為可操作地連接,條件是所述序列之間的連接的性質不會(1)導致引入移碼突變(frame-shift mutation), (2)干擾啟動子指導ORF轉錄的能力,(3)干擾ORF從啟動子序列轉錄的能力。表達所需的調節序列或元件的準確性質可以在生物體之間發生變化,但典型地包括啟動子和轉錄終止子,和任選地增強子。提及“啟動子”或“增強子”要在其最寬泛的背景中理解并且包括準確的轉錄起始所需的轉錄調節序列和當可適用時對基因表達的準確的空間和/或時間的控制或其對例如,內部或外部(例如,外源性)刺激物的反應。更特別地,“啟動子”可以描述核酸分子,優選DNA分子上的一個區域,RNA聚合酶與所述區域結合并啟動轉錄。啟動子優選地,但非必需地,位于轉錄受其控制的序列的上游,即5’。典型性,在原核生物中,啟動子區可以包含啟動子本身和當轉錄為RNA時將發出蛋白質合成起始信號的序列(例如,Shine-Dalgarno序列)兩者。在實施方案中,本文考慮的啟動子可以是組成型的或可誘導型的。借助于舉例,適合于在梭菌屬諸如丙酮丁醇梭菌中的表達的組成型啟動子包括而不限于丙酮丁醇梭菌的硫解酶基因的啟動子(Pthl啟動子),乙酰乙酸脫羧酶基因的啟動子 (Pad。啟動子),磷酸丁酰轉移酶(phosphotransbutyrylase)基因的啟動子(Pptb啟動子),木糖葡萄球菌(Staphylococcus xylosus)木糖操縱子的木糖可誘導型啟動子(Pxyl啟動子)。因此,在具體實施方案中,提供了這樣的啟動子,其是受操縱基因控制的啟動子。 當用于本文中時,術語“操縱基因”是指一種核苷酸序列,優選DNA序列,其控制序列從啟動子轉錄的起始和/或維持。典型地,操縱基因通常可以位于啟動子和其轉錄被啟動子控制的下游序列之間。通常,操縱基因能夠結合阻遏物多肽,由此其減少從所述啟動子的轉錄。 有用的阻遏物可以在其結合操縱基因的狀態和其不結合操縱基因的狀態之間交替,并且這樣的交替可以有利地受外部條件,例如,外部物質或特定代謝物的控制。因此,在包含相容性阻遏物的宿主細胞中,在本發明的核酸中包含操縱基因可以允許控制啟動子的活性和從所述啟動子的表達。操縱基因序列通常可以來源于細菌染色體。還應該理解本發明的核酸可以編碼一種或多于一種的目的多肽。此外,在預期表達兩種或多種多肽時,所述表達可以來自多個獨立的表達單元,或可以來自單個表達單元 (即,多順反子表達(multi-cistronic expression)),所述單個表達單元包含兩個或多個連續的受常見的調節元件控制的0RF。借助于舉例,編碼兩種或多種多肽的表達單元可以通過將各個ORF的翻譯起始密碼子與控制翻譯起始的序列(例如,核糖體進入序列)締合來產生。術語“終止子”或“轉錄終止子”通常是指在轉錄單元末端處的序列元件,其發出轉錄終止的信號。例如,終止子通常位于編碼目的多肽的一個或多個ORF的下游,即3’。例如,在重組核酸包含兩個或多個0RF,例如,連續排列并一起形成多順反子轉錄單元的ORF 的情況下,轉錄終止子可以有利地位于最下游的ORF的3’。在優選的實施方案中,可以有利地針對要用于轉化本發明的微生物的重組核酸提供控制本文教導的一種或多種多肽的表達的調節序列。然而,還考慮這樣的實施方案,其中重組核酸提供缺少一個或多個調節序列的一個或多個編碼序列,而需要的調節序列由被轉化的微生物提供(諸如,例如,其中該重組核酸插入至包含合適的調節序列的染色體或附加體(印isomal)區域中)。梭菌屬和丙酮丁醇梭菌當用于本文中時是指本領域中如所述那樣已知的細菌分類單位,并且特別地包括屬于所述分類單位的細菌、細菌菌種、菌株、亞種和培養物,以及天然存在的或野生型標本的修飾的或改造的,諸如例如突變的或遺傳改造的衍生物。通過指導而非限制,可獲自美國典型培養物保藏中心(ATCC)的梭菌屬的分離菌株可以,尤其以關于丙酮丁醇梭菌的登錄號ATCC 824, ATCC 4259, ATCC 39236或ATCC 43084來訂購。例如, 拜氏梭菌(Clostridium bei jerinckii)的分離菌株可以,尤其以登錄號ATCC 858和ATCC 25752來訂購。需注意,由本發明的產溶劑微生物表達的多肽可以被靶定以用于分泌。為了實現分泌,編碼多肽的核酸序列可以與編碼分泌信號序列的序列可操作地連接。就此而言,“可操作地連接”表示編碼信號序列的序列和編碼待分泌的多肽的序列在框內(in frame)或同相(in phase)連接,從而在表達時,信號肽促進如此與其連接的多肽的分泌。應當理解,適當的信號序列可取決于期望在其中進行分泌的微生物的類型。例如, 相對于革蘭氏陰性菌,在革蘭氏陽性菌中可能需要不同信號序列。借助于實例而非限制,革蘭氏陽性菌中的分泌,特別是梭菌屬如丙酮丁醇梭菌中的分泌,可使用如下信號序列完成,所述信號序列為解纖維素梭菌的Cel5A前體多肽的信號序列(示例序列Aenbank登錄號AAA51444,1994年10月31日修改的序列版本1),或解纖維素梭菌的CipC前體支架蛋白的信號序列(示例序列=Genbank登錄號AAC28899,2005 年12月5日修改的序列版本2),或丙酮丁醇梭菌的CipA前體支架蛋白的信號序列(示例序列Genbank登錄號AAK78886, 2006年1月19日修改的序列版本1)。
此外非限制地,革蘭氏陰性菌中的分泌可以經由Sec途徑,例如,使用運動發酵單胞菌(Z.mobilis)的葡糖酸內酯酶前體多肽的信號序列(示例序列Genbank登錄號 CAA47637,2006年10月19日修改的序列版本1)或糖類選擇性孔蛋白(porine)0prB的信號序列(示例序列=Genbank登錄號AAV88688, 2005年1月25日修改的序列版本1)來實現,或經由雙精氨酸轉運(Tat)途徑,例如,使用運動發酵單胞菌的葡萄糖果糖氧化還原酶前體多肽的信號序列(示例序列=Genbank登錄號CAB02496, 2006年10月19日修改的序列版本1)來實現。還應當理解可以使用將要通過本文教導的微生物表達的多肽的天然(或同源的、 內源性)信號肽,只要它們在所述微生物中是有功能的。因此,借助于舉例,可以使用Cel5H 前體多肽的內源性或同源的分泌信號序列來實現Cel5H或相關多肽的分泌。特別地,由于 S. degradans是一種革蘭氏陰性菌,因此Cel5H的內源性或同源的信號序列可以特別適合于其在其他革蘭氏陰性菌中的分泌。在其他實施方案中,多肽諸如Cel5H和相關多肽可以使用異源的信號序列進行分泌。天然Cel5H多肽的結構域結構可概括為GH5-PSL-CBM6-EPR-DZ,成熟Cel5H中的結構域邊界的示意性指示顯示在圖9中。Cel5H或其同源物的功能片段優選地含有GH5, CBM6和DZ結構域中的一個或多個,或與其對應的結構域(例如,Cel5H的同源物和/或變體內的類似結構域)。優選地,包含在這些片段內的結構域可以如本文預期的那樣是功能性的。因此,在具體實施方案中,本發明考慮了一些片段,諸如與下列結構域組織結構對應的那些:GH5, GH5-PSL, GH5-PSL-CBM6,GH5-PSL-CBM6-EPR, PSL-CBM6,PSL-CBM6-EPR, PSL-CBM6-EPR-DZ, CBM6, CBM6-EPR, CBM6-EPR-DZ,^P EPR-DZ, DZ。本發明還設想了與成熟 Cel5H的結構域的組合對應的片段,諸如,但不限于EPR-DZ-EPR-DZ。需注意,本發明還涉及Cel5H和具有有用的異源結構域的相關多肽的多種融合。 在此背景中,術語“異源的”表示所述一個或多個結構域來源于除Cel5H多肽或其同源物以外的多肽。因此,“異源的”當指結構域的組合時是指這樣的事實,即不同的結構域不源自 (或不是天然地存在于)同一蛋白。然而,也可以考慮另外的Cel5H來源的結構域與Cel5H 多肽或其同源物、或其片段和/或變體的融合。術語“融合”在本文中被寬泛地預期為包括尤其是遺傳融合(即,將不同的部分融合為單個可讀框)以及通過化學和/或物理手段(例如,化學交聯或光電耦合)誘導的融合。此外,融合包括直接融合或經由接頭的融合。合適的接頭可以包括而不限于至少3,優選至少4或5,更優選至少7和仍更優選至少12個氨基酸,諸如3-15個氨基酸,且優選包含非帶電氨基酸,富含非帶電氨基酸或由非帶電氨基酸組成的肽序列,所述非帶電氨基酸優選選自甘氨酸、絲氨酸、半胱氨酸、天冬酰胺、酪氨酸、谷氨酰胺、丙氨酸、纈氨酸、脯氨酸、蘇氨酸,并且更優選甘氨酸或絲氨酸。示例性的糖苷水解酶(GH)催化結構域可以來源于本身已知的糖苷水解酶(糖苷酶)或尤其是使用已確定的程序鑒定和分離的未來糖苷水解酶。示例性的糖苷酶包括分組在NC-IUBMB的EC 3.2.1. “糖苷酶”分類中的那些,更優選能夠解聚纖維素和木質纖維素(lingo-cellulosic)物質的糖苷酶,諸如,例如,纖維素酶(EC 3. 2. 1. 4.),纖維素 1,4-β-cellobiosidases(EC 3.2.1.91)和加工性內切纖維素酶(EC 3. 2. 1. 4. /EC 3 ■ 2 ■ 1· 91 ) ο
術語糖結合組件(CBM)在本領域中是已知的,并且普遍地廣義地涵蓋存在于糖苷水解酶中或來源于糖苷水解酶的所有非催化性糖(sugar)-或糖(carbohydrate)-結合組件。本文優選的CBM組件可以包括特異性結合纖維素或纖維素物質的那些并且備選地是指纖維素結合結構域(CBD)。CMB和它們的結構和功能特性的綜述參見尤其是 Tomme 等-1995( "Cellulose-binding domains-classification and properties (纖維素結合結構域分類和特性)”,于Enzymatic Degradation of Insoluble Polysaccharides (不溶性多糖的酶降解),Saddler JN & Penner M,編輯,142-163 頁, American Chemical Society (美國化學協、會),Washington (華盛頓))禾口 Boraston 等, 2004( "Carbohydrate-binding modules :fine tuning polysaccharide recognition ( H 結合組件精細調節的多糖識別)".Biochem J(生物化學雜志)382 :769-81)。黏結蛋白結合結構域當用于本文中時通常是指能夠特異性結合多纖維素酶體支架蛋白亞基的一個或多個受體(黏結蛋白)結構域的所有多肽結構域。示例性的黏結蛋白結合結構域包括存在于組裝成多纖維素酶體的糖苷水解酶中或來源于所述糖苷水解酶的錨定結構域。本文考慮I型和II型錨定結構域兩者。對錨定結構域的解釋參見尤其是 Lytle 等,2001 ( "Solution structure of a type I dockerin domain,a novel prokaryotic, extracellular calcium-binding domain(I 型錨定結構域,艮口一禾中新的原核生物細胞外鈣結合結構域的溶液結構)”.J Mol Biol (分子生物學雜志)307: 745-753) ,Adams 等,2005 ("Structural characterization of type II dockerin module from the cellulosome of Clostridium thermocellum calcium-induced effects on conformation and target recognition(來自熱纖梭菌的多纖維素酶體的II型錨定組件的結構表征鈣誘導的對構象和靶標識別的作用)” .Biochemistry (生物化學)44 2173-82)禾口參見 Bayer 等,1998( "cellulosomes-structure and ultrastructure (多纖維素酶體-結構和超微結構)”.J Struct Biol (結構生物學雜志)124 :221-234)。用于測定錨定蛋白-黏結蛋白相互作用的合適的測定法,諸如用于指導選擇本文中合適的錨定結構域,描述于尤其是 Haimovitz 等,2008 ( "Cohesin-dockerin microarray Diverse specificities between two complementary families of interacting protein modules(黏結蛋白-錨定蛋白微陣列兩個互補家族的相互作用蛋白組件之間不同的特異性),,.Proteomics (蛋白組學)8 :968-979)。另外考慮的是本文教導的多肽與有效用于糖聚合物代謝,特別地有效用于纖維素代謝中的其他多肽或酶,優選重組多肽或酶的共表達和任選地共分泌。術語“共表達”通常涉及由相同的微生物,特別地由所述微生物的相同細胞表達兩種或多種蛋白或多肽(稱為被“共表達的”)。合適的用于實現兩種或多種多肽的共表達的系統本身是已知的。非限制地,共表達的多肽可以由受相同或不同的調節元件控制的單獨的順反子編碼,或可以由單個多順反子元件編碼;這樣的順反子可以在染色體上或在相同或不同的外遺傳元件 (epigenetic element),或其組合等上。術語“糖苷水解酶”或“糖苷酶”通常包括能夠水解糖苷鍵,更特別地0-,N-或S-糖苷鍵,甚至更優選在寡糖和/或多糖物質中的這樣的鍵的酶和酶復合物。該術語包括外切糖苷酶以及內切糖苷酶。該術語特別地包括分組在NC-IUBMB的EC 3.2.1. “糖苷酶”分類中的糖苷酶。
術語“纖維素酶”通常包括能夠水解纖維素和含纖維素物質的酶和酶復合物。該術語包括而不限于下列的纖維素酶類型纖維二糖水解酶(l,4-i3_D-葡聚糖纖維二糖水解酶,EC 3.2. 1.91),內切-0-1,4-葡聚糖酶(內切_1,4-β-D-葡聚糖4-葡聚糖水解酶, EC 3. 2. 1. 4),加工性內切纖維素酶(EC 3. 2. 1. 4. /EC 3. 2. 1. 91.)和β -葡萄糖苷酶(EC 3. 2. 1. 21)。纖維素酶進一步包括內切葡聚糖酶以及(加工性)外切葡聚糖酶,并且涵蓋產生各種長度的單體和/或低聚體的酶。該術語還包括纖維二糖酶,氧化纖維素酶,葡萄糖苷酶,纖維素磷酸化酶,和通常由此表示的其他酶。該術語包括能夠降解各種形式的纖維素的酶,所述纖維素諸如而不限于結晶纖維素,半結晶纖維素,無定形纖維素,半纖維素和/或化學或生物改性的纖維素形式。借助于舉例且非限制地,解纖維素梭菌的纖維素分解系統已由B6laich等, 1997( "The cellulolytic system of Clostridium cellulolyticum(角軍纖維素梭菌的纖維素分解系統)”· J Biotechnol(生物技術雜志)57 :3-14)綜述;且Saccharophagus degradans的纖維素分解系統由Taylor等,2006(見上)綜述。本發明進一步考慮了改造的多纖維素酶體,其包含本文教導的多肽,特別地Cel5H 和相關多肽(例如,DZ-結構域和包含該結構域的多肽)。如本領域中所已知的,天然的多纖維素酶體代表某些細菌分類單位,諸如尤其是梭菌屬和擬桿菌屬(Bacteroides)的細胞外的、多酶纖維素分解復合物。天然多纖維素酶體的基本組織結構包括組織化多肽(支架蛋白),通常包含一個或多個相同或不同的糖結合組件(CBM)和一個或多個相同或不同的受體(黏結蛋白)結構域,它們促進糖苷酶或纖維素分解酶通過與所述酶中的關聯錨定結構域的相互作用而結合至多纖維素酶體復合物中。天然多纖維素酶體的這些結構特征也可以用于改造的多纖維素酶體中,由此所需的糖結合和糖解聚活性可以結合至改造的多纖維素酶體中。用于產生改造的多纖維素酶體的技術在本領域中已確定(參見,例如,Fierobe等,2002( "Degradation of cellulose substrates by cellulosome chimeras. Substrate targeting versus proximity of enzyme components (多纖維素酶體嵌合體降解纖維素底物。酶組分的底物靶向性與接近性的比較)”· J Biol Chem(生物化學雜志)277 =49621-30) ;Fierobe等, 2005("Action of designer cellulosomes on homogeneous versus complex substrates controlled incorporation of three distinct enzymes into a defined trifunctional SCaff0ldin(設計的多纖維素酶體對均質底物與復雜底物的作用比較三種不同的酶可控地結合至確定的三功能支架蛋白中)”.J Biol Chem(生物化學雜志)280 :16325-34); 以及 Perret 等,2004 ( "Production of heterologous and chimeric scaffoldins by Clostridium acetobutylicum ATCC 8 ”(丙酮丁醇梭菌ATCC8M產生異源和嵌合的支架蛋白)· J Bacteriol (細菌學雜志)186 :253-7))。通常,改造的多纖維素酶體可以含有雜交的或嵌合的支架蛋白多肽,其包含相同或不同的糖類底物特異性的一個或多個CBM組件,和一個或多個能夠結合相同或不同的關聯錨定結構域的黏結蛋白結構域。酶,諸如特別地糖苷酶或纖維素分解酶,可以借助于用于支架蛋白多肽中存在的黏結蛋白結構域的關聯錨定組件(正常存在于所述酶中和/或被改造至所述酶中)結合至多纖維素酶體中。所述酶也可以包含CBM或其他非催化性結構域。 這樣的改造的多纖維素酶體在本領域中通常被稱為“嵌合的”或“雜交的”多纖維素酶體或“小型多纖維素酶體”。備選地或另外地,所述一種或多種酶,諸如糖苷酶或纖維素分解酶可以與支架蛋白主鏈,諸如,例如,通過作為同一多肽鏈的一部分表達(即,遺傳融合)來共價連接。 這樣多纖維素酶體通常被稱為“共價的”(Mingardon等,2007,“Exploration of new geometries in cellulosome-like chimeras (在多纖維素酶體樣嵌合體中研究新的幾何學)” Appl. Environ. Microbiol.(應用和環境微生物學)73 :7138-7149)。因此,改造的多纖維素酶體,諸如雜交的,嵌合的,小型_,或共價的多纖維素酶體, 或這些形態的任意組合,或任意的其他改造的多纖維素酶體形式,被考慮與本文教導的多肽一起使用。術語“纖維素”本身在本領域中是已知的。借助于進一步的解釋而非限制,該術語可以包括所有形式的纖維素,諸如而不限于天然存在和非天然存在的纖維素形式,諸如,例如,結晶纖維素,半結晶纖維素,微晶纖維素,無定形纖維素,半纖維素,再生纖維素,和/或化學或生物學改性或衍生的纖維素形式,諸如,例如,其醚或酯,等。富含結晶纖維素的物質可以包含而不限于,至少約(w/w),例如,彡5% (w/w), 優選至少約10% (w/w),例如,彡20%,彡30%或彡40% (w/w),更優選至少約50% (w/w), 例如,彡60%或彡70% (w/w),仍更優選至少約80% (w/w),例如,彡90% (w/w)的本領域中所理解的結晶纖維素,半結晶和/或微晶纖維素,更優選結晶纖維素。用重組微生物諸如本文教導的重組微生物處理或接觸含纖維素物質的方法和過程在本領域中是普遍已知的,并且可以無限制地包括各種規模的工業發酵過程。要如此發酵的物質可以例如,以固體,半固體,液體或可溶形式提供,或作為勻漿物或提取物提供,或作為(水性)分散體或混懸液提供,或作為(部分)分離的或純化的和/或預處理的(例如,通過稀酸預處理,氫氧化鈉預處理,石灰(lime)預處理,用具有水的有機溶劑預處理, 熱液過程,或AFEX)木質素纖維素物質或纖維素物質或纖維素提供,或以其他合適的本身用于纖維素材料和生物量的解聚和/或發酵的形式提供。因此,本發明還考慮起始培養物, 其包含本發明的微生物,任選地與一種或多種其他所需的微生物組合。用于纖維素利用的生物技術方法的綜述參見尤其是Lynd等,2002( “Microbial cellulose utilization fundamentals and biotechnology (微生物纖維素利用原理和生物技術)” .Microbiol Mol Biol Rev (微生物學和分子生物學評論)66 :506-77),和 Himmel 等,2007 ( "Biomass recalcitrance !engineering plants and enzymes for biofuels production(生物量頑抗性改造用于生物燃料制備的植物和酶),,kience (科學)315 =804-807)。通過下面的非限制性實施例進一步支持上面的各個方面和實施方案。
實施例實施例1 :Cel5H的新DZ結構域的鑒定已發表的對由S. degradans產生的推測的纖維素酶的分析(Taylor等,2006,見上)表明關于Cel5H的下列組織結構(從酶的N-末端至C-末端)信號序列/催化性組件(GH-家族幻/富含絲氨酸的接頭/屬于CBM-家族6的糖結合組件/富含谷氨酸和脯氨酸的接頭,其他的名稱為信號序列-GH5-PSL-CBM6-Era。我們進行了更充分的序列分析,該分析揭示在Cel5H的C-末端處,S卩,SEQ ID N02 (圖1B)中從位置496至位置596,存在新的約100個氨基酸長的稱為DZ結構域的結構域。 因此,Cel5H的組織結構可以表示為信號序列-GH5-PSL-CBM6-EPR-DZ。由于DZ結構域富含芳香族殘基(Trp,Tyr),因此其似乎可以代表新類型的糖結合組件(CBM)。在非冗余DNA序列數據庫中對同源的結構域的搜索揭示了由來自細菌假單胞菌屬物種ND137的aclA基因編碼的推測的纖維素酶中高度同源的結構域(SEQ ID NO :4的位置465-558,圖1D)。含有此特殊結構域的其他蛋白來源于S. degradans。Cel5H的另一個非典型特征與GH5催化性組件有關,該催化性組件的長度估計為 300個氨基酸,而其他家族-5酶顯示380-450個殘基的催化性組件。因此此組件異乎尋常地短,并且缺少家族-5酶中高度保守的殘基的重要序列段。實施例2 在大腸桿菌中制備完整的(野生型),截短的Cel5H,和改造形式的 Cel5H使用分子生物學技術,編碼Cel5H的成熟形式(無信號序列)的DNA在大腸桿菌 (E. coli)表達載體(pET22b(+),Novagen)中擴增和克隆。得到的載體用于轉化大腸桿菌 BL21株(DE!3) (Novagen)。同樣,編碼截短形式或改造形式的Cel5H的修飾基因通過PCR 來獲得并在pET22b(+)中克隆,然后轉化大腸桿菌BL21株(DE3)。在所有情況下,在重組蛋白的C-末端終端處移植6個His密碼子以促進它們在鎳樹脂(Nickel resin) (Ni-NTA, Qiagen)上的純化。各種改造形式的Cel5H概括在圖2中。重組菌株在LB培養基(Luria Bertani medium)中生長并且使用IPTG作為誘導物觸發被克隆的基因的表達。通過變性聚丙烯酰胺凝膠電泳(SDS-PAGE)來驗證重組Cel5H 的合成。將培養物離心并在弗氏壓碎器(French press)中破壞收獲的細胞。實施例3 各種形式的Cel5H的純化和表征和評價對多種底物包括羧甲基纖維素 (CMC),磷酸溶脹纖維素(PASC),微晶纖維素(Avicel)和未加工底物,即孵化稻草(hatched straw)的活性通過在Ni-OTVUQiagen)上裝載粗提取物純化 Cel5H,Cel5Ht 和 Cel5Ht_CBM3a, 并使用漸增濃度的咪唑鐺(imidazolium)洗脫目的蛋白。如下所述使用FPLC Q-瓊脂糖 (sepharose) (Hitrap Q HP 樹脂,GE Healthcare)完成純化。備選地,Cel5H以及Cel5H_CBM3a和CBM3a_Cel5H構建體使用不同的程序純化。含有這些蛋白的粗提取物與PASC在4°C溫育,并離心。纖維素沉淀物通過在磷酸鹽緩沖液中離心洗滌數次,使用純水或1 %三乙胺從基質上洗脫與纖維素酶特異性結合的蛋白。通過將含有目的蛋白的級分裝載至陰離子交換樹脂(Hitrap Q HP,GE healthcare)上在pH8下使用FPLC裝置來完成純化。使用線性梯度的NaCl將蛋白從柱上洗脫。在所有情況下,通過 SDS-PAGE檢查純度,并且濃縮蛋白,分成等分試樣并保存在-80°C。使用標準條件(37°C )測試純化酶對CMC,PASC,微晶纖維素(Avicel)和孵化稻草的活性。對于針對CMC的活性的測試,酶濃度為InM且底物濃度為8g/L CMC (pH 6. 0)。多種形式的Cel5H在37°下針對CMC的活性顯示在圖3中。在所有情況下獲得的活性模式表明對Cel5H的外切(exo)作用模式而非內切(endo)作用模式。如圖3中所示,所有酶如下進行表征,即通過糖類在動力學的首先幾分鐘或幾秒鐘內大量釋放,然后酶活性大幅度減小(5分鐘后觀察到平穩期),這對于外切作用酶或加工性酶更典型。
基于初速度,Cel5H對CMC的比活性估計為20,OOOiu/μ mol。對于針對PASC的活性的測試,酶濃度為5nM且底物濃度為3. 5g/L(pH 6. 0)。多種形式的Cel5H在37°下針對PASC的活性顯示在圖4中。DZ結構域的去除(Cel5Ht)將比活性減少大約70%,顯示此結構域在Cel5H水解 PASC過程中具有重要作用?;谶@些動力學,Cel5Hwt對PASC的比活性為大約1,OOOiu/ μ mol ο 將 CBM3a 移植在 N-末端(CBM3a_Cel5H),C-末端(Cel5H_CBM3a)或代替 DZ 組件 (Cel5Ht-CBM3a)進一步減小了該酶的活性。對于針對微晶纖維素(Avicel)的活性的測試,酶濃度為IOOnM且底物濃度為 3. 5g/L(pH 6.0)。多種形式的Cel5H在37°下針對微晶纖維素(Avicel)的活性顯示在圖 5中。如對兩種其他底物所觀察到的那樣,野生型Cel5H的活性高于改造形式,并且特別地與缺少C-末端DZ結構域的截短形式相比則更高,進一步證實DZ結構域在結晶纖維素降解中的作用。與野生型Cel5H相比,其被強效的CBM3a替換僅部分地恢復微晶纖維素酶 (avicelase)活性。Cel5H對微晶纖維素(Avicel)的活性升高,其根據動力學的第一個小時期間獲得的數據計算,表明比活性為8. 5士2iu/ymol。也測試Cel5H對可溶性生色底物,對-硝基苯基-β -D-纖維二糖糖苷(para-nit rophenyl-^-D-cellobioside)的酶活性。在對硝基苯基和纖維二糖之間的連接被酶裂解后,對硝基酚和纖維二糖被釋放,并且其濃度可以通過分光光度分析直接測定。Cel5H對此底物的比活性為約14ui/μ mol。此活性為來自解纖維素梭菌的Cel5A的活性的約13倍,所述Cel5A也屬于糖苷水解酶的家族5。實施例4 來自解纖維素梭菌的野生型和改造的纖維素酶的Cel5H微晶纖維素酶活性的比較使用如實施例3中所述的測定設計,Cel5H微晶纖維素酶活性與來自解纖維素梭菌的野生型和改造的纖維素酶進行比較。酶濃度為IOOnM且底物濃度為3. 5g/L (pH 6. 0)。如圖6中所示,Cel5Hwt對微晶纖維素(Avicel)的活性為Cel9G的幾乎6倍,Cel9G 是來自解纖維素梭菌的活性最高的纖維素酶之一。與Cel9G的改造形式(其含有CBM3a和 X2 組件)(CBM-X-Cel9G,Mingardon 等,2007. Appl Environ Microbiol (應用和環境微生物學)73:7138-49.)相比,Cel5Hwt仍然保持了針對結晶纖維素的25%更多的活性。相反, 共價多纖維素酶體(其包含Cel9G和Cel48F的催化性組件和強效的CBM3a ;Mingardon等, 2007,見上)的活性僅比Cel5H多36%。通過戴安(dionex)對Cel5Hwt作用于微晶纖維素(Avicel)釋放的可溶性糖類的分析表明溫育M小時后,后一種酶主要釋放纖維二糖(67% ),纖維三糖5% )和葡萄糖㈩.5% ),即,復雜性相對低的可溶性糖類,但沒有纖維四糖。也測試Cel5H(Cel5HWt)對孵化稻草的活性(酶濃度和底物濃度分別為IOOnM和 3. 5g/L)。溫育M小時后,通過Cel5Hwt釋放大約70 μ M的可溶性糖類。通過戴安(dionex) 對可溶性糖類的分析表明Cel5H對此未加工底物的作用主要釋放葡萄糖(90% )。上述的所有動力學實驗在37°C下在20mM Tris-馬來酸酯pH 6. 0, ImM CaCl2 (疊氮化物0.01% w/v)緩沖液中進行。Cel5H的微晶纖維素酶活性也在相同緩沖液中在存在氯化鈉(171mM NaCl)的條件下測量。在NaCl的存在下,發現Cel5H的活性多10%。與37°C相比,在50°C下酶活性大幅度減小,可能是由于在50°C下酶的解折疊所引起的。得出結論,Cel5H顯示對結晶纖維素較高的活性,并且因此是在產生溶劑細菌諸如丙酮丁醇梭菌中異源制備的合適候選物,其能夠使此菌株在結晶纖維素或無定形纖維素上生長。我們的結果提示DZ組件充當纖維素結合組件(CBM),其可以有利地在底物的表面處錨定纖維素酶。迄今為止我們獲得的數據表明此酶可能是外切葡聚糖酶或內切加工性纖維素酶(并且不是內切葡聚糖酶)。值得注意的是家族-5纖維素酶通常被描述為內切葡聚糖酶。Cel5H不從純纖維素中釋放任何纖維四糖,而是產生纖維二糖,葡萄糖和纖維三糖。實施例5 將Cel5H的附屬結構域(accessory domains)和/或接頭4_移植至其他(多個)酶使用分子遺傳技術將S. degradans的DZ組件單獨或與上游CBM6和任選地與接頭 (參見圖1中的Cel5Hwt) —起連接至缺少這些組件的其他(多個)酶。選擇用于這些實驗的纖維素酶是來自解纖維素梭菌的Cel5A,其類似于Cel5H,也顯示N-末端處的家族-5催化性組件。Cel5A是一種真正的內切葡聚糖酶,其對微晶纖維素 (Avicel)具有中等活性(Fierobe 等,1991. J Bacteriol (細菌學雜志)173 :7956-62)。構建的雜交酶顯示在圖7中。純化多種改造形式的Cel5A并且測試它們對微晶纖維素(Avicel)的活性,并與 Cel5Awt 和 Cel5At 進行比較(圖 8)。DZ觀察到的活性譜表明DZ結構域的存在改善了 Cel5A活性(即,Cel5A對微晶纖維素(Avicel)的水解)。特別地,溫育M小時后,由Cel5At-DZ或Cel5At-DZ2釋放的糖類的數量為由Cel5At釋放的糖類的數量的3倍。這些結果提示該酶通過DZ結構域固定或附著在纖維素上。因此,提示DZ結構域是新類型的固定結構域。然而,觀察到的活性比Cel5At_CBM3的活性低20%。因此支架蛋白CBM結構域似乎也與改善Cel5A對結晶纖維素的活性相關。與僅具有一個DZ結構域的酶構建體相比,加入兩個DZ結構域沒有明顯地增加酶活性。也注意到,具有一個或多個附加的DZ結構域的Cel5A構建體對結晶纖維素的活性仍然為野生型Cel5H纖維素酶的4倍更低。因此,制成了包含CBM結構域(CBM6)和來自Cel5H的DZ結構域兩者的Cel5A構建體。就結晶纖維素的降解而言,在催化性Cel5A結構域和Cel5H DZ結構域之間引入CBM6 結構域增加了酶活性。實施例6 :Cel5H活性以游離的狀態或結合至雜交多纖維素酶體中來補充或增加其他纖維素酶對結晶纖維素的活性進行動力學試驗以研究Cel5H活性是否補充或增加其他纖維素酶在降解純結晶纖維素中的活性。在這些試驗中,測試下列的酶-來自解纖維素梭菌的野生型酶Cel5A(內切),Cel9G(內切),Cel9M(內切), Cel9P(內切),Cel48F(加工性)和Cel9E(加工性)。
-來自解纖維素梭菌的修飾的酶CipO_G(內切)-從除解纖維素梭菌以外的生物體分離的酶=NeocaIlimastix patriciarum(muschroom)的 Cel6A (夕卜切)。在Avicel 結晶纖維素(3. 5g/L棉塞,20mMTris-馬來酸酯pH 6,ImM CaCl2 1)上溫育M小時后由所述酶釋放的可溶性糖類的量顯示在圖9中。對于每個酶組合,第一個條形表示兩種酶單獨活性的總和,而第二個條形表示兩種酶的混合物的活性(每種酶以0. ImM 的濃度存在)。這些結果表明在大多數情況下其他纖維素的活性補充或增加Cel5H纖維素的活性。進一步的試驗包括由包含Cel5H的雜交小型多纖維素酶體降解微晶纖維素 (Avicel),所述Cel5H附加有合適的錨定組件(諸如,例如,在圖2中),一種或兩種帶有關聯錨定蛋白的其他補充性纖維素酶并結合至展示任選的CBM3a組件的雜交支架蛋白(參見圖10)。證明與單獨Cel5H或其他纖維素酶相比,底物的降解增加。實施例7 由丙酮丁醇梭菌產生和分泌單獨的或與其他纖維素酶(和/或支架蛋白)一起的Cel5H(野生型,改造的,具有修飾的信號序列)編碼Cel5H的野生型基因通過PCR從S. degradans菌株中擴增,并克隆至大腸桿菌-丙酮丁醇梭菌PS0S952穿梭載體中。此質粒是丙酮丁醇梭菌的表達載體(Perret等, 2004. J Bacteriol (細菌學雜志)186 :253-7)。目的基因的表達處于編碼硫解酶的基因的強力和組成型啟動子(Pthl)的控制下。兩個Iac操縱基因引入至pthl的上游和下游以防止大腸桿菌中該基因的任何表達。隨后載體被甲基化(體內使用菌株ER2275[pANl],體外使用甲基化酶CpG)并且如以前所述用來電轉化丙酮丁醇梭菌菌株。獲得重組克隆并且對菌落的PCR試驗指示該載體在產溶劑梭菌中仍然是完整的。幾個克隆在2YTC培養基中生長,但與對照菌株相比在培養上清中沒有檢測到附加的CMC酶活性,所述對照菌株帶有 “空” PS0S952 (在平板上的CMC酶試驗)。由于S. degradans的GC含量為約46 %,而丙酮丁醇梭菌顯示31 %的GC含量, 我們預測編碼Cel5H的野生型基因可能不能適應丙酮丁醇梭菌密碼子偏倚。如上所述在 PS0S952中制備并克隆編碼野生型Cel5H但適應丙酮丁醇梭菌密碼子偏倚的合成基因。關于丙酮丁醇梭菌的密碼子優化的Cel5H編碼序列顯示在圖IF(SEQ ID NO 6) 中,并且相應的多肽序列顯示在圖IG(SEQ ID NO 7)中。該序列含有改造的C-末端6xHis 標簽以促進檢測和/或分離。用此新載體(甲基化后)轉化丙酮丁醇梭菌生成重組菌落。在2YTC中生長后對上清液的分析揭示改善的CMC酶活性,由此顯示該重組菌株分泌有活性的Cel5H。分泌產量似乎目前仍然低于lmg/L。S. degradans是一種革蘭氏陰性菌,其顯示兩層膜(外膜和胞質膜),而丙酮丁醇梭菌(革蘭氏陽性菌)僅擁有胞質膜。Cel5H的天然信號序列因此被設計為解決跨越兩層膜分泌的問題但可能不適合于被丙酮丁醇梭菌有效分泌。為此,使用分子生物學技術,我們將Cel5H的天然信號序列替換為來自解纖維素梭菌的Cel5A的天然信號序列,因為后者被丙酮丁醇梭菌充分分泌(至多達5mg/L)。我們用包含雜交基因的載體轉化丙酮丁醇梭菌。 研究使用Cel5A信號序列時Cel5H的分泌產量。顯示通過用來自解纖維素梭菌的Cel5A的天然信號序列替換Cel5H的天然信號序列增加了分泌水平。由于對pNP-纖維二糖糖苷的強Cel5H活性,我們能夠測量到約0. 5mg/L的分泌水平。在發酵罐中在3g/L 2YT-PASC,pH固定在5,5的環境中生長重組細菌菌株的培養物。我們測量到PASC的降解,剩余纖維二糖的消耗和細菌生長。結果顯示在圖11和12中。在首個40小時期間觀察到明顯的細菌生長,直至OD值達到0.45。隨后,發生細胞溶解。此時,觀察到PASC的降解不斷增加。117小時后,68%的PASC被消耗,但未能檢測到單糖或寡糖。這提示通過水解PASC由Cel5H釋放的糖類立即被細菌消耗。這些結果顯示我們成功地構建了能夠在補充PASC的培養基上生長的菌株。該重組細菌菌株的第二個培養物在發酵罐中在2YT (然而不含有任何PASC),pH固定在5,5的環境中生長。此試驗的目標是檢查細菌生長和PASC的消耗之間的相關性。結果顯示在圖12中。如我們期望的那樣,在此情況下不能觀察到細菌生長。因此,我們可以得出結論,觀察到的細菌生長是由于PASC的降解和隨后消耗釋放的糖類所引起的。此外,建立第三個培養物,以檢查觀察到的細菌生長是否是由于Cel5H的活性而非丙酮丁醇梭菌的內源性酶系統的活性引起的。因此,含有空載體(PSOS)的菌株的培養物在發酵罐中在3g/L 2YT-PASC,pH固定在5,5的環境中生長。最后,第四個培養物在發酵罐中在5g/L 2YT-PASC,pH固定在5,5的環境中生長, 以檢查PASC濃度是否是細菌生長的限制因素。因此,較高濃度的PASC可以潛在地導致較高的OD值(即,高于在前面試驗中觀察到的0. 45的最大OD值)。編碼Cel5H的基因與編碼其他纖維素酶的基因組合進行克隆,所述其他纖維素酶以游離的狀態獨立于Cel5H起作用。備選地,在丙酮丁醇梭菌中克隆和表達編碼包含 Cel5H(附加有錨定蛋白)的有效小型多纖維素酶體的基因,支架蛋白和一種或兩種其他的攜帶合適的錨定蛋白的纖維素酶。當克隆三種或四種不同的基因時,也使用稱為pMTL的第二表達載體。此載體顯示在丙酮丁醇梭菌中與PS0S952相容。備選地,這些基因在特定的位點處(諸如尤其在已授權的PCT/EP/2006/066997中所教導的),或隨機地整合至染色體中。此外,在丙酮丁醇梭菌中克隆和表達具有Cel5H的增加的組件(特別地DZ和任選地CBM6,參見實施例4)的纖維素酶,以實現結晶纖維素的降解和利用的增加。我們使用丙酮丁醇梭菌的野生型和多種改造的菌株,諸如,例如,具有改良的分泌機器(machinery),為異源蛋白的分泌進行優化,和/或為最優化地產生乙醇(或丁醇)而具有改良的代謝的菌株。相應的重組丙酮丁醇梭菌顯示產生和分泌改造的酶,并且展示在一種或多種纖維素物質上生長和/或降解所述一種或多種纖維素物質的能力。實施例8 改善丙酮丁醇梭菌對Cel5H的分泌制備了多種構建體并且圖示于圖13,其中使用了從不同支架蛋白獲得的組件。在第一構建體中,將適應丙酮丁醇梭菌密碼子偏倚并編碼來自于Saccharophagus degradans的纖維素酶Cel5H的合成多聚核酸融合到這樣的多聚核酸,所述這樣的多聚核酸編碼運載結構域并包含CBM3a組件、從丙酮丁醇梭菌的CipA蛋白獲得的第一(Xa)和第二(Xa’)X組件和解纖維素梭菌的CipC支架蛋白的信號肽。使用適當的接頭序列將不同組件相互連接。天然Cel5H多肽的結構域結構可概括為GH5-PSL-CBM6-EPR-DZ,其中GH5代表其糖苷水解酶家族5結構域,PSL代表聚絲氨酸接頭,CBM6代表糖-結合組件家族6結構域, EPR代表富含-谷氨酸-脯氨酸區,以及不被這種解釋所限制,DZ表示被本發明人鑒定為推測的糖-結合組件的C-末端結構域。這種構建體使用重疊延伸PCR技術來構建,并克隆在穿梭表達載體PS0S952 (其賦予對抗生素紅霉素(erythromycin)的抗性)中,由此產生質粒pS0S952-CBM-Xa_Xa,-5H。 該構建體通過測序驗證,并在體內和體外甲基化。隨后甲基化的載體用于電轉化丙酮丁醇梭菌菌株ATCC 824。通過丙酮丁醇梭菌分泌的附加有來自于解纖維素梭菌的支架蛋白CipC的信號肽的野生型Cel5H蛋白為0. 5-0. 9mg/L(數值是基于培養物上清對于對-硝基苯基-纖維二糖糖苷(para-nitrophenyl-cellobioside)的活性)。然而,攜帶兩個編碼融合蛋白的構建體(該融合蛋白包含連接到運載結構域的Cel5H蛋白)的丙酮丁醇梭菌菌株在它們的生長培養基中以顯著更高的量分泌含有纖維素酶5H的融合蛋白,更特別地達到6. lmg/L (數值是基于培養物上清對于對-硝基苯基-纖維二糖糖苷的活性,參見圖14(3))。這些結果證明丙酮丁醇梭菌產生和分泌了 Cel5H。實施例9.證明根據本發明的融合蛋白對纖維素的活性。使用分子生物學技術將編碼實施例8中描述的不同蛋白構建體的DNA擴增并克隆在大腸桿菌表達載體(pET22b(+),Novagen)中。使用所產生的載體轉化大腸桿菌菌株 BL21(DE3) (Novagen)。在所有情況下,在重組蛋白的C-末端終端移植六個His密碼子以促進它們在鎳樹脂(Ni-NTA,Qiagen)上的純化。重組菌株在LB培養基(Luria Bertani medium)中生長并且使用IPTG作為誘導物觸發被克隆基因的表達。通過變性聚丙烯酰胺凝膠電泳(SDS-PAGE)驗證重組蛋白的合成。離心培養物并在弗氏壓碎器(French press)中破壞收獲的細胞。通過在Ni-NTAOliagen)上裝載粗提取物純化重組蛋白,使用漸增濃度的咪唑鐺 (imidazolium)洗脫目的蛋白。使用 FPLC Q-瓊脂糖(sepharose) (Hitrap Q HP 樹脂,GE Healthcare)完成純化。測試純化的Cel5H酶對于對-硝基苯基-纖維二糖糖苷的活性,并且結果顯示在圖15a中。備選地,使用標準條件(37°C)測量對微晶纖維素(Avicel)(微晶纖維素)的活性。結果圖示在圖15b中。實施例10 關于Cel5H同源物,特別地關于來自假單胞菌屬物種ND137的由基因 aclA編碼的ACLA采用如實施例2_7中所述的克隆和表達策略。對于顯示與來自S. degradans的Cel5H具有很大的整體同源性并且特別具有DZ 結構域的酶應用相同的策略。這由來自假單胞菌屬物種ND137的由基因aclA編碼的酶(ACLA)來例證。圖16 比較了 ACLA與Cel5H的一般組織結構。編碼ACLA的基因已經在大腸桿菌中克隆和過度表
iMffilSWBI^^^^^iiE (Aoki & KEimei 2006. European Journal of Phycology ( ^ 洲藻類學雜志)41 =321-328) 0鑒于這兩種酶之間的高度同源性(除了接頭以外),預期它們共享類似的特性/活性。因此,對ACLA應用實施例2-7中所述的克隆和表達策略,并且特別地在丙酮丁醇梭菌中產生另外的纖維素降解系統。實施例11 評價ACLA對多種底物包括對-硝基苯基-β _D_纖維二糖糖苷(pNPC), 磷酸溶脹纖維素(PASC)和微晶纖維素(Avicel)的活性使用標準條件(37°C )測試純化的ACLA酶對多種底物的活性,并與純化的重組 Cel5H對相同底物的活性進行比較。測試ACLA對可溶性生色底物對-硝基苯基-β -D-纖維二糖糖苷(pNPC)的酶活性,并與Cel5H(以95%純度)的酶活性相比較。在對硝基苯基和纖維二糖之間的連接被該酶裂解后,對硝基酚和纖維二糖被釋放,并且其濃度可以通過分光光度分析直接測定。ACLA 對于對-硝基苯基-β -D-纖維二糖糖苷的酶活性為17,9ui/μ mol,而Cel5H對相同底物的酶活性為18,2ui/ymol。因此,與Cel5H對于對-硝基苯基-β-D-纖維二糖糖苷底物的酶活性相比,ACLA顯示98 %的酶活性。對于針對PASC (無定形纖維素)的活性的測試,使用的酶濃度為5ηΜ且底物濃度為3. 5g/L(pH 6. 0)。ACLA對PASC的酶活性為780ui/μ mol, M Cel5H對相同底物的酶活性為1600ui/ymolo因此,與Cel5H對PASC的酶活性相比,ACLA顯示49%的酶活性。對于針對Avicel (結晶纖維素)的活性的測試,酶濃度為IOOnM且底物濃度為 3. 5g/L(pH 6. 0)。ACLA對Avicel的酶活性為56 μ M/Mh,而Cel5H對相同底物的酶活性為 140yM/24ho因此,與Cel5H對Avicel的酶活性相比,ACLA顯示40%的酶活性。
權利要求
1.一種重組細菌,其表達&iccharophagus degradans 2-40株的Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或變體,所述重組細菌能夠降解纖維ο
2.根據權利要求1所述的重組細菌,其包含編碼所述Cel5H多肽或其同源物的重組核酸分子,或編碼所述Cel5H多肽或所述同源物的功能片段和/或變體的重組核酸分子,所述重組核酸分子可操作地連接至允許在所述微生物中的表達的調節序列。
3.根據權利要求1或2中任一項所述的重組細菌,其是產溶劑細菌,更特別地是產乙醇細菌。
4.根據權利要求1-3中任一項所述的重組細菌,其是丙酮丁醇梭菌(Clostridium acetobutylicum)0
5.根據權利要求1-4中任一項所述的重組細菌,其中所述Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或變體融合至與所述Cel5H多肽或其同源物異源的一個或多個結構域,所述一個或多個結構域選自多纖維素酶體支架蛋白的糖苷水解酶 (GH)催化結構域,糖結合組件(CBM)結構域,黏結蛋白結合結構域諸如錨定結構域,和親水 (X組件)結構域。
6.根據權利要求1-5中任一項所述的重組細菌,其中所述Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或變體,和任選地一種或多種能夠降解含纖維素物質的酶,包含在雜交的和/或共價的多纖維素酶體或小型多纖維素酶體中。
7.Saccharophagus degradans 2-40株的Cel5H多肽的分離的結構域(DZ結構域),即所述Cel5H多肽的氨基酸496至氨基酸596或與其同源的分離的結構域,或所述DZ結構域或所述同源的結構域的功能片段和/或變體。
8.—種Cel5H多肽或其同源物或變體的分離片段,其具有結構EPR-DZ,CBM6-EPR-DZ或 PSL-CBM6-EPR-DZ,其中EI3R代表富含谷氨酸-脯氨酸的區域,且PSL代表聚絲氨酸接頭。
9.一種嵌合多肽,其包含根據權利要求7所述的分離的結構域或其功能片段和/或變體,或Cel5H多肽的根據權利要求8所述的分離片段,且還包含與Cel5H多肽或其同源物異源的一個或多個結構域,所述一個或多個結構域選自多纖維素酶體支架蛋白的GH催化結構域,CBM結構域,黏結蛋白結合結構域諸如錨定結構域,和親水(X組件)結構域。
10.一種重組核酸,其編碼根據權利要求7所述的分離的結構域或其功能片段和/或變體,或Cel5H多肽的根據權利要求8所述的分離片段,或根據權利要求9所述的嵌合多肽。
11.根據權利要求10所述的重組核酸,還包含調節序列,所述調節序列允許在宿主細菌中的表達。
12.—種用根據權利要求10或11所述的重組核酸轉化的宿主細菌。
13.根據權利要求12所述的宿主細菌,其為丙酮丁醇梭菌。
14.一種降解包含纖維素的物質的方法,所述方法包括使所述物質與根據權利要求 1-6中任一項所述的重組細菌,或與根據權利要求7所述的分離的結構域或其功能片段和/ 或變體、或Cel5H多肽的根據權利要求8所述的分離片段、或根據權利要求9所述的嵌合多肽、或根據權利要求9所述的嵌合肽、或根據權利要求12或13所述的宿主細菌接觸。
15.一種由包含纖維素的物質產生溶劑、燃料或化學中間體的方法,所述方法包括用根據權利要求1-6中任一項所述的重組微生物或用根據權利要求11或12所述的宿主細菌處理所述物質。
16.根據權利要求14或15所述的方法,其中所述物質包含或富含結晶纖維素。
全文摘要
本發明涉及Saccharophagus degradans的纖維素酶Cel5H和其同源物、功能片段和/或變體及其改造形式在重組的,更特別地產溶劑微生物,更特別地丙酮丁醇梭菌(C.acetobutylicum)的背景中的應用。本發明還表征了具有推測的纖維素結合組件功能的Cel5H纖維素酶的一個新結構域,和其在用于解聚含纖維素的物質的嵌合蛋白中的應用。
文檔編號C12N9/42GK102227498SQ200980147476
公開日2011年10月26日 申請日期2009年11月26日 優先權日2008年11月28日
發明者亨利-皮埃爾·菲耶羅布, 呂克·德迪厄, 安熱莉克·沙納爾-維亞爾, 昌塔爾·塔迪夫, 阿內-洛爾·莫利尼耶 申請人:國家科學研究中心, 國立應用科學學院, 地中海大學, 普羅旺斯大學, 道達爾公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 句容市| 克拉玛依市| 河间市| 三原县| 星子县| 黔西| 章丘市| 仁布县| 井陉县| 梅河口市| 江津市| 青海省| 全椒县| 汉寿县| 潼南县| 罗甸县| 革吉县| 宁南县| 旬阳县| 台北县| 迁安市| 且末县| 彰化市| 隆林| 古交市| 哈尔滨市| 嘉祥县| 长岭县| 鸡西市| 东阳市| 宝山区| 关岭| 南部县| 云阳县| 平舆县| 安福县| 武义县| 股票| 酒泉市| 当雄县| 罗江县|