增強表達(dá)的內(nèi)含子序列的制作方法

文檔序號：414201閱讀：813來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>食品,飲料機械,設(shè)備的制造及其制品加工制作,儲藏技術(shù)

專利名稱：增強表達(dá)的內(nèi)含子序列的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及用于鑒定并使用具有增強基因表達(dá)特性的內(nèi)含子的方法。根據(jù)本發(fā)明教導(dǎo)能夠鑒定引起內(nèi)含子介導(dǎo)性基因表達(dá)增強(ME)的內(nèi)含子。本發(fā)明還涉及包含與啟動子序列和核酸序列有效連接的所述IME內(nèi)含子的重組表達(dá)構(gòu)建體和重組表達(dá)載體。本發(fā)明還涉及用這些重組表達(dá)構(gòu)建體或載體所轉(zhuǎn)化的轉(zhuǎn)基因植物或轉(zhuǎn)基因植物細(xì)胞，涉及從其衍生的培養(yǎng)物、部分或繁殖材料，并涉及它們用于制備食品、動物飼料、種子、藥物或精細(xì)化學(xué)品的用途，涉及改善植物生物量、產(chǎn)量或提供需要的表型。發(fā)明背景植物生物技術(shù)的目標(biāo)是產(chǎn)生具備有利的新特性如抗蟲性和抗病性、環(huán)境脅迫(例如干旱)抗性、改善的品質(zhì)(例如高產(chǎn)量)或用于產(chǎn)生某些化學(xué)品或藥物的植物。適宜的基因表達(dá)速率在得到所需要的表型中發(fā)揮重要作用。基因表達(dá)速率主要受到特定基因的啟動子、位于5'非轉(zhuǎn)錄區(qū)和5'非翻譯區(qū)內(nèi)的額外DNA序列及終止子序列的調(diào)節(jié)。啟動子是位于基因5'末端的部分DNA序列，其含有RNA聚合酶啟動轉(zhuǎn)錄以至于蛋白質(zhì)合成隨后可以繼續(xù)進(jìn)行的信號。位于5'非轉(zhuǎn)錄區(qū)內(nèi)的調(diào)節(jié)性DNA序列調(diào)節(jié)應(yīng)答特定生物性刺激(例如病原體感染)或非生物刺激(例如鹽脅迫、熱脅迫、干旱脅迫)的基因表達(dá)。此外，已經(jīng)鑒定了以不依賴位置和方向的方式提高位于附近基因的表達(dá)水平的其它所謂“增強子”序列。除了位于基因非轉(zhuǎn)錄區(qū)內(nèi)的元件(例如啟動子、增強子)以外，已報道了類型廣泛的生物(例如線蟲(nematode)、昆蟲、哺乳動物和植物)中的一些內(nèi)含子具有增強基因表達(dá)的特性。在植物中，相對于缺少內(nèi)含子的構(gòu)建體而言，在基因構(gòu)建體內(nèi)包含一些內(nèi)含子導(dǎo)致增加mRNA和蛋白質(zhì)累積。這種效應(yīng)已被稱作基因表達(dá)的“內(nèi)含子介導(dǎo)性增強”(ME)(Mascarenhas 等(1990)Plant Mol. Biol. 15 :913_920)。已知在植物中刺激表達(dá)的內(nèi)含子已經(jīng)在玉米基因(例如 tubAl、Adhl、Shi、Ubil [Jeon 等(2000) Plant Physiol. 123 1005-1014;Callis等(1987)Genes Dev. I 1183-1200；Vasil ^ (1989)Plant Physiol 911575-1579 ;Christiansen 等(1992)Plant Mol. Biol. 18 :675_689])和在稻基因內(nèi)(例如salT、tpi [McElroy 等(1990)Plant Cell 2 :163-171 ;Xu 等(1994)Plant Physiol 106 459-467])中得到鑒定。類似地，已經(jīng)發(fā)現(xiàn)來自雙子葉植物基因的內(nèi)含子，如來自碧冬茄(petunia)(例如 rbcS)、馬鈴薯(例如 st-lsl)和來自擬南芥菜(Arabidopsis thaliana)(例如ubq3和patl)的那些內(nèi)含子提高基因表達(dá)速率(Dean等(1989)Plant Celll 201-208 ;Leon 等(1991)Plant Phyisiol. 95 :968_972 ;Norris 等(1993)Plant Mol Biol
21:895-906 ;Rose 和 Last (1997)Plant J 11:455-464)。已經(jīng)證實在內(nèi)含子剪接位點內(nèi)的缺失或突變降低基因表達(dá)，表明剪接作用可能是頂E所需要的(Mascarenhas等(1990)Plant Mol Biol 15 :913_920 ;Clancy 和 Hannah (2002) Plant Physiol 130:918-929)。然而，已經(jīng)通過在來自擬南芥菜的patl基因剪接位點內(nèi)點突變證實對于雙子葉植物中的某些頂E，并不需要剪接作用本身(Rose 和 Beliakoff (2000)Plant Physiol 122:535-542)。通過內(nèi)含子增強基因的表達(dá)不是普遍現(xiàn)象，因為向重組表達(dá)盒插入一些內(nèi)含子未能增強表達(dá)(例如來自雙子葉植物基因的內(nèi)含子(來自豌豆的rbcS基因、來自菜豆(bean)的菜豆蛋白基因和來自馬鈴薯(Solanumtuberosum)的stls_l基因)和來自玉米基因的內(nèi)含子(adhl基因第九內(nèi)含子、hsp81基因第一內(nèi)含子))(Chee等(1986)Gene41 :47_57 ；Kuhlemeier 等(1988)Mol Gen Genet 212 :405_411 ；Mascarenhas 等(1990)Plant MolBioll5 :913_920 ;Sinibaldi和Mettler (1992)在WE Cohn,K Moldave編輯的《Progress inNucleic Acid Research and Molecular Biology》第 42 卷，Academic Press, New York,第 229-257 頁；Vancanneyt 等 1990 Mol GenGent 220:245-250)。因此，并非可以采用每一內(nèi)含子以便在轉(zhuǎn)基因植物中操縱外源基因或內(nèi)源基因的基因表達(dá)水平。內(nèi)含子序列內(nèi)必須存在何種特征性或特異性序列特點以增強給定基因表達(dá)在現(xiàn)有技術(shù)內(nèi)是未知的，并且從現(xiàn)有技術(shù)不可能預(yù)測給定的植物內(nèi)含子在異源使用時是否將引起IME。將外來基因?qū)胄碌闹参锼拗鞑⒉豢偸菍?dǎo)致引進(jìn)基因高表達(dá)。此外，若處理復(fù)雜性狀，有時候需要以時間差異表達(dá)方式或空間差異表達(dá)方式調(diào)節(jié)數(shù)個基因。內(nèi)含子原則上可提供如此調(diào)節(jié)。然而，相同內(nèi)含子在一種植物中的多重使用已經(jīng)顯示出表現(xiàn)不利之處。在這些情況下，需要擁有用于構(gòu)建適宜的重組DNA元件的基礎(chǔ)控制元件集合。然而，可獲得的具有增強表達(dá)特性的內(nèi)含子集合是有限的并且需要替代物。因此，對包括啟動子、調(diào)節(jié)序列(例如誘導(dǎo)元件、增強子)或內(nèi)含子序列在內(nèi)的影響基因表達(dá)速率的基本控制元件的需要仍持續(xù)增長。本發(fā)明的目的因此是提供用于鑒定具有增強表達(dá)特性的內(nèi)含子的高度可重復(fù)和可靠的方法。該目標(biāo)通過本發(fā)明中提供的方法得到實現(xiàn)。發(fā)明簡述本發(fā)明的第一主題物因而涉及用于鑒定具有在植物中增強表達(dá)特性的內(nèi)含子的方法，包括從植物基因組中選擇內(nèi)含子，其中所述的內(nèi)含子具有至少如下特征I)內(nèi)含子長度短于1，000堿基對，并且II)存在包含二核苷酸序列5' -GT-3' (SEQ ID NO :78)的5'剪接位點，并且III)存在包含三核苷酸序列5' -CAG-3' (SEQ ID NO :79)的3'剪接位點，并且IV)在3'剪接位點上游存在類似于共有序列5' -CURAY-3' (SEQ IDNO :75)的分支點，并且V)從5'剪接位點向下游100個核苷酸范圍至少40%的腺嘌呤加胸腺嘧啶含量，并且VI)從3'剪接位點向上游100個核苷酸范圍至少50%的腺嘌呤加胸腺嘧啶含量，并且VII)整個內(nèi)含子范圍至少50%的腺嘌呤加胸腺嘧啶含量和至少30%的胸腺嘧啶含量。在另一實施方案中，本發(fā)明涉及用于在植物內(nèi)含子群體中富集具有在植物中增強表達(dá)特性的內(nèi)含子數(shù)目至所述群體的至少50%的方法，該方法包括從所述群體內(nèi)選擇內(nèi)含子，其中該內(nèi)含子具有至少如下特征
I)內(nèi)含子長度短于1，000堿基對，并且II)存在包含二核苷酸序列5' -GT-3' (SEQ ID NO :78)的5'剪接位點，并且III)存在包含三核苷酸序列5' -CAG-3' (SEQ ID NO :79)的3'剪接位點，并且IV)在3'剪接位點上游存在類似于共有序列5' -CURAY-3' (SEQ IDNO :75)的分支點，并且V)從5'剪接位點向下游100個核苷酸范圍至少40%的腺嘌呤加胸腺嘧啶含量，并且VI)從3'剪接位點向上游100個核苷酸范圍至少50%的腺嘌呤加胸腺嘧啶含量，并且VII)整個內(nèi)含子范圍至少50%的腺嘌呤加胸腺嘧啶含量和至少30%的胸腺嘧啶含量。優(yōu)選地，選擇用于富集具有在植物中增強基因表達(dá)特性的內(nèi)含子的植物內(nèi)含子群體包含在基因組DNA序列數(shù)據(jù)庫或植物基因組DNA文庫中代表植物基因組的基本上全部的內(nèi)含子。在優(yōu)選的實施方案中，在植物中具有增強基因表達(dá)的特性的內(nèi)含子(“IME內(nèi)含子”)通過本發(fā)明的用于鑒定IME內(nèi)含子的方法或本發(fā)明的用于在植物內(nèi)含子群體中富集ME內(nèi)含子的數(shù)目的方法進(jìn)行選擇。優(yōu)選地，所述內(nèi)含子選自位于編碼蛋白質(zhì)的兩個外顯子之間的內(nèi)含子或位于相應(yīng)基因的5'非翻譯區(qū)內(nèi)部的內(nèi)含子。在特別優(yōu)選的實施方案中，IME內(nèi)含子通過本發(fā)明的方法之一從基因的組或群中鑒定或富集，其中所述基因代表在使用植物細(xì)胞、植物組織或完整植物所開展的基因表達(dá)分析實驗中具有最高表達(dá)速率的基因的10%部分。本發(fā)明還涉及方法，在該方法中用于鑒定或富集ME內(nèi)含子的基因序列信息存在于DNA序列數(shù)據(jù)庫內(nèi)，并且鑒定或富集所述內(nèi)含子的選擇步驟使用自動化方法、優(yōu)選地通過使用計算機裝置和算法開展，其中所述算法定義了為完成鑒定或富集所述內(nèi)含子的選擇步驟所需要的指令。此外，本發(fā)明涉及定義指令的計算機算法，其中所述指令是完成從植物基因組或這樣的內(nèi)含子群體中鑒定或富集頂E內(nèi)含子的選擇步驟所需要的，其中所述的內(nèi)含子群體選自位于編碼蛋白質(zhì)的兩個外顯子之間的內(nèi)含子，和/或位于相應(yīng)基因的5'非翻譯區(qū)內(nèi)部的內(nèi)含子和/或位于基因的DNA序列內(nèi)的內(nèi)含子，其中所述的基因代表在使用植物細(xì)胞、植物組織或完整植物所開展的基因表達(dá)分析實驗中具有最高表達(dá)速率的基因的10%部分。本發(fā)明還涉及包含如上所述算法的計算機裝置或數(shù)據(jù)存儲裝置。在優(yōu)選的實施方案中，本發(fā)明涉及用于分離、提供或產(chǎn)生ME內(nèi)含子的方法，包括步驟如上所述開展ME內(nèi)含子的鑒定或富集并提供已鑒定或已富集的所述ME內(nèi)含子的序列信息，并提供已鑒定或已富集的所述頂E內(nèi)含子的物理核苷酸序列及評估分離的內(nèi)含子在體內(nèi)(in vivo)表達(dá)實驗或體外(in vitro)表達(dá)實驗中增強基因表達(dá)的特性，以及從在體內(nèi)表達(dá)實驗或體外表達(dá)實驗中已測試的內(nèi)含子的群體中分離ME內(nèi)含子。優(yōu)選地，IME內(nèi)含子增強基因表達(dá)特性的評估在植物細(xì)胞內(nèi)完成并且其中ME內(nèi)含子增強給定核酸的表達(dá)至少兩倍。本發(fā)明的另一主題物涉及重組DNA表達(dá)構(gòu)建體，其包含在植物細(xì)胞中有功能的至少一個啟動子序列、至少一個核酸序列和選自SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21和22所描述序列及其功能性等效物中的至少一個內(nèi)含子，其中所述啟動子序列和至少一個所述內(nèi)含子序列功能性地連接于所述核酸序列，并且其中所述內(nèi)含子對所述核酸序列或?qū)λ鰡幼有蛄惺钱愒吹摹４送猓景l(fā)明涉及重組表達(dá)構(gòu)建體，其包含在植物細(xì)胞中有功能的至少一個啟動子序列、至少一個核酸序列和由序列 SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21和22中任意一個所描述內(nèi)含子的至少一個功能性等效物，其中所述的功能性等效物包含內(nèi)含子的功能性元件并且具有如下特征a)該序列具有由 SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、
21或22中任意一個所述的內(nèi)含子序列的至少50個連續(xù)堿基對，或b)與由 SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21 或 22
中任意一個所述的序列的跨越至少95個連續(xù)核酸堿基對的序列具有至少80%同一性，或c)在高度嚴(yán)格條件下與由 SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、
18、19、20、21或22中任意一個所描述核酸分子中至少50個連續(xù)堿基對的核酸片段雜交，其中所述的啟動子序列和至少一個所述的內(nèi)含子序列功能性地連接于所述核酸序列，并且其中所述的內(nèi)含子對所述的核酸序列或?qū)λ龅膯幼有蛄惺钱愒吹摹Ｔ诹硪粚嵤┓桨钢校景l(fā)明的重組DNA表達(dá)構(gòu)建體還含有與啟動子功能性連接的一種和多種額外的調(diào)節(jié)序列。這些調(diào)節(jié)序列可以選自熱休克應(yīng)答元件、厭氧應(yīng)答元件、病原體應(yīng)答元件、干旱應(yīng)答元件、低溫應(yīng)答元件、ABA應(yīng)答元件、5'非翻譯基因區(qū)、3'翻譯基因區(qū)、轉(zhuǎn)錄終止子、多腺苷酸化信號和增強子。本發(fā)明重組DNA表達(dá)構(gòu)建體的核酸序列可以引起由所述的核酸序列編碼的蛋白質(zhì)和/或有義RNA、反義RNA或雙鏈RNA的表達(dá)。在另一實施方案中，編碼本發(fā)明轉(zhuǎn)基因表達(dá)構(gòu)建體的核苷酸序列是雙鏈的。在又一個實施方案中、編碼本發(fā)明轉(zhuǎn)基因表達(dá)構(gòu)建體的核苷酸序列是單鏈的。仍在本發(fā)明的另一個替代性實施方案中，重組表達(dá)構(gòu)建體包含編碼選擇標(biāo)記蛋白質(zhì)、篩選標(biāo)記蛋白質(zhì)、合成活性蛋白質(zhì)、分解活性蛋白質(zhì)、抗生物脅迫蛋白質(zhì)或抗非生物脅迫蛋白質(zhì)、雄性不育蛋白質(zhì)或影響植物農(nóng)學(xué)特征的蛋白質(zhì)的核酸序列。本發(fā)明還涉及含有本發(fā)明轉(zhuǎn)基因表達(dá)構(gòu)建體的載體。此外,本發(fā)明涉及包含表達(dá)載體的轉(zhuǎn)基因細(xì)胞或轉(zhuǎn)基因非人生物，如細(xì)菌、真菌、酵母或植物，其中所述的表達(dá)載體含有本發(fā)明的轉(zhuǎn)基因表達(dá)構(gòu)建體。在優(yōu)選的實施方案中，用本發(fā)明的表達(dá)構(gòu)建體轉(zhuǎn)化的轉(zhuǎn)基因細(xì)胞或轉(zhuǎn)基因非人生物是單子葉植物或衍生自該植物。在又一個更優(yōu)選的實施方案中，單子葉植物選自大麥屬(Hordeum)、燕麥屬(Avena)、黑麥屬(Secale)、小麥屬(Triticum)、高粱屬(Sorghum)、玉蜀黍?qū)?Zea)、甘鹿屬(Saccharumu)和稻屬(Oryza)。本發(fā)明的其它實施方案涉及細(xì)胞培養(yǎng)物、部分或繁殖材料，其衍生自用本發(fā)明載體轉(zhuǎn)化的或含有本發(fā)明重組表達(dá)構(gòu)建體的非人生物，如細(xì)菌、真菌、酵母和/或植物，優(yōu)選地是單子葉植物，最優(yōu)選地是大麥屬、燕麥屬、黑麥屬、小麥屬、高粱屬、玉蜀黍?qū)佟⒏收釋俸偷緦俚闹参铩１景l(fā)明還涉及用于提供增強植物或植物細(xì)胞中核酸序列表達(dá)的表達(dá)盒的方法，包括步驟:將選自 SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21 和22 的至少一個序列與所述核酸序列功能性地連接。
本發(fā)明還涉及用于增強植物或植物細(xì)胞中核酸序列表達(dá)的方法，包括步驟將選自 SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21 和 22 的至少一個序
列與所述核酸序列功能性地連接。本發(fā)明另外的實施方案涉及方法a)用于提供增強植物或植物細(xì)胞中核酸序列表達(dá)的表達(dá)盒，或b)用于增強植物或植物細(xì)胞中核酸序列表達(dá)，所述的方法包括將選自SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、
19、20、21和22的至少一個序列與所述核酸序列功能性地連接，其中在植物中有功能的啟動子序列還與所述核酸序列連接。優(yōu)選地、選自SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21
和22的至少一個序列經(jīng)同源重組插入植物基因組內(nèi)而與核酸序列連接。優(yōu)選地，所述的同源重組包括至少如下步驟a)在體內(nèi)或在體外提供包含在兩側(cè)具有如此序列(“重組底物”)的內(nèi)含子的DNA構(gòu)建體，其中所述的序列允許在所述表達(dá)盒的啟動子和核酸之間與預(yù)先存在的表達(dá)盒發(fā)生同源重組,和b)用包含步驟a)內(nèi)所述表達(dá)盒轉(zhuǎn)化受體植物細(xì)胞并再生轉(zhuǎn)基因植物，其中所述的內(nèi)含子已插入所述植物的基因組。優(yōu)選地，整合至所述植物基因組內(nèi)的位點通過步驟a)中的重組底物的DNA序列確定，其中與所述的基因組靶DNA序列共有足夠同源性(如本文中所定義的)的所述序列允許經(jīng)同源重組在所述的基因組靶DNA基因座處發(fā)生序列特異性整合。在本發(fā)明優(yōu)選的實施方案中，所述的受體植物或受體植物細(xì)胞是單子葉植物或單子葉植物細(xì)胞，更優(yōu)選地是選自的大麥屬、燕麥屬、黑麥屬、小麥屬、高粱屬、玉蜀黍?qū)佟⒏收釋俸偷緦俚闹参铮顑?yōu)選地是玉米植物。優(yōu)選地，與本發(fā)明的內(nèi)含子之一功能性地連接的核酸序列編碼選擇標(biāo)記蛋白質(zhì)、篩選標(biāo)記蛋白質(zhì)、合成活性蛋白質(zhì)、分解活性蛋白質(zhì)、抗生物脅迫蛋白質(zhì)或抗非生物脅迫蛋白質(zhì)、雄性不育蛋白質(zhì)或影響植物農(nóng)學(xué)特征的蛋白質(zhì)和/或有義RNA、反義RNA或雙鏈RNA。此外，本發(fā)明涉及本發(fā)明的轉(zhuǎn)基因生物或衍生自該轉(zhuǎn)基因生物的細(xì)胞培養(yǎng)物、部分或轉(zhuǎn)基因繁殖材料的用途，用于產(chǎn)生食品、動物飼料、種子、藥物或精細(xì)化學(xué)品。本發(fā)明還涉及重組DNA表達(dá)構(gòu)建體,包含a)在植物或植物細(xì)胞中有功能的至少一個啟動子序列，和b)選自在植物或植物細(xì)胞內(nèi)具有增強表達(dá)特性的內(nèi)含子中的至少一個內(nèi)含子，其具有至少如下特征I)內(nèi)含子長度短于1，000堿基對，并且II)存在包含二核苷酸序列5' -GT-3' (SEQ ID NO :78)的5'剪接位點，并且III)存在包含三核苷酸序列5' -CAG-3' (SEQ ID NO :79)的3'剪接位點，并且IV)在3'剪接位點的上游存在類似于共有序列5' -CURAY-3' (SEQID NO 75)的分支點，并且V)從5'剪接位點向下游100個核苷酸范圍至少40%的腺嘌呤加胸腺嘧啶含量，并且
VI)從3'剪接位點向上游100個核苷酸范圍至少50%的腺嘌呤加胸腺嘧啶含量，并且VII)整個內(nèi)含子范圍至少55%的腺嘌呤加胸腺嘧啶的含量和至少30%的胸腺嘧啶含量，和c)至少一個核酸序列，其中所述的啟動子序列和至少一個所述的內(nèi)含子序列功能性地連接于所述核酸序列，并且其中所述的內(nèi)含子對所述核酸序列和/或?qū)λ龅膯幼有蛄惺钱愒吹摹８綀D
簡述圖 I :pBPSMM291(SEQ ID NO 109)的圖譜該載體包含玉米遍在蛋白啟動子，其后是BPSI. I，隨后是⑶SintORF(包含馬鈴薯轉(zhuǎn)化酶[PIV]2內(nèi)含子以防止細(xì)菌性表達(dá))，再后是胭脂氨酸合成酶(NOS)終止子。該載體含有attLl和attL2位點以使該載體兼容于來自InvitrogenTM的Gateway .克隆技術(shù)的修飾。該載體以基于PUC的表達(dá)載體pBPSMM267為基礎(chǔ)。XmaI-RsrII消化的BPSI. IPCR產(chǎn)物與XmaI-RsrII消化的pBPSMM267連接以產(chǎn)生pBPSMM291。相應(yīng)地，產(chǎn)生載體pBPSMM293、PBPSMM294 和 pBPSMM295 (見表 6 和 I. 6. I)。圖 2 pBPSMM305 (SEQ ID NO 110)的圖譜表達(dá)載體PBPSMM305包含無內(nèi)含子(所述內(nèi)含子能推動⑶Sint ORF表達(dá)(包含馬鈴薯轉(zhuǎn)化酶[PIV]2內(nèi)含子以防止細(xì)菌性表達(dá)))的玉米乳酸脫氫酶(LDH)啟動子，隨后是NOS終止子。已經(jīng)使用該載體來產(chǎn)生基于pUC的表達(dá)載體pBPSJB041、pBPSJB042、PBPSJB043、pBPSJB044、pBPSJB045、pBPSJB046 和 pBPSJB050 (見實施例 2. 3)。圖3 pBPSMM350 (SEQ ID NO :111)的圖譜載體pBPSMM350包含玉米遍在蛋白啟動子，其后是BPSL 1，隨后是⑶Sint ORF(包含馬鈴薯轉(zhuǎn)化酶[PIV]2內(nèi)含子以防止細(xì)菌性表達(dá))，再后是胭脂氨酸合成酶(NOS)終止子。表達(dá)盒已經(jīng)使用來自Invitrogen 的(ii'丨teway⑩克隆技術(shù)從載體中進(jìn)行轉(zhuǎn)移。相應(yīng)地產(chǎn)生載體 pBPSMM353、pBPSMM312 和 pBPSMM310 (見表 6 和實施例 I. 6. 2)。圖 4 pBPSLM139(SEQ ID NO 112)的圖譜載體pBPSLM139包含選擇標(biāo)記表達(dá)盒。為產(chǎn)生載體pBPSLI017至pBPSLI023，PmeI/PacI 片段自載體 pBPSJB-042、-043、-044、-045,046 和 050 中分離并克隆至 PmeI-PacI 消化的PBPSLM130 (見實施例2. 3和2. 4)。圖5a_f :用于從NCBI基因庫文件中檢索序列信息的計算機算法。圖6 :在5葉階段㈧、開花階段⑶和結(jié)種子階段(C)測試轉(zhuǎn)基因植物的GUS表達(dá)，其中所述轉(zhuǎn)基因植物含有帶BPSI. I內(nèi)含子的啟動子構(gòu)建體(除PBPSLM229以外的全部)或帶BPSI. 5內(nèi)含子的啟動子構(gòu)建體(僅PBPSLM229)。所示是從至少15個獨立事件中得到的代表性染色模式的實例。全部樣品在GUS溶液中染色16個小時。構(gòu)建體中的啟動子是稻葉綠體蛋白12(0s.CP12 ;pBPSMM355)、玉米羥脯氨酸豐富糖蛋白(Zm. HRGP ；PBPSMM370)、稻P-咖啡酰輔酶A 3-0-甲基轉(zhuǎn)移酶(Os. CCoAMTI ;pBPSMM358)、玉米球蛋白-I啟動子W64A(Zm.Glbl ;EXS1025)、推定的稻H+轉(zhuǎn)運ATP合酶啟動子(Os. V-ATP酶；PBPSMM369)、Zm. LDH(pBPSMM357)、稻 C-8，7 固醇異構(gòu)酶啟動子(Os. C8, 7 SI ；pBPSMM366)、稻晚期胚胎發(fā)生豐富蛋白啟動子(Os. Lea ；pBPSMM371)和玉米乳酸脫氫酶啟動子(ZM. LDH ；PBPSLM229)。一般定義應(yīng)當(dāng)理解本發(fā)明不受如本文中所述的具體方法學(xué)、方案、細(xì)胞系、植物種和植物屬、構(gòu)建體和試劑限制。必須指出如本文中所用和在后續(xù)的權(quán)利要求書內(nèi)，單數(shù)形式“a”和“the”包括復(fù)數(shù)指稱，除非上下文清楚地說明。因此，對一個載體的指稱是對一個和多個載體的稱謂并且包括本領(lǐng)域技術(shù)人員已知的其等效物。約術(shù)語“約”在本文中用于指大致、大體、左右和在范圍內(nèi)。當(dāng)術(shù)語“約”與數(shù)字范圍一起使用時，它通過使界限延伸高于和低于所述數(shù)值而修飾該范圍。通常，術(shù)語“約”在本文中用于修飾數(shù)值高于和低于所述數(shù)值達(dá)20%的變異、優(yōu)選地是10%以上和以下(更高或更低)。如本文中所用，詞“或”意指特定列中的任一成員。農(nóng)桿菌(Agrobacterium):指引起冠癭的土生性革蘭氏陰性桿狀植物病原性細(xì)菌。術(shù)語“農(nóng)桿菌”包括，但不限于根癌農(nóng)桿菌菌株(Agrobacteriumtumefaciens)(其通常在感染的植物中引起冠癭)和發(fā)根農(nóng)桿菌菌株(Agrobacterium rhizogenes)(其在感染的植物中引起毛發(fā)狀根病)。用農(nóng)桿菌感染植物細(xì)胞通常引起感染的細(xì)胞產(chǎn)生冠癭堿(例如胭脂氨酸、農(nóng)桿堿、章魚堿等)。因此，將引起胭脂氨酸產(chǎn)生的農(nóng)桿菌菌株(例如菌株LBA4301、C58、A208)稱作“胭脂氨酸型”農(nóng)桿菌；將引起章魚堿產(chǎn)生的農(nóng)桿菌菌株(例如菌株LBA4404、Ach5、B6)稱作“章魚堿型”農(nóng)桿菌，并且將引起農(nóng)桿堿產(chǎn)生的農(nóng)桿菌菌株(例如菌株EHA105、EHA101、A281)稱作“農(nóng)桿堿型”農(nóng)桿菌。算法如本文中所用指計算機處理信息的方式，因為計算機程序?qū)嵸|(zhì)上是告訴計算機(以何種具體順序)實施哪些具體步驟以便執(zhí)行指定任務(wù)(如鑒定一套基因的編碼區(qū))的算法。因此，可以將算法視作可以由計算機系統(tǒng)實施的操作的任何順序。通常，當(dāng)算法與處理信息結(jié)合時，數(shù)據(jù)從輸入來源或輸入裝置中讀出，書寫至輸出器或輸出裝置和/或為其它用途儲存。對于任何此類計算方法，算法必須嚴(yán)格經(jīng)過定義以如此方式加以指定以致于它可以適應(yīng)于可能出現(xiàn)的全部可能環(huán)境內(nèi)。因此，任何條件性步驟必須系統(tǒng)地逐案處理；用于每一案例的標(biāo)準(zhǔn)必須是清晰的(和可計算的)。因為算法是精確步驟的精確列表，計算的順序幾乎總是對算法的功能至關(guān)重要。通常假定指令得到清晰地列出并且描述為“從頂部”開始并“下行至底部”，該概念通常更正式地由流程控制描述。在計算機應(yīng)用中，腳本是自動操作一類任務(wù)的計算機程序，否則用戶可能要在鍵盤上交互地完成所述的任務(wù)。廣泛用來書寫此類腳本的語言稱作腳本化語言。此類眾多語言非常復(fù)雜并已經(jīng)用于書寫復(fù)雜的程序，這些程序常常仍稱作腳本，即便它們已經(jīng)遠(yuǎn)遠(yuǎn)不止是使用戶任務(wù)的簡單順序自動化。人們出于多種目的和不同類型的任務(wù)及編程風(fēng)格創(chuàng)造了計算機語言。腳本編程語言(通常叫腳本化語言或腳本語言)是設(shè)計用于使計算機操作教本化的計算機編程語言。早期的腳本語言通常叫做批處理語言或工作控制語言。腳本語言的實例是ACS、ActionScript、ActiveServerPages(ASP)、AppleScript、Awk> BeanShell (用于 Java 的腳本)、bash、Brain、CobolScript、csh、ColdFusion、Dylan、Escapade (服務(wù)器端腳本)、Euphoria、Groovy、Guile、Haskell、Hype;rTalk、ICI、IRC 腳本、JavaScript、mIRC 腳本、MS-DOS batch、Nwscript、Perl、PHP> Pike、ScriptBasic。反義理解為具有與靶序列例如信使RNA(mRNA)互補的序列的核酸。如本文中所用。術(shù)語“互補的”或“互補性”用來指因堿基配對原則而相關(guān)的核苷酸序列。例如，序列5, -AGT-3,與序列5, -ACT-3'是互補的。互補可以是“部分的”或“全部的”。“部分”互補是根據(jù)堿基配對原則一個或多個核酸堿基不匹配的情況。核酸間“全部”或“完全”互補是每一和所有核酸堿基在堿基配對原則下與另一堿基配對。核酸鏈之間互補的程度對核酸鏈之間雜交的效率和強度有顯著的影響。有義理解為意指具有與靶序列(例如與剪接體的蛋白質(zhì)因子結(jié)合的序列)同源或完全相同的序列的核酸。轟擊、“轟擊“”和“生物射彈轟擊”:指這樣的方法，其使粒子(微拋射體)向生物學(xué)靶樣品(例如細(xì)胞、組織等)加速運動以造成生物學(xué)靶樣品中的細(xì)胞的細(xì)胞膜損傷和/或使粒子穿入生物學(xué)靶樣品。用于生物射彈轟擊的方法在本領(lǐng)域是已知的(例如US5，584，807，其內(nèi)容在本文引用作為參考)，并且是可商業(yè)獲得的(例如氦氣驅(qū)動的微拋射體加速儀(PDS-1000/He) (BioRad))。細(xì)胞指單個細(xì)胞。術(shù)語“多個細(xì)胞”指細(xì)胞群。細(xì)胞群可以是包含一種細(xì)胞的純細(xì)胞群。類似地，細(xì)胞群可以包含多于一種細(xì)胞類型。在本發(fā)明中，對細(xì)胞群可以包含的細(xì)胞類型的數(shù)目不加以限制。細(xì)胞可以是同步化的或不是同步化的，細(xì)胞優(yōu)選地是同步化的。染色體DNA或染色體DNA序列應(yīng)當(dāng)理解為與細(xì)胞周期狀態(tài)無關(guān)的細(xì)胞核的基因組DNA。染色體DNA因此可以是組織于染色體或染色單體內(nèi)的，它們可以是壓縮的或解螺旋狀的。對染色體DNA的插入可以通過本領(lǐng)域已知的多種方法進(jìn)行證實并分析，例如聚合酶鏈?zhǔn)椒磻?yīng)(PCR)分析、DNA印跡分析、熒光原位(in situ)雜交(FISH)和原位PCR。編碼區(qū)或編碼序列(CDS):當(dāng)用來指基因時，是編碼存在于作為mRNA分子翻譯結(jié)果的新生多肽內(nèi)氨基酸的核酸序列。在真核生物內(nèi)，編碼區(qū)的5'側(cè)為編碼起始甲硫氨酸的核苷酸三聯(lián)體“ATG”并且3'側(cè)為作為終止密碼子(即TAA，TAG，TGA)的三個三聯(lián)體之一。核酸序列的互補序列如本文中所用指其核酸與該核酸序列的核酸完全互補的核苷酸序列。十分位數(shù)當(dāng)與統(tǒng)計數(shù)據(jù)一起使用時，是將分類的數(shù)據(jù)劃分成10個相等部分的10個值中的任意值，以致于每個部分代表樣品或群體的1/10。因此第一位十分位數(shù)分出數(shù)據(jù)中最低的10%，第九位十分位數(shù)分出數(shù)據(jù)中最低的90%或數(shù)據(jù)中最高的10%。四分位數(shù)是將分類的數(shù)據(jù)劃分成4個相等部分的3個值中的任意值，以致于每個部分代表樣品或群體的1/4 (第三個四分位數(shù)=較高的四分位數(shù)=分出數(shù)據(jù)中最高的25 %或最低的75 % =第75個百分位數(shù))。百分位數(shù)是將分類的數(shù)據(jù)劃分成100個相等部分的99個值中的任意值，以致于每個部分代表樣品或群體的1/100。因此，第一位百分位數(shù)數(shù)分出數(shù)據(jù)中最低的1%，第98位百分位數(shù)分出數(shù)據(jù)中最低的98%并且第25位百分位數(shù)分出數(shù)據(jù)中最低的25%。DNA數(shù)據(jù)庫在生物信息學(xué)領(lǐng)域中，DNA序列數(shù)據(jù)庫是儲存在計算機內(nèi)的DNA序列的龐大集合。數(shù)據(jù)庫可以包括僅來自一種生物的序列，或它可以包括來自其DNA序列已經(jīng)測序的全部生物的序列。富集當(dāng)與選擇本發(fā)明內(nèi)含子一起使用時，指在內(nèi)含子群體(例如代表存在于基因組DNA序列數(shù)據(jù)庫內(nèi)的植物基因組中全部內(nèi)含子的內(nèi)含子群體)中鑒定具有增強基因表達(dá)特性的內(nèi)含子的成功率的增加。富集通過使用本發(fā)明的方法或本發(fā)明的選擇標(biāo)準(zhǔn)減少候選內(nèi)含子的數(shù)目得以實現(xiàn)。作為實例，若通過使用本文中所述的用于測量基因表達(dá)增強的方法，從給定內(nèi)含子群體中鑒定具有增強表達(dá)特性的內(nèi)含子的成功率是10個已分析內(nèi)含子中的I個內(nèi)含子，富集應(yīng)當(dāng)被理解為通過使用本發(fā)明的方法，增加已鑒定的具有增強基因表達(dá)特性的內(nèi)含子的數(shù)目至10個已分析內(nèi)含子中的至少5個內(nèi)含子。因此，通過使用作為預(yù)選擇方法或過濾方法的本發(fā)明方法，將需要進(jìn)行分析以鑒定一個本發(fā)明內(nèi)含子的內(nèi)含子數(shù)目減少至兩個內(nèi)含子。增強表達(dá)特性的評估評估內(nèi)含子的增強表達(dá)特性可以使用本領(lǐng)域已知的方法完成。例如，待測定其基因表達(dá)增強效應(yīng)的候選內(nèi)含子序列可以插入編碼報告基因(例如可見的標(biāo)記蛋白、選擇標(biāo)記蛋白質(zhì))的核酸序列的5' UTR，處于在植物或植物細(xì)胞內(nèi)有活性的適宜啟動子控制下以產(chǎn)生報告載體。此報告載體和缺少候選內(nèi)含子的完全相同的對照報告載體可以使用本文中所述的方法導(dǎo)入植物組織，并且可以測量并比較依賴于候選內(nèi)含子存在的報告基因的表達(dá)水平(例如檢測所編碼mRNA或所編碼蛋白質(zhì)的存在或由報告基因編碼的蛋白質(zhì)的活性)，具有增強表達(dá)特性的內(nèi)含子將產(chǎn)生比參考值高的表達(dá)速率，其中所述參考值在不改變其它條件下用缺少候選內(nèi)含子的完全相同的對照報告載體得到。報告基因可以表達(dá)可見的標(biāo)記。表達(dá)可見的標(biāo)記的報告基因系統(tǒng)包括葡糖醛酸糖苷酶及其底物(X-Gluc)、螢光素酶及其底物(螢光素)和半乳糖苷酶及其底物·(X-Gal)，它們不但廣泛地用來鑒定轉(zhuǎn)化體，而且還用來對源于具體載體系統(tǒng)的瞬時或穩(wěn)定蛋白質(zhì)的表達(dá)量定量(Rhodes (1995)Methods Mol Biol 55:121-131)。極特別地優(yōu)選用β_葡糖醒酸糖苷酶(GUS)的測定法(Jefferson等,GUS fusions beta-glucuronidase asa sensitive andversatile gene fusion marker in higher plants. EMBO J. (1987)Dec20 ；6 (13) =3901-3907)。β -葡糖醛酸糖苷酶(GUS)的表達(dá)通過組織與5-溴-4-氯-3-吲哚基-β -D-葡糖醛酸溫育時的藍(lán)色進(jìn)行檢測。選擇標(biāo)記基因可以提供抗生素耐抗性或除草劑抗性。報告基因的實例包括但不限于提供甲氨喋呤抗性的dhfr基因(Wigler (1980)Proc. Natl. Acad. Sci 77 =3567-3570);提供氨基糖甙類新霉素和G-418抗性的npt (Colbere-Garapin (1981) J. Mol. Biol. 150 :1_14)和分別提供氯磺隆和草銨膦乙酰基轉(zhuǎn)移酶的als或pat。期望值當(dāng)在DNA序列比對或DNA序列數(shù)據(jù)庫搜索環(huán)境下使用時，指可能在整個數(shù)據(jù)庫的搜索中期望特定匹配或更佳的匹配純粹偶然發(fā)生的次數(shù)。因此，期望值越低，輸入序列與匹配之間的相似性越高。期望值(E)是這樣的參數(shù)，它描述人們在搜索特定大小的數(shù)據(jù)庫時可以僅因偶然而“期望”看到的命中數(shù)。期望值隨著對兩種序列間匹配所賦予的相似性記分(S)呈指數(shù)性下降。相似性記分越高，E值越低。實際上，E值描述了對于序列間匹配存在的隨機背景噪聲。期望值作為便利的手段用于產(chǎn)生報道結(jié)果的顯著性閾值。對命中所賦予的E值I可以解釋為意指在目前大小的數(shù)據(jù)庫內(nèi)，你可能期望看到純粹偶然地具有相似性記分的I個匹配。E值受a)序列長度(詢問的序列越長，詢問在數(shù)據(jù)庫內(nèi)因偶然而找到一個序列的概率越低)，b)數(shù)據(jù)庫大小(數(shù)據(jù)庫越大，詢問因偶爾而找到匹配的概率越高)，c)記分矩陣(記分矩陣的嚴(yán)格性越小，詢問在數(shù)據(jù)庫內(nèi)因偶爾而找到一個序列的概率越高)影響。表達(dá)序列標(biāo)簽(EST):指從單次末端DNA測序中所得到的cDNA序列。EST序列指衍生自轉(zhuǎn)錄并因而來自已轉(zhuǎn)錄基因的序列。可表達(dá)的核酸序列如本發(fā)明上下文中所用是能夠轉(zhuǎn)錄成RNA(例如mRNA、反義RNA、形成雙鏈的RNA等)或翻譯成特定蛋白質(zhì)的任何核酸序列。
表達(dá)指基因產(chǎn)物的生物合成，例如在結(jié)構(gòu)基因的例子中，表達(dá)包括結(jié)構(gòu)基因轉(zhuǎn)錄成mRNA和(任選地)隨后mRNA翻譯成一種或多種多肽。功能性等效物就本發(fā)明內(nèi)含子而言應(yīng)當(dāng)理解為SEQ ID NO :1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22中任意一個所描述的該內(nèi)含子的天然突變或人工突變。突變可以是不減少所述內(nèi)含子的增強表達(dá)特性的一個或多個核苷酸的插入、缺失或置換。這些功能性等效物與如SEQ ID NO :1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21或22中任意一個所描述內(nèi)含子序列具有至少80%、優(yōu)選地是85%、更優(yōu)選地是90 %、最優(yōu)選地是多于95 %、非常特別優(yōu)選地至少98 %的同一性，但小于100 %的同一性，其中所述的同一性跨越序列的至少95個連續(xù)堿基對、優(yōu)選地至少150個連續(xù)堿基對、更優(yōu)選地至少200個連續(xù)堿基對進(jìn)行測定，其中所述的序列由SEQID N0:l、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21 或 22 中任意一個描述并具有與如 SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21 或 22 中任意一個所示內(nèi)含子序列基本上相同的ME效應(yīng)特征。
功能性等效物特別是衍生自其它植物的所述內(nèi)含子的同系物。當(dāng)用來指內(nèi)含子時，同系物指自編碼如下蛋白質(zhì)的基因組核酸序列中分離的具有增強表達(dá)特性的內(nèi)含子(i)所述的蛋白質(zhì)在氨基酸水平與從中已經(jīng)分離具有SEQ ID N0:l、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22的本發(fā)明內(nèi)含子的基因編碼的蛋白質(zhì)共有多于60 %，優(yōu)選地是65 %、70 %、75 %、80 %，更優(yōu)選地是85 %、90 %、95 %或最優(yōu)選地是多于95 %的序列同一性，或(ii)如從中已經(jīng)分離具有 SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、
18、19、20、21或22的本發(fā)明內(nèi)含子的基因編碼的蛋白質(zhì)那樣催化相同的酶反應(yīng)，或(iii)顯示出與從中已經(jīng)分離本發(fā)明內(nèi)含子SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22的基因編碼的蛋白質(zhì)可比的時間表達(dá)譜或空間表達(dá)
-i'TfeP曰。當(dāng)與本發(fā)明內(nèi)含子相比時，如上所述的“功能性等效物”可以具有降低的或增加的基因表達(dá)增強效應(yīng)。在此上下文中，功能性等效內(nèi)含子的基因表達(dá)增強效應(yīng)比用SEQ IDNO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21 或 22 中所示的任意內(nèi)含子在不改變其它條件下得到的參考值高至少50%、優(yōu)選地是至少100%、特別優(yōu)選地至少300%，非常特別優(yōu)選地至少500%。功能性連接的或有效連接的應(yīng)當(dāng)理解為意指例如調(diào)節(jié)性元件(例如啟動子)與待表達(dá)的核酸序列和根據(jù)需要的其它調(diào)節(jié)性元件(如例如終止子)以如此方式順序排列，以致于每一種調(diào)節(jié)性元件均可以實現(xiàn)其預(yù)期的功能以允許、修飾、促進(jìn)或影響所述核酸序列的表達(dá)。表達(dá)可以依賴于與有義RNA或反義RNA有關(guān)的核酸序列的排列而發(fā)生。為此目的，實際上不需要化學(xué)意義上的直接連接。遺傳控制序列例如增強子序列還可以從距離更遠(yuǎn)處，或甚至從其它DNA分子上對靶序列發(fā)揮其功能。術(shù)語“功能性連接的”、“有效連接的”、“處于有效的組合中”和“以有效的順序”如本文中所用涉及具有增強基因表達(dá)的特性本發(fā)明內(nèi)含子時，指至少一個所述內(nèi)含子與核酸序列以如此方式的連接以致于實現(xiàn)表達(dá)增強效應(yīng)，并且若已包括功能性剪接位點，則內(nèi)含子可以通過負(fù)責(zé)剪接過程的細(xì)胞的因子被剪接出來。在本發(fā)明的優(yōu)選實施方案中，將內(nèi)含子導(dǎo)入核酸序列的5'非編碼區(qū)。在實施例內(nèi)展示本發(fā)明的表達(dá)構(gòu)建體，其中本發(fā)明的內(nèi)含子與核酸序列功能性地連接。更優(yōu)選這樣的排列，即其中在內(nèi)含子介導(dǎo)性增強表達(dá)中具有功能的內(nèi)含子插入啟動子與核酸序列之間，優(yōu)選地插入已轉(zhuǎn)錄的核酸序列內(nèi)，或在編碼蛋白質(zhì)的核酸序列的例子中，插入核酸序列的5'非翻譯區(qū)。啟動子序列與待重組性表達(dá)的核酸序列間的距離優(yōu)選地少于200個堿基對、特別優(yōu)選地少于100個堿基對、非常特別優(yōu)選地少于50個堿基對。有效連接和表達(dá)盒可以通過如在例如 Maniatis T, Fritsch EF 和 Sambrook J(1989) ((Molecular Cloning A Laboratory Manual)), Cold Spring HarborLaboratory, Cold Spring Harbor(NY)、在Silhavy TJ, Berman ML 和 Enquist Lff(1984) 《Experiments with Gene Fusions》， ColdSpringHarbor Laboratory,Cold Spring Harbor(NY)、在 Ausubel FM 等(1987) 《CurrentProtocols in Molecular Biology》，Greene Publishing Assoc, andffiley Interscience以及在Gelvin等(1990)《Plant Molecular BiologyManual》中所述的常用重組技術(shù)和克隆技術(shù)生成。然而還可以在這兩種序列之間安置例如充當(dāng)帶限制性酶特異性切割位點的接頭或充當(dāng)信號肽的其它序列。序列的插入還可以導(dǎo)致融合蛋白的表達(dá)。優(yōu)選地，由啟動子、內(nèi)含子和待表達(dá)的核酸序列的連接組成的表達(dá)構(gòu)建體可以以載體整合的形式存在并可以例如通過轉(zhuǎn)化插入植物基因組。
基因指與適宜的調(diào)節(jié)序列有效連接的編碼區(qū)，其中所述的調(diào)節(jié)序列能夠以某種方式調(diào)節(jié)多肽表達(dá)。基因包括DNA中位于編碼區(qū)(開方讀碼框，ORF)之前(上游)和之后(下游)的不翻譯的調(diào)節(jié)區(qū)域(例如啟動子、增強子、抑制子等)，并且在間插序列可應(yīng)用時，包括在各編碼區(qū)(即外顯子)之間的間插序列(即內(nèi)含子)。基因還可以包括存在于RNA轉(zhuǎn)錄物內(nèi)的位于序列5’末端和Y端的序列。這些序列稱作“側(cè)翼”序列或區(qū)域(這些側(cè)翼序列坐落在存在于RAN轉(zhuǎn)錄內(nèi)的不翻譯序列的5'或3' )。5'側(cè)翼區(qū)域可以含有控制或影響基因轉(zhuǎn)錄的調(diào)節(jié)序列，如啟動子和增強子。3'側(cè)翼區(qū)域可以含有指導(dǎo)轉(zhuǎn)錄終止、轉(zhuǎn)錄后切割或多腺苷酸化作用的序列。增強基因表達(dá)特性、基因表達(dá)增強效應(yīng)或內(nèi)含子介導(dǎo)性基因表達(dá)增強(IME):當(dāng)涉及內(nèi)含子序列時指內(nèi)含子的如此能力，該能力定量地增強作為(如本文中所定義)重組/轉(zhuǎn)基因DNA表達(dá)盒中部分的核酸序列(例如基因)的表達(dá)水平，在不改變其它條件下與只缺少內(nèi)含子而其它完全相同的表達(dá)構(gòu)建體相比，其測量以已轉(zhuǎn)錄RNA、mRNA、蛋白質(zhì)的量或蛋白質(zhì)活性為基礎(chǔ)。增強基因表達(dá)的特性在植物中涉及這樣的內(nèi)含子，其在不改變其它條件下與只缺少內(nèi)含子而其它完全相同的表達(dá)構(gòu)建體相比，能夠定量地增強植物衍生性核酸序列在植物或植物細(xì)胞中的表達(dá)水平并增強非植物衍生性核酸在植物或植物細(xì)胞中的基因表達(dá)速率。在本發(fā)明的優(yōu)選實施方案中，將表達(dá)增強效應(yīng)理解為在不改變其它條件下與只缺少內(nèi)含子而其它完全相同的表達(dá)構(gòu)建體相比，RNA的穩(wěn)定狀態(tài)水平、蛋白質(zhì)的穩(wěn)定狀態(tài)水平或核酸序列或相應(yīng)蛋白質(zhì)的蛋白質(zhì)活性(例如報告基因或蛋白質(zhì))增加至少50%、或至少 100%、或至少 200%、300%、400%或至少 500%、600%、700%、800%、900%或至少1，000%、或多于1，000%。此外，應(yīng)當(dāng)將表達(dá)增強效應(yīng)或內(nèi)含子介導(dǎo)性增強理解為內(nèi)含子的能力，所述的能力改變作為本發(fā)明表達(dá)盒中部分的核酸序列(例如基因)的組織特異性表達(dá)譜、器官特異性表達(dá)譜或細(xì)胞特異性表達(dá)譜。改變作為本發(fā)明表達(dá)盒中部分的核酸序列的組織特異性表達(dá)譜、器官特異性表達(dá)譜或細(xì)胞特異性表達(dá)譜指這樣的事實，即因存在本發(fā)明的內(nèi)含子，相應(yīng)基因的表達(dá)水平(mRNA或所編碼的蛋白質(zhì)的穩(wěn)定狀態(tài)水平、或蛋白質(zhì)的活性)得到增加，高于所用檢測方法的檢測閾值。基因沉默可以通過反義RNA或雙鏈RNA或通過共抑制(有義抑制)實現(xiàn)。技術(shù)人員知道其可以使用其它的cDNA或?qū)?yīng)基因作為合適的反義構(gòu)建體的初始模版。“反義”核酸優(yōu)選地與靶蛋白的編碼區(qū)或其部分互補。然而，“反義”核酸優(yōu)選地與非編碼區(qū)或其部分互補。從靶蛋白上的序列信息出發(fā)，考慮Watson和Crick堿基配對原則，反義核酸可以用技術(shù)人員熟悉的方式進(jìn)行設(shè)計。反義核酸可以與靶蛋白的全部或部分核酸序列互補。類似地所包含的是如上所述序列在有義方向上的用途，如技術(shù)人員已知，該用途可以導(dǎo)致共抑制(有義抑制)。已經(jīng)證實表達(dá)有義核酸序列可以減少或關(guān)閉相應(yīng)基因表達(dá)，其類似于已對反義方法所作的描述(Goring(1991)Proc. Natl Acad. Sci. USA 88:1770-1774 ；Smith(1990)M01. Gen. Genet. 224447-481 ；Napoli(1990)Plant Cell 2 279-289 ；Van der Krol (1990)Plant Cell 2:291-299)。在這種條件下，導(dǎo)入的構(gòu)建體可以代表待完全或僅部分地進(jìn)行減弱的基因。翻譯的可能性是不需要的。特別優(yōu)選借助雙鏈RNAi的基因調(diào)節(jié)方法(“雙鏈RNA干擾”)的用途。此類方法是本領(lǐng)域技術(shù)人員已知的 (例如 Matzke 2000 ；Firel998 ；W0 99/32619 ；W099/53050 ；W0 00/68374 ；W0 00/44914 ；W000/44895 ；W0 00/49035 ；W0 00/63364)。在所述參考文獻(xiàn)中描述的過程和方法公開地進(jìn)行參考。如本文中所用，生物的基因組和基因組DNA是生物的完整遺傳信息，其編碼于DNA (或?qū)τ谀承┎《緞t是RNA)內(nèi)。這包括基因序列和非編碼序列。所述的基因組DNA包含胞核DNA (也稱作染色體DNA)和質(zhì)體(例如葉綠體)或其它細(xì)胞器(例如線粒體)的DNA。術(shù)語“基因組或基因組DNA”優(yōu)選地指胞核的染色體DNA。術(shù)語“染色體DNA”或“染色體DNA序列”應(yīng)當(dāng)理解為與細(xì)胞周期狀態(tài)無關(guān)的細(xì)胞核的基因組DNA。染色體DNA可能因此在染色體或染色單體內(nèi)得以組織，它們可能是壓縮的或解螺旋的。染色體DNA的插入可以通過本領(lǐng)域已知的多種方法進(jìn)行證實和分析，例如聚合酶鏈?zhǔn)椒磻?yīng)(PCR)分析、DNA印跡分析、熒光原位雜交(FISH)和原位PCR。異源的相對于核酸序列指這樣的核苷酸序列，該核苷酸序列與在自然界中不與該核苷酸序列連接的或在自然界中與該核苷酸序列在不同位置處連接的核酸序列連接。雜交如本文中所用包括“任何的如此過程，核酸的鏈通過該過程與互補鏈經(jīng)堿基配對結(jié)合”(Coombs 1994, Dictionary of Biotechnology, Stockton Press, New YorkN.Y.)。雜交和雜交的強度(即核酸間結(jié)合的強度)受如此因素的影響，如核酸間的互補程度、所涉及條件的嚴(yán)格性、所形成雜交體的Tm以及核酸內(nèi)的G :C比率。如本文中所用，術(shù)語“Tm”是用來指“解鏈溫度”。解鏈溫度是這樣的溫度，在此溫度上雙鏈核酸分子群體的一半解離成單鏈。用于計算核酸Tm的等式在本領(lǐng)域內(nèi)眾所周知。如標(biāo)準(zhǔn)參考文獻(xiàn)所提及的那樣，Tm值的簡單估計可以由如下等式計算Tm = 81. 5+0. 41 (% G+C),此時核酸處于IM NaCl的水溶液內(nèi)[見例如 Anderson 和 Young, Quantitative Filter Hybridization, ((NucleicAcidHybridization)) (1985)]。其它參考文獻(xiàn)包括了考慮用于計算Tm的結(jié)構(gòu)特征和序列特征的更復(fù)雜計算。本領(lǐng)域技術(shù)人員完全知道可以采用多種雜交條件以包含低度嚴(yán)格條件或高度嚴(yán)格條件；考慮了如此的因素，如探針長度和性質(zhì)(DNA、RNA、堿基組成)和靶標(biāo)的性質(zhì)(DNA、RNA、堿基組成、存在于溶液內(nèi)或經(jīng)固定等)以及鹽和其它成分的濃度(例如存在或不存在甲酰胺、硫酸葡聚糖、聚乙二醇)，并且可以改變雜交溶液以產(chǎn)生低的雜交嚴(yán)格性或高的雜交嚴(yán)格性。本領(lǐng)域技術(shù)人員知道優(yōu)選較高的嚴(yán)格性以減少或消除本發(fā)明內(nèi)含子與其它核酸序列之間的非特異性結(jié)合，而優(yōu)選較低的嚴(yán)格性來檢測與本發(fā)明的核苷酸序列具有不同同源性的較大數(shù)目的核酸序列。此類條件例如由Sambrook(《MolecularCloning ;ALaboratoryManual》第二版，Cold Spring Harbor LaboratoryPress, Cold SpringHarbor, NY(1989))或在《Current Protocols in Molecular Biology》，JohnWiley&Sons,N. Y. (1989)6. 3. 1-6. 3. 6內(nèi)描述。優(yōu)選的雜交條件是詳細(xì)描述的公開內(nèi)容。同一性當(dāng)與核酸聯(lián)系使用時，指互補程度。將兩種核酸間的同一性理解為意指在每一例子中跨越序列全部長度的核酸序列的同一性，此同一性借助具有如下設(shè)置的參數(shù)的程序算法GAP (Wisconsin Package第10. O版，威斯康辛大學(xué)，Genetics ComputerGroup (GCG), Madison,美國)通過比較進(jìn)行計算
·
空位權(quán)重12 長度權(quán)重4平均匹配2，912 平均非匹配_2，003例如，將在核酸水平與序列SEQ ID NO :1具有至少95%同一性的序列理解為意指這樣的序列，當(dāng)通過以上具有所設(shè)置的參數(shù)的程序算法與序列SEQ ID NO :1比較時，此序列具有至少95%的同一性。可以存在部分的同一性(即少于100%的部分同一性)或完全的同一性(即100%的完全同一性)。導(dǎo)入重組DNA表達(dá)構(gòu)建體在植物細(xì)胞中指將通過轉(zhuǎn)化導(dǎo)入植物基因組并且得到穩(wěn)定維持的重組DNA表達(dá)構(gòu)建體。術(shù)語“導(dǎo)入”包括方法，例如轉(zhuǎn)染、轉(zhuǎn)導(dǎo)或轉(zhuǎn)化。鑒定、“鑒定”或“選擇”:就植物的轉(zhuǎn)化而言，應(yīng)當(dāng)理解為鑒定和選擇在其中重組表達(dá)構(gòu)建體已經(jīng)穩(wěn)定導(dǎo)入基因組的那些植物細(xì)胞的篩選方法。就具有增強基因表達(dá)特性的內(nèi)含子而言，“鑒定”指從內(nèi)含子群體中選擇所述內(nèi)含子的方法。優(yōu)選地，“鑒定”指使用本發(fā)明方法的選擇標(biāo)準(zhǔn)的計算機法(in silico)選擇方法,更優(yōu)選地是自動化的計算機法選擇方法。此類計算機法鑒定方法可以例如包括如下步驟(I)以存在于DNA序列數(shù)據(jù)庫內(nèi)(例如經(jīng)互聯(lián)網(wǎng)可公開獲得的基因組DNA數(shù)據(jù)庫)的DNA序列為基礎(chǔ)生成內(nèi)含子序列數(shù)據(jù)庫，(2)為了得到具有增強基因表達(dá)特性的內(nèi)含子，使用本發(fā)明方法的標(biāo)準(zhǔn)篩選已生成的內(nèi)含子DNA序列數(shù)據(jù)庫或含有基因組DNA序列的其它數(shù)據(jù)庫，其中(使用本發(fā)明方法的標(biāo)準(zhǔn))檢索或生成DNA序列的步驟、內(nèi)含子特異性DNA序列數(shù)據(jù)庫的生成及這些DNA序列的篩選將借助適宜的計算機算法和計算機裝置開展。內(nèi)含子指基因中這樣的DNA部分(間插序列)，該DNA部分不編碼此基因所產(chǎn)生蛋白質(zhì)的部分并且從該基因所轉(zhuǎn)錄的并從細(xì)胞核中輸出之前的mRNA內(nèi)剪接下來。內(nèi)含子序列指內(nèi)含子的核酸序列。因此，內(nèi)含子是DNA序列中的如此區(qū)域，它們隨編碼序列(外顯子)一起轉(zhuǎn)錄但在成熟的mRNA形成期間被去除。內(nèi)含子可以位于實際的編碼區(qū)內(nèi)或在前mRNA(未剪接的mRNA)的Y或:V非翻譯前導(dǎo)序列內(nèi)。初級轉(zhuǎn)錄物中的內(nèi)含子可以被剪除并且編碼序列同時而精確地連接以形成成熟mRNA。內(nèi)含子與外顯子的匯合處形成剪接位點。內(nèi)含子的序列以⑶開始并以AG結(jié)束。此外，在植物中，已經(jīng)描述兩種AU-AC內(nèi)含子的實例來自擬南芥菜的RecA樣蛋白基因的第14內(nèi)含子和G5基因的第7內(nèi)含子是AT-AC內(nèi)含子。含有內(nèi)含子的前mRNA除其它序列以外，還具有對精確剪接內(nèi)含子必需的三個短序列。這三個短序列是5'剪接位點、3'剪接位點和分支點。mRNA的剪接是除去存在于mRNA初級轉(zhuǎn)錄物內(nèi)的間插序列(內(nèi)含子)和匯合或連接外顯子序列。這也稱作順式剪接，使兩個外顯子在同一 RNA內(nèi)連接，同時移除間插序列(內(nèi)含子)。內(nèi)含子的功能性元件包括由剪接體中(例如在內(nèi)含子末端剪接共有序列的)特異性蛋白質(zhì)成分所識別和結(jié)合的序列。功能性元件與剪接體相互作用導(dǎo)致內(nèi)含子序列從不成熟的mRNA中去除和外顯子序列再連接。內(nèi)含子具有對精確剪接內(nèi)含子必需(盡管不充分)的三個短序列。這三個短序列是5'剪接位點、3'剪接位點和分支點。分支點序列在植物內(nèi)剪接和選擇剪接位點中是重要的。分支點序列通常位于3'剪接位點上游10-60個核苷酸。植物的分支點序列具有變異，共有序列是 5' -CURAY-3' (SEQ ID NO :75)或 5' -YURAY-3' (SEQ ID NO :76)。“IME內(nèi)含子”或內(nèi)含子介導(dǎo)性增強(IME)內(nèi)含子當(dāng)涉及內(nèi)含子序列時,指如本文中定義的具有在植物中增強基因表達(dá)特性的內(nèi)含子(見“增強基因表達(dá)的特性、基因表達(dá)增強效應(yīng)或內(nèi)含子介導(dǎo)性基因表達(dá)增強)。分離或分離的當(dāng)相對于內(nèi)含子或基因使用時，如在“內(nèi)含子序列的分離”或“基因的分離”中指這樣的核酸序列，該核酸序列在其相應(yīng)來源生物的染色體核酸序列環(huán)境中鑒定并從中分離或分開。分離的核酸處于這樣的形式或環(huán)境下，該形式或環(huán)境與它在自然中存在的形式或環(huán)境不同。相反，未分離的核酸是以其在自然中存在狀態(tài)下找到的核酸，如DNA和RNA。例如，在宿主細(xì)胞染色體上靠近毗鄰的基因找到給定的DNA序列(例如基因)；內(nèi)含子序列以內(nèi)含子和外顯子的交替順序內(nèi)嵌至基因的核酸序列內(nèi)。分離的核酸序列可以以單鏈形式或雙鏈形式存在。當(dāng)分離的核酸序列待用于表達(dá)蛋白質(zhì)時，核酸序列將至少含有有義鏈或編碼鏈的至少一部分(即核酸序列可以是單鏈的)。或者，它可以含有有義鏈和反義鏈(即核酸序列可以是可以是雙鏈的)。核酸指處于單鏈或雙鏈的有義或反義形式的脫氧核糖核苷酸、核糖核苷酸或其聚合物或雜交體。除非另外說明，特定的核酸序列還內(nèi)在地包含其經(jīng)保守性修飾的變體(例如間并密碼子置換)和互補序列，并且該序列得到清楚地說明。“核酸”可用于描述“基因”、“cDNA”、“DNA”、“mRNA”、“寡核苷酸”和“多核苷酸”。核酸序列如本文中所用指DNA片段(寡核苷酸、多核苷酸、基因組DNA、cDNA等)的脫氧核糖核苷酸或核糖核苷酸(核苷酸)的連續(xù)序列，只要所述的連續(xù)序列可以通過DNA測序技術(shù)得到作為一列代表核苷酸的縮寫、字母、字符或字即可。器官就植物(或“植物器官”)而言意指植物的部分并可以包括(但不應(yīng)當(dāng)限于)例如根、果實、苗、莖、葉、花藥、萼片、花瓣、花粉、種子等。其它不改變的條件意指例如通過待進(jìn)行比較的表達(dá)構(gòu)建體之一所啟動的表達(dá)沒有受額外的遺傳控制序列(例如增強子序列)調(diào)節(jié)并且在相同環(huán)境內(nèi)(例如相同植物物種)在相同發(fā)育階段和相同生長條件下完成。植物通常理解為意指能夠進(jìn)行光合作用的任何單細(xì)胞生物或多細(xì)胞生物或它們的細(xì)胞、組織、器官、部分或繁殖材料(如種子或果實)。為本發(fā)明的目的包括植物界的高等植物和低等植物中的全部屬和種。優(yōu)選一年生、多年生的單子葉植物和和雙子葉植物。本術(shù)語包括成熟植物、種子、苗和幼苗和它們所衍生的部分、繁殖材料(如種子或小孢子)、植物器官、組織、原生質(zhì)體、愈傷組織和其它培養(yǎng)物例如細(xì)胞培養(yǎng)物，以及結(jié)成群以產(chǎn)生功能性單位和結(jié)構(gòu)性單位的任何其它類型的植物細(xì)胞。成熟植物指處在除幼苗以外的任何所需要發(fā)育階段內(nèi)的植物。幼苗指在早期發(fā)育階段內(nèi)的年幼的不成熟植物。一年生、二年生的單子葉植物和雙子葉植物是用于產(chǎn)生轉(zhuǎn)基因植物的優(yōu)選宿主生物。基因的表達(dá)更有利地是在全部觀賞植物、用材樹木或觀賞樹木、花、切花、灌木或草坪草內(nèi)。可以通過舉例方式提到而不限于此的植物是被子植物(angiosperm)、苔蘚植物(bryophyte)例如苔綱(Hepaticae)(地錢(liverwort))和蘚綱(Musci)(蘚(mosse));蕨類植物(Pteridophytes)如蕨(fern)、問荊(horsetail)和石松(club mosses);裸子植物(gymnosperms)如針葉類(conifer)、蘇鐵類(cycad)、銀杏(ginkgo)和買麻藤類(Gnetatae);藻類(algae)如綠藻綱(Chlorophyceae)、Phaeophpyceae、紅藻綱(Rhodophyceae)、粘藻綱(Myxophyceae)、黃藻綱(Xanthophyceae)、娃藻綱(Bacillariophyceae)(娃藻(diatom))和裸藻綱(Euglenophyceae)。優(yōu)選用作食用或飼用目的的植物如豆科(Leguminosae)如豌豆、苜猜(alfafa)和大豆(soya);禾本科(Gramineae)如稻、玉米、小麥、大麥、高粱(sorghum)、黍(millet)、黑麥(rye)、小黑麥(triticale)或燕麥(oat);傘形科(Umbelliferae),特別是胡蘿卜屬(Daucus)、極特別地是野胡蘿卜種(Dauus carota)(胡蘿卜(carrot)),和IfM (Apium)、極特別地是旱療種(Graveolens dulce)(療菜(celery))和眾多其它種；
爺科(Solanaceae),特別是番爺屬(Lycopersicon)、極特別地是番爺種(Lycopersiconesculentum)(番爺)，和爺屬(Solanum)，極特別地是馬鈴薯種(Solanum tuberosum)(馬鈴薯)和爺種(Solanu_elongena)(爺子)以及眾多其它種(如煙草(tobacco));和辣椒屬(Capsicum),極特別地是辣椒種(Capsicum annuum)(辣椒(pepper))和眾多其它種；豆科(Leguminosae),特別是大豆屬(Glycine),極特別地是大豆種(Glycine max)(大豆(soybean))、苜猜、豌豆、紫花苜猜(lucerne)、菜豆或落花生(peanut)和眾多其它種；和十字花科(Cruciferae) (Brassicacae)、特別是蕓苔屬(Brassica),極特別地是歐洲油菜種(Brassica napus)(油菜(oil seedrape))、蕓笞種(Brassica campestris)(甜菜(beet))、甘藍(lán)栽培品種 Tastie (Brassica oleracea cv Tastie)(卷心菜(cabbage))、甘藍(lán)栽培品種 Snowball Y (Brassica oleracea cv Snowball Y)(花椰菜(cauliflower))和甘藍(lán)栽培品種 Emperor (Brassica oleracea cv Emperor)(綠花菜(broccoli));和擬南芥屬(Arabidopsis),極特別地是擬南芥菜種和眾多其它種；菊科(Compositae),特別是萵苣屬(Lactuca),極特別地是萵苣種(Lactucasativa)(萵苣(lettuce))和眾多其它種；菊科(Asteraceae)如向日葵(sunflower)、萬壽菊(Tagetes)、萵苣或金蓋花(Calendula)和眾多其它種；葫蘆科(Cucurbitaceae)如甜瓜(melon)、南瓜(pumpkin/squash)或西葫蘆(zucchini)和亞麻(linseed)。更優(yōu)選棉花(cotton)、甘鹿(sugarcane)、大麻(hemp)、亞麻(flax)、辣椒(chillies)和各種樹、堅果和藤本物種。提供當(dāng)相對于內(nèi)含子使用時，如在“物理性提供內(nèi)含子”中指對來自目的植物的代表所述內(nèi)含子的DNA序列進(jìn)行克隆并在適合于本發(fā)明內(nèi)含子的進(jìn)一步克隆工作和后續(xù)應(yīng)用的載體和質(zhì)粒內(nèi)物理性提供的該內(nèi)含子。產(chǎn)生當(dāng)相對于內(nèi)含子使用時，如在“產(chǎn)生內(nèi)含子”中指基于本發(fā)明內(nèi)含子的DNA序列信息合成了 DNA分子。啟動子、啟動子元件或啟動子序列如本文中所用，指能夠在與目的核苷酸序列連接時控制目的核苷酸序列轉(zhuǎn)錄成mRNA的DNA序列。因此，啟動子是DNA序列上如此的識別位點，該識別位點提供了用于基因的表達(dá)控制元件并且RNA聚合酶特異性地可與該識別位點結(jié)合并啟動所述基因的RNA合成(轉(zhuǎn)錄)。啟動子通常(盡管不是必須)位于目的核苷酸序列的5'(即上游)(例如接近結(jié)構(gòu)基因的轉(zhuǎn)錄起始位點)。啟動子可以是組織特異性或細(xì)胞特異性的。術(shù)語“組織特異性”在應(yīng)用于啟動子時，指這樣的啟動子，該啟動子能夠在特定類型的組織(例如花瓣)中指導(dǎo)目的核苷酸序列選擇性表達(dá)，而在不同類型的組織(例如根)內(nèi)則相對缺乏同一目的核苷酸序列的表達(dá)。啟動子可以是組成型的或可調(diào)節(jié)的。術(shù)語“組成型的”當(dāng)指啟動子時，意指該啟動子能夠在缺乏刺激物(例如熱休克、化學(xué)品、光等)下指導(dǎo)有效連接的核酸序列轉(zhuǎn)錄。通常，組成型啟動子能夠指導(dǎo)轉(zhuǎn)基因在基本上任何細(xì)胞和任何組織內(nèi)表達(dá)。相反，“可調(diào)節(jié)的”啟動子是這樣的啟動子，其能夠在存在刺激物(例如熱休克、化學(xué)品、光等)時指導(dǎo)有效連接的核酸序列以這樣一種水平轉(zhuǎn)錄，其不同于在缺乏刺激物下有效連接的核酸序列的轉(zhuǎn)錄水平。將植物中有功能的啟動子序列理解為原則上意指能夠控制基因(尤其外來基因)在植物或植物部分、植物細(xì)胞、植物組織或植物培養(yǎng)物內(nèi)表達(dá)的任何啟動子。在此條件下，表達(dá)可是是例如組成型的、誘導(dǎo)型的或發(fā)育依賴型的。組成型啟動子是在其中RNA聚合酶結(jié)合和啟動的速率是大致恒定的并相對與外界刺激物無關(guān)的啟動子。有用的啟動子是這樣的組成型啟動子(Benfey 等(1989)EMBO J. 8 :2195_2202)，如源自植物病毒如 35S CAMV(Franck 等(1980 )Cell 21 :285-294)、19S CaMV(還見US5352605和WO 84/02913)、34S FMV(Sanger等(1990)Plant Mol. Biol. , 14 :433-443)的那些組成型啟動子、歐療(parsley)遍在蛋白啟動子或在US4，962，028中描述的植物啟動子如Rubisco小亞基啟動子或植物啟動子PRPl [Ward等(1993)Plant Mol. Biol. 22 361-6],SSU,PGELl,OCS [Leisner(1988)Proc. Natl. Acad. Sci.USA 85(5) :2553-2557]、lib4、usp、mas[Comai(1990)Plant Mol Biol 15(3) :373_381]、STLSl、ScBV (Schenk (1999) Plant Mol Biol 39 (6) : 1221-1230)、B33、SADl 或 SAD2 (flax啟動子，Jain 等(1999) Crop Science 39(6) : 1696-1701)或 nos [Shaw 等(1984) NucleicAcids Res. 12(20) =7831-7846] 0誘導(dǎo)啟動子是在其中RNA聚合酶結(jié)合和啟動的速率受到外界刺激物調(diào)節(jié)的啟動子。此類刺激包括光、熱、厭氧脅迫、營養(yǎng)條件的改變、代謝物的有或無、配體的存在、微生物侵襲、創(chuàng)傷等等(綜述見Gatz (1997) Annu. Rev. Plant Physiol.Plant Mol.Biol.48 :89-108)。化學(xué)誘導(dǎo)啟動子在需要以時間特異性方式表達(dá)基因時特別合適。化學(xué)誘導(dǎo)啟動子的實例是水楊酸誘導(dǎo)啟動子(W0 95/19443)、以及脫落酸誘導(dǎo)啟動子(EP335528)、四環(huán)素誘導(dǎo)啟動子(Gatz等(1992) Plant J. 2 397-404)、環(huán)己醇或乙醇誘導(dǎo)啟動子(W0 93/21334)或如本文中所述的其它化學(xué)誘導(dǎo)啟動子。病毒啟動子是具有與病毒基因5'末端內(nèi)找到的啟動子基本相似的DNA序列的啟動子。常見的病毒啟動子存在于由Huang等((1981) Cell 27 :245)所述的MMTV的編碼p21蛋白的基因5’末端處。合成的啟動子是化學(xué)合成的而非生物衍生的啟動子。合成的啟動子通常包含優(yōu)化RNA聚合酶啟動效率的序列改變。時間調(diào)節(jié)性啟動子是其中RNA聚合酶結(jié)合和啟動的速率在發(fā)育期間的特定時間內(nèi)受調(diào)節(jié)的啟動子。時間調(diào)節(jié)性啟動子實例在Chua等[(1989) Science244:174-181]中給出。空間調(diào)節(jié)性啟動子是其中RNA聚合酶結(jié)合和啟動的速率在生物的特定結(jié)構(gòu)內(nèi)如葉、莖或根內(nèi)受調(diào)節(jié)的啟動子。空間調(diào)節(jié)性啟動子的實例在Chua等[(1989)Science244 :174-181]中給出。時空調(diào)節(jié)性啟動子是其中RNA聚合酶結(jié)合和啟動的速率在發(fā)育期間的特定時間內(nèi)在生物的特定結(jié)構(gòu)內(nèi)受調(diào)節(jié)的啟動子。常見的時空調(diào)節(jié)性啟動子是Chua等[(1989) Science 244 :174_181]所述的EPSP合成酶-35S啟動子。合適的啟動子還有歐洲油菜的油菜籽蛋白基因啟動子(US5，608，152)、蠶豆(Vicia faba)USP啟動子;Btoinileln 等(I 991) Mo I GenGenet 225(3) :459_67)、擬南芥的油質(zhì)蛋白啟動子(WO98/45461)、菜 (Phaseolus vulgaris)的菜球蛋白啟動子(US 5，504，200)、蕓苔 Bce4啟動子(W0 91/13980)、菜豆arc5啟動子、胡蘿卜DcG3啟動子或豆球蛋白B4啟動子(LeB4 ；等(1992)Plant Journal 2(2) :233_9)，以及在單子葉植物如玉米、大麥、小
麥、黑麥、稻等中引起種子特異性表達(dá)的啟動子。有利的種子特異性啟動子是蔗糖結(jié)合蛋白質(zhì)啟動子(W0 00/26388)、菜豆球蛋白啟動子和油菜籽蛋白啟動子。必須考慮的合適啟動子是大麥lpt2或Iptl基因啟動子(W0 95/15389和WO 95/23230)和在WO 99/16890中所述的啟動子(來自大麥的大麥醇溶蛋白基因、稻的谷蛋白基因、稻的水稻素基因、稻的谷醇溶蛋白基因、小麥的麥醇溶蛋白基因、小麥的谷蛋白基因、玉米的玉米醇溶蛋白基因、燕麥的谷蛋白基因、高粱的kasirin基因和黑麥的裸麥醇溶蛋白基因的啟動子)。其它的合適啟動子是 Amy32b、Amy 6-6 和 Aleurain [US 5，677，474]、Bce4 (歐洲油菜)[US 5,530，149]、大豆球蛋白(大豆KEP 571 741]、磷酸烯醇丙酮酸羧化酶(大豆)[JP 06/62870]、ADR12_2 (大豆)[W0 98/08962]、異檸檬酸裂解酶(歐洲油菜)[US 5，689，040]或α淀粉酶(大麥)[EP 781 849]的啟動子。可獲得用于在植物中表達(dá)基因的其它啟動子是葉特異性啟動子，如在DE-A19644478中所述的那些葉特異性啟動子，或光調(diào)節(jié)性啟動子，例如豌豆petE啟動子。其它的合適植物啟動子是胞質(zhì)FBP酶啟動子或馬鈴薯ST-LSI (Stockhaus等(1989)EMBO J. 8 :2445)、大豆磷酸核糖焦磷酸氨基轉(zhuǎn)移酶啟動子(GenBank登錄號U87999)或在EP-A-O 249676中所述的節(jié)結(jié)特異性啟動子。其它的合適啟動子是對生物性或非生物性脅迫條件作出反應(yīng)的合適啟動子，例如病原體誘導(dǎo)性PRPl基因啟動子(Ward等(1993)PlantMol. Biol. 22 :361-366)、番茄熱誘導(dǎo)性hsp80啟動子(US 5，187，267)、馬鈴薯寒冷誘導(dǎo)性α淀粉酶啟動子(W0 96/12814)或創(chuàng)傷誘導(dǎo)性pinll啟動子(ΕΡ-Α-0 375 091)或如本文中所述的其它啟動子。特別適合的其它啟動子是引起質(zhì)體特異性表達(dá)的那些啟動子。合適的啟動子如病毒RNA聚合酶啟動子在WO 95/16783和WO 97/06250中描述，并且擬南芥clpP啟動子在WO 99/46394中描述。除了數(shù)個以上提及的病毒啟動子和細(xì)菌啟動子以外，用于在種類盡可能多的組織內(nèi)(當(dāng)然尤其在葉內(nèi))強烈表達(dá)異源序列的其它啟動子還優(yōu)選地是植物的肌動蛋白基因或遍在蛋白基因的啟動子，例如，稻的肌動蛋白I啟動子。植物的組成型啟動子的其它實例是甜菜(sugarbeet) V-ATP酶啟動子(W0 01/14572)。合成的組成型啟動子的實例是Super啟動子(W0 95/14098)和衍生自G-盒的啟動子(W0 94/12015)。根據(jù)需要，還可以使用化學(xué)誘導(dǎo)啟動子，比較EP-A 388 186、EP-A 335 528、WO 97/06268。以上所列的啟動子可以包含影響對植物激素(Xu等，1994，Plant Cell 6(8) 1077-1085),生物性或非生物性環(huán)境刺激例如脅迫條件做出應(yīng)答的基因表達(dá)的其它調(diào)節(jié)性元件，其中所述的脅迫調(diào)節(jié)例如是干旱(Tran等(2004)Plant Cell 16(9) :2481_2498)、熱、寒冷、冰凍、鹽脅迫、氧化脅迫(US 5，290，924)或生物性脅迫源，如細(xì)菌、真菌或病毒。多肽、肽、寡肽、基因產(chǎn)物、表達(dá)產(chǎn)物和蛋白質(zhì)可互換使用以意指連續(xù)氨基酸殘基的聚合物或寡聚物。重組或轉(zhuǎn)基因的DNA表達(dá)構(gòu)建體就例如核酸序列(包含所述核酸序列的表達(dá)構(gòu)建體、表達(dá)盒或載體)指源自實驗操作的全部構(gòu)建體，在其中a)所述的核酸序列，或b)與所述核酸序列有效連接的遺傳控制序列例如啟動子，或
c) (a)和(b)未處于其天然遺傳環(huán)境內(nèi)或已經(jīng)通過實驗操作得到修飾，修飾的實例是一個或多個核苷酸殘基的置換、添加、缺失、倒置或插入。天然遺傳環(huán)境指來源生物中天然的染色體基因座或指存在于基因組文庫中。以基因組文庫為例，核酸序列的天然遺傳環(huán)境優(yōu)選地得以保留，至少部分得以保留。該環(huán)境在核酸序列的至少一側(cè)分布并具有長度至少50bp、優(yōu)選地至少500bp、特別優(yōu)選地至少1，OOObp、非常特別優(yōu)選地至少5，OOObp的序列。天然存在的表達(dá)構(gòu)建體，例如啟動子與相應(yīng)基因的天然存在的組合，當(dāng)其受到非天然的、合成的、“人工”方法如例如誘變修飾時，變成轉(zhuǎn)基因表達(dá)構(gòu)建體。此類方法已經(jīng)得到描述(US5，565, 350 ；W0 00/15815)。重組多肽或蛋白質(zhì)指這樣的多肽或蛋白質(zhì)，其通過重組DNA技術(shù)產(chǎn)生，即從用編碼所需要的多肽或蛋白質(zhì)的外源性重組DNA構(gòu)建體轉(zhuǎn)化的細(xì)胞中產(chǎn)生。重組核酸和多肽還可以包含如此的分子，其在自然界中不存在，但受到人的修改、改變、突變或其它操作。本發(fā)明內(nèi)含子的重要用途將是增強核酸序列的表達(dá)，其中所述的核酸序列編碼可干擾正常轉(zhuǎn)錄或翻譯的特定蛋白質(zhì)、多肽或DNA序列，例如干擾RNA或反義RNA。在本發(fā)明的一個實施方案中，重組DNA表達(dá)構(gòu)建體賦予一種或多種核酸分子的表達(dá)。所述的重組DNA表達(dá)構(gòu)建體根據(jù)本發(fā)明有利地包含在植物中有功能的啟動子、在植物中有功能的額外調(diào)節(jié)性或控制性元件或序列、在植物中具有增強表達(dá)特性的內(nèi)含子序列和在植物中有功能的終止子。此夕卜，重組表達(dá)構(gòu)建體可以含有額外的功能性元件，如賦予例如正向選擇標(biāo)記和負(fù)向選擇標(biāo)記、報告基因、重組酶或核酸內(nèi)切酶表達(dá)的表達(dá)盒，它們影響著本發(fā)明的表達(dá)盒、載體或重組生物的產(chǎn)生、擴(kuò)增或功能。此外，重組表達(dá)構(gòu)建體可以包含與目的植物基因具有同源性的核酸序列，其具有足夠長度以便在導(dǎo)入植物后在目的基因的基因座內(nèi)誘導(dǎo)發(fā)生同源重組(HR)事件。本發(fā)明的重組轉(zhuǎn)基因表達(dá)盒(或包含所述轉(zhuǎn)基因表達(dá)盒的轉(zhuǎn)基因載體)可以通過(例如在 Maniatis 1989,《Molecular Cloning A Laboratory Manual》，第二版，ColdSpring Harbor Laboratory,Cold Spring Harbor(NY) ；Silhavy 1984,《Experiments withGene Fusions》，Cold Spring Harbor Laboratory, Cold Spring Harbor, NY 和在 Ausubel1987,〈〈Current Protocols inMolecular Biology)),Greene Publishing Assoc, and WileyInterscience)所述的常規(guī)重組技術(shù)和克隆技術(shù)產(chǎn)生。導(dǎo)入本發(fā)明的表達(dá)盒至生物或其細(xì)胞、組織、器官、部分或種子(優(yōu)選地至植物或植物細(xì)胞、組織、器官、部分或種子)可以使用包含以上所述核酸、啟動子、內(nèi)含子、終止子、調(diào)節(jié)或控制元件和功能性元件的載體有利地實行。再生如本文中所用意指從植物細(xì)胞、植物細(xì)胞組、植物部分或植物碎片(例如來自原生質(zhì)體、愈傷組織、原胚體樣體或組織部分)中生長出完整植物。調(diào)節(jié)序列指DNA的啟動子、增強子或其它節(jié)段，在其中調(diào)節(jié)蛋白如轉(zhuǎn)錄因子結(jié)合并因而影響給定基因的轉(zhuǎn)錄速率。在基因組DNA序列數(shù)據(jù)庫或基因組DNA文庫內(nèi)所代表的植物基因組中的基本上全部內(nèi)含子指全部內(nèi)含子中大于80%、優(yōu)選地大于90%、更優(yōu)選地大于95%、仍更優(yōu)選地大于98%的內(nèi)含子存在于作為制備基因組DNA序列數(shù)據(jù)庫或基因組DNA文庫來源所使用的植物的基因組內(nèi)。構(gòu)建基因組文庫和隨后對基因組DNA測序以及使用已得到的序列信息構(gòu)建基因組序列數(shù)據(jù)庫或基因組DNA序列數(shù)據(jù)庫在本領(lǐng)域內(nèi)已充分建立(Mozo等(1998)Mol. Gen. Genet. 258 :562-570 ;Choi 等(1995)Weeds World2 17-20 ；Lui 等(1999)Proc.Natl.Acad. Sci. USA 96 6535-6540 ；TheArabidopsis Genome initiative, Nature 402 761-777 (1999) ；TheArabidopsis Genome initiative, Nature 408:796-826(2000)。結(jié)構(gòu)基因如本文中所用，意指轉(zhuǎn)錄成mRNA的DNA序列，其中所述的mRNA隨后翻譯成作為具體多肽的特征的氨基酸序列。足夠長度就包含于DNA構(gòu)建體內(nèi)的同源性序列(例如同源性序列A或B)而言理解為包含長度至少100個堿基對、優(yōu)選地至少250個堿基對、更優(yōu)選地至少500個堿基對、特別優(yōu)選地至少1，000個堿基對、最優(yōu)選地至少2，500個堿基對的序列。術(shù)語“足夠的同源性”就包含于DNA構(gòu)建體內(nèi)的同源性序列(例如同源性序列A或B)而言將理解為包含如此序列，該序列與包含于染色體DNA內(nèi)的相應(yīng)靶序列(例如靶序列A'或B')具有至少70%、優(yōu)選地至少80%、更優(yōu)選地至少90%、特別優(yōu)選地至少95%、更特別優(yōu)選地至少99%、最優(yōu)選地100 %的同源性，其中所述的同源性延續(xù)跨越至少50個堿基對、優(yōu)選地至少100個堿基對、更優(yōu)選地至少250個堿基對、最優(yōu)選地至少500個堿基對的長度。靶區(qū)域/序列核酸序列的靶區(qū)域/序列是待鑒定的核酸序列的一部分。核酸序列的“編碼區(qū)”是核酸序列中這樣的部分，當(dāng)其處于適宜的調(diào)節(jié)序列的控制下時以序列特異性方式得到轉(zhuǎn)錄和翻譯以產(chǎn)生特定的多肽或蛋白質(zhì)。據(jù)稱編碼區(qū)編碼如此的多肽或蛋白質(zhì)。組織就植物(或“植物組織”)而言意指多個植物細(xì)胞的排列，包括植物中分化的和未分化的組織。植物組織可以構(gòu)成植物器官的部分(例如植物葉的表皮)，但還可以構(gòu)成腫瘤組織和多種培養(yǎng)中的細(xì)胞(例如單個細(xì)胞、原生質(zhì)體、胚、愈傷組織、原胚體樣體等)。植物組織可以在原有植物內(nèi)(inplanta)、在器官培養(yǎng)、組織培養(yǎng)或細(xì)胞培養(yǎng)內(nèi)。轉(zhuǎn)化或轉(zhuǎn)化如本文中所用，指遺傳材料(例如轉(zhuǎn)基因)導(dǎo)入細(xì)胞。細(xì)胞的轉(zhuǎn)化可以是穩(wěn)定的或瞬時的。術(shù)語“瞬時轉(zhuǎn)化”或“瞬時地轉(zhuǎn)化”指在轉(zhuǎn)基因未整合至宿主細(xì)胞基因組內(nèi)的情況下，將一種或多種轉(zhuǎn)基因?qū)爰?xì)胞。瞬時轉(zhuǎn)化可以通過例如檢測一種或多種轉(zhuǎn)基因所編碼多肽的存在的酶聯(lián)免疫吸附測定(ELISA)檢測。備選地，瞬時轉(zhuǎn)化可以如本文中所示[例如實施例I. 6和2. 4，通過用X-gluc染色的⑶S酶活性的組織化學(xué)測定，其中所述的X-gluc在⑶S酶存在下產(chǎn)生藍(lán)色沉淀物；以及使用⑶S-光試劑盒(Tropix)的⑶S酶活性的化學(xué)發(fā)光測定]通過檢測轉(zhuǎn)基因(例如UidA基因)所編碼的蛋白質(zhì)(例如β-葡糖醛酸糖苷酶)的活性進(jìn)行檢測。術(shù)語“瞬時轉(zhuǎn)化體”指短暫地包含一種或多種轉(zhuǎn)基因的細(xì)胞。相對而言，術(shù)語“穩(wěn)定轉(zhuǎn)化”或“穩(wěn)定地轉(zhuǎn)化”指一種或多種轉(zhuǎn)基因?qū)牒驼现良?xì)胞的基因組內(nèi)，優(yōu)選地產(chǎn)生經(jīng)歷減數(shù)分裂的染色體性整合和穩(wěn)定遺傳力。細(xì)胞的穩(wěn)定轉(zhuǎn)化可以通過細(xì)胞基因組DNA與能夠與一種或多種轉(zhuǎn)基因結(jié)合的核酸序列發(fā)生DNA印跡雜交進(jìn)行檢測。備選地，細(xì)胞的穩(wěn)定轉(zhuǎn)化還可以通過擴(kuò)增轉(zhuǎn)基因序列的細(xì)胞基因組DNA聚合酶鏈?zhǔn)椒磻?yīng)進(jìn)行檢測。術(shù)語“穩(wěn)定的轉(zhuǎn)化體”指使得一種或多種轉(zhuǎn)基因穩(wěn)定整合至基因組DNA內(nèi)的細(xì)胞。因此，穩(wěn)定的轉(zhuǎn)化體與瞬時轉(zhuǎn)化體相區(qū)別在于其中來自穩(wěn)定轉(zhuǎn)化體的基因組DNA含有一種或多種轉(zhuǎn)基因，而來自瞬時轉(zhuǎn)化體的基因組DNA不含轉(zhuǎn)基因。轉(zhuǎn)化還包括以涉及染色體外復(fù)制和基因表達(dá)的植物病毒載體形式將遺傳材料導(dǎo)入植物細(xì)胞，這可以表現(xiàn)出相對于減數(shù)分裂穩(wěn)定性的可變特性。轉(zhuǎn)基因的或重組當(dāng)用來指細(xì)胞時，指含有轉(zhuǎn)基因的細(xì)胞，或其基因組已經(jīng)通過導(dǎo)入轉(zhuǎn)基因得到改變的細(xì)胞。術(shù)語“轉(zhuǎn)基因的”當(dāng)用來指組織或指植物時，分別指這樣的組織或植物，其包含含有轉(zhuǎn)基因的或其基因組已經(jīng)通過導(dǎo)入轉(zhuǎn)基因得到改變的一個或多個細(xì)胞。轉(zhuǎn)基因的細(xì)胞、組織和植物可以通過數(shù)種方法產(chǎn)生，包括通過人類干預(yù)如通過本文中所述方法，將包含核酸(通常是DNA)的“轉(zhuǎn)基因”導(dǎo)入靶細(xì)胞或?qū)⒋宿D(zhuǎn)基因整合至靶細(xì)胞的染色體。野生型、天然的或天然來源的就生物、多肽或核酸序列而言意指所述的生物、多肽或核酸序列是天然存在的或可以在至少一種天然存在的生物、多肽或核酸序列中得到，未受到人工改變、突變或其它操作。載體是能夠在宿主細(xì)胞內(nèi)復(fù)制的DNA分子。質(zhì)粒和粘粒是示例性載體。此外，術(shù)語“載體”和“媒介”可互換使用以指將DNA片段從一種細(xì)胞轉(zhuǎn)移至另一種細(xì)胞的核酸分子，因此細(xì)胞不必要屬于相同的生物(例如將DNA片段從農(nóng)桿菌細(xì)胞轉(zhuǎn)移至植物細(xì)胞)。術(shù)語“表達(dá)載體”如本文中所用，指含有所需要的編碼序列和在特定宿主生物中表達(dá)有效連接的編碼序列所需要的適宜核酸序列的重組DNA分子。發(fā)明詳述根據(jù)本發(fā)明的教導(dǎo)可以鑒定引起內(nèi)含子介導(dǎo)性基因表達(dá)增強(ME)的內(nèi)含子。此夕卜，本發(fā)明提供分離的植物內(nèi)含子，若該植物內(nèi)含子與在植物中有功能的啟動子和核酸片段功能性地組合，則可以增強所述的核酸在植物或植物細(xì)胞中的表達(dá)速率。本發(fā)明的第一實施方案涉及用于鑒定具有植物基因增強表達(dá)特性的內(nèi)含子的方法，包括從植物基因組中選擇內(nèi)含子，其中所述內(nèi)含子具有至少如下特征I)內(nèi)含子長度短于1，000堿基對，并且II)存在包含二核苷酸序列5' -GT-3' (SEQ ID NO :78)的5'剪接位點，并且III)存在包含三核苷酸序列5' -CAG-3' (SEQ ID NO :79)的3'剪接位點，并且IV)在3'剪接位點的上游存在類似于共有序列5' -CURAY-3' (SEQID NO 75)的分支點，和V)從5'剪接位點向下游100個核苷酸范圍至少40%的腺嘌呤加胸腺嘧啶含量，并且VI)從3'剪接位點向上游100個核苷酸范圍至少50%的腺嘌呤加胸腺嘧啶含量，并且VII)整個內(nèi)含子范圍至少50%的腺嘌呤加胸腺嘧啶含量和至少30%的胸腺嘧啶含量。在另一實施方案中，本發(fā)明涉及用于在植物內(nèi)含子群體中富集具有在植物中增強表達(dá)特性的內(nèi)含子數(shù)目至所述群體的至少50%的方法，所述方法包括從所述群體內(nèi)選擇內(nèi)含子，該內(nèi)含子具有至少如下特征I)內(nèi)含子長度短于1，000堿基對，并且II)存在包含二核苷酸序列5' GT-3' (SEQ ID NO :78)的5'剪接位點，并且III)存在包含三核苷酸序列5' -CAG-3' (SEQ ID NO :79)的3'剪接位點，并且IV)在3'剪接位點上游存在類似于共有序列5' -CURAY-3' (SEQ IDNO :75)的分支點，并且V)從5'剪接位點向下游100個核苷酸范圍至少40%的腺嘌呤加胸腺嘧啶含量，并且
VI)從3'剪接位點向上游100個核苷酸范圍至少50%的腺嘌呤加胸腺嘧啶含量，并且VII)整個內(nèi)含子范圍至少50%的腺嘌呤加胸腺嘧啶含量和至少30%的胸腺嘧啶含量。在受玉米(Zea mays)遍在蛋白啟動子驅(qū)動的β _葡糖醒酸糖苷酶基因(OTS)的5'非翻譯區(qū)(UTR)中包含通過 SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、
19、20、21或22所描述的本發(fā)明內(nèi)含子已經(jīng)導(dǎo)致在玉米原生質(zhì)體(Black Mexican Sweet)懸浮細(xì)胞和穩(wěn)定轉(zhuǎn)化的植物中的報告基因強烈的表達(dá)增強(見實施例)。此外，可以證實所述內(nèi)含子的增強基因表達(dá)特性是與從文獻(xiàn)中已知的那些增強基因表達(dá)特性可比的(例如在表達(dá)分析中作為陽性對照使用的玉米遍在蛋白基因的第一內(nèi)含子)。在優(yōu)選的實施方案中，將通過應(yīng)用本發(fā)明富集方法鑒定的內(nèi)含子群體中具有增強基因表達(dá)特性的內(nèi)含子的數(shù)目富集達(dá)到至少50 %、優(yōu)選地至少55 %、更優(yōu)選地至少60 %、特別優(yōu)選地至少65%或非常特別優(yōu)選地至少70% (即通過使用本發(fā)明方法所預(yù)選的100個內(nèi)含子給定群體將包含至少50個、優(yōu)選地至少55個、更優(yōu)選地至少60個、特別優(yōu)選地至少65個或70個具有增強基因表達(dá)特性的內(nèi)含子)。更優(yōu)選地，使通過應(yīng)用本發(fā)明富集方法鑒定的內(nèi)含子群體中具有增強基因表達(dá)特性的內(nèi)含子的數(shù)目富集達(dá)到至少50%，其中所選擇的內(nèi)含子，若作為重組DNA表達(dá)構(gòu)建體的部分，在不改變其它條件下與僅缺少內(nèi)含子而其它完全相同的表達(dá)構(gòu)建體相比，導(dǎo)致增加給定基因的基因表達(dá)至少300%。最優(yōu)選地，富集是至少60%，其中所選擇的內(nèi)含子增加受給定啟動子驅(qū)動的基因的轉(zhuǎn)錄至少200%。特別優(yōu)選地，富集是至少70%，其中所選擇的內(nèi)含子增加受給定啟動子驅(qū)動的基因的轉(zhuǎn)錄至少 50%。優(yōu)選地，本發(fā)明ME內(nèi)含子的長度優(yōu)選地短于1，000個堿基對，更優(yōu)選地短于900bp、最優(yōu)選地短于800bp。在優(yōu)選的實施方案中，本發(fā)明方法所鑒定的內(nèi)含子的分支點序列由核苷酸序列 5' -CURAY-3' (SEQ ID N0:75)或 5' -YURAY-3' (SEQ ID NO :76)描述，其中U和A是必需核苷酸并且分別在位置3和5處的嘌呤和嘧啶是優(yōu)選的核苷酸。在位置I中，嘧啶為優(yōu)選，并且C對U為優(yōu)選。環(huán)繞GT雙核苷酸的5'剪接位點的序列可以變化。優(yōu)選序列是5' -RR/GT(RT) (RT) (GY)-3' (SEQ ID NO 77)的5'剪接位點，其中R代表核苷酸G或Α,Υ代表核苷酸C或Τ。在括號內(nèi)給出的核苷酸描述了在各自位置內(nèi)的替代性核苷酸。在本發(fā)明優(yōu)選的實施方案中，本發(fā)明內(nèi)含子在全序列范圍內(nèi)的腺嘌呤/胸腺嘧啶含量是至少50%、更優(yōu)選地是至少55%、甚至更優(yōu)選地是至少60%。在本發(fā)明優(yōu)選的實施方案中，將應(yīng)用于本發(fā)明方法的植物內(nèi)含子群體包含a)DNA序列數(shù)據(jù)庫內(nèi)或b)植物基因組DNA文庫內(nèi)所代表的植物基因組的基本上全部內(nèi)含子。在本發(fā)明額外的實施方案中，將應(yīng)用于本發(fā)明方法的內(nèi)含子群體選自a)位于編碼蛋白質(zhì)的兩個外顯子之間的內(nèi)含子，和b)位于相應(yīng)基因的5'非翻譯區(qū)內(nèi)部的內(nèi)含子。為了鑒定具有在植物或植物細(xì)胞中增強表達(dá)特性的位于編碼區(qū)內(nèi)(在兩個蛋白質(zhì)編碼性外顯子之間)或在給定基因5'非翻譯區(qū)內(nèi)的內(nèi)含子，可以篩選來自(例如存在于序列數(shù)據(jù)庫內(nèi)的)一套基因的編碼區(qū)和5'非翻譯區(qū)以確定位于所述區(qū)域內(nèi)的內(nèi)含子的存在，并且已鑒定的內(nèi)含子隨后使用本發(fā)明的方法之一加以篩選。使用本領(lǐng)域技術(shù)人員已知的生物信息工具的計算機法鑒定方法可以通過篩選a)特定的DNA序列數(shù)據(jù)庫(例如專一含有編碼區(qū)或5'非翻譯區(qū))或b)其它公眾可用的含有基因組DNA序列的數(shù)據(jù)庫開展。在本發(fā)明優(yōu)選的實施方案中，具有增強表達(dá)特性的位于5'非翻譯區(qū)內(nèi)的內(nèi)含子通過包括如下步驟的方法鑒定a.鑒定存在于序列數(shù)據(jù)庫中的一套基因內(nèi)的編碼序列，和b.鑒定與(a)中所鑒定的基因相對應(yīng)的EST序列，和c.將所述的編碼序列和EST序列與各個基因的基因組序列相比較,和d.選擇包含5'非翻譯區(qū)的EST序列，和e.鑒定位于5'非翻譯區(qū)內(nèi)的內(nèi)含子。優(yōu)選地，(例如使用本發(fā)明方法的標(biāo)準(zhǔn))搜索或生成DNA序列或生成特定DNA序列數(shù)據(jù)庫并篩選同一 DNA序列數(shù)據(jù)庫的步驟可借助技術(shù)人員已知的適宜生物信息計算機算法和適宜計算機裝置開展。在優(yōu)選的實施方案中，其中選自于內(nèi)含子群體的內(nèi)含子衍生自單子葉植物，特別優(yōu)選的是選自大麥屬、燕麥屬、黑麥屬、小麥屬、高粱屬、玉蜀黍?qū)佟⒏收釋俸偷緦俚膯巫尤~植物。在本發(fā)明又一個更優(yōu)選的實施方案中，將應(yīng)用于本發(fā)明方法的內(nèi)含子群體選自這樣的植物基因群體，所述的植物基因群體代表在使用植物細(xì)胞、植物組織或完整植物所開展的基因表達(dá)分析實驗中具有最高表達(dá)速率的基因的10%部分(第九位十分位數(shù))。為測定基因表達(dá)水平，提出了多種不同的技術(shù)(Milosavljevic, A.等(1996)Genome Res. 6 132-141 ；Shoemaker, D.等(1996)Nature Genet. 14450-456 ；Sikela,J. M.和 Auffray, C. (1993)Nature Genet. 3 :189_191 ；Meier-Ewert S.等(1998)NucleicAcids Research 26(9) =2216-2223) 因此，可以根據(jù)本發(fā)明采用多種不同的基因表達(dá)分析系統(tǒng)，包括但不限于微陣列分析、“數(shù)字化RNA印跡法”、利用“通過雜交法的DNA測序”對 cDNA 文庫的克隆分布分析(Strezoska, Z.等(1991)Proc. Natl. Acad. Sci. USA88 10089-10093)和基因表達(dá)的系列分析(SAGE, Velculescu, V. E.等(1995) Science 270 484-487)。通過使用cDNA微陣列雜交技術(shù)，可以一次監(jiān)測數(shù)千個基因的表達(dá)譜。DNA陣列分析已經(jīng)變成分子生物實驗室中用于監(jiān)測基因表達(dá)的標(biāo)準(zhǔn)技術(shù)。陣列可以通過預(yù)先合成的DNA產(chǎn)物的機械點樣或通過寡核苷酸在固體基質(zhì)(通常是衍生化的載玻片)上的從頭合成而制造。通常，陣列用于檢測已轉(zhuǎn)錄自不同基因并編碼不同蛋白質(zhì)的mRNA的存在。該RNA從多種細(xì)胞或從單一細(xì)胞類型中提取，隨后轉(zhuǎn)換成cDNA或CRNAt5RNA的拷貝可以通過(RT-)PCR “擴(kuò)增”。熒光標(biāo)簽可以用酶方式加入新合成的鏈中或可以化學(xué)地結(jié)合至DNA或RNA的新鏈中。含有與單鏈探針序列之一互補的序列的cDNA或cRNA分子將與已附著互補探針的斑點經(jīng)堿基配對發(fā)生雜交或粘附。該斑點隨后在使用微陣列掃描儀檢查時發(fā)出熒光。增加或減少的熒光強度表明樣品中的細(xì)胞最近已經(jīng)轉(zhuǎn)錄或停止轉(zhuǎn)錄含有所探測序列的基因。熒光的強度與存在的特定mRNA的拷貝數(shù)成正比，并且因而大致地顯示該基因的活性或表達(dá)水平。可商業(yè)地獲得可以根據(jù)本發(fā)明所采用的陣列(和開展表達(dá)分析實驗所需要的相應(yīng)設(shè)備)。產(chǎn)自Affimetrix (SantaClara，CA)的基因芯片擬南芥ATHl基因組陣列含有代表大約24，000個基因的超過22，500個探針組。該陣列基于來自2000年12月正式完成的國際擬南芥測序計劃的信息(http://www. affymetrix. com)。因此，已分析的基因的表達(dá)速率可以(根據(jù)雜交過程后各個基因的熒光強度)進(jìn)行歸類并且可以通過使用微陣列分析鑒定10 %的顯不最聞基因表達(dá)速率的基因。通過互聯(lián)網(wǎng)可公開地獲得含有微陣列表達(dá)譜結(jié)果的數(shù)據(jù)庫，例如諾丁漢姆擬南芥忙存中心微陣列數(shù)據(jù)庫(Nottingham Arabidopsis StockCenter’s microarray database)或OSMID(滲透脅迫微陣列信息)數(shù)據(jù)庫。諾丁漢姆擬南芥貯存中心微陣列數(shù)據(jù)庫含有大范圍選擇的來自 Affimetrix基因芯片(http://affymetrix. arabidopsis. info)的微陣列數(shù)據(jù)。OSMID數(shù)據(jù)庫(http://www.osmid.org)含有在亞利桑那大學(xué)開展的大約100個微陣列實驗的結(jié)果。該數(shù)據(jù)庫包括對NaCl、寒冷和干旱處理擬南芥菜、稻(Oryzasativa)、大麥(Hordeumvulgaris)、冰葉日中花(Mesembryanthemum crystalIinum)和玉米的分析。因此通過使用存在于序列/表達(dá)數(shù)據(jù)庫內(nèi)的表達(dá)譜，基因的表達(dá)速率可以(根據(jù)文庫中相應(yīng)cDNA的克隆分布)進(jìn)行歸類并且可以鑒定10%的顯示最高(豐度)基因表達(dá)速率的基因。“數(shù)字化RNA印跡”通過對數(shù)千個從相關(guān)cDNA文庫中隨機選擇的克隆進(jìn)行部分測序而生成。差異性表達(dá)的基因可以隨后從它們同族序列標(biāo)簽的計數(shù)變異得以檢測。基于序列標(biāo)簽的方法由自3'方向的區(qū)域性非歸一化cDNA文庫生成的大量(數(shù)千個)表達(dá)序列標(biāo)簽(EST)組成。“數(shù)字化RNA印跡”比較的概念如下?lián)蟮辣姸鄻?biāo)簽同用于形成cDNA文庫的組織類型或細(xì)胞類型中同族轉(zhuǎn)錄物的豐度成正比。在存儲于計算機數(shù)據(jù)庫內(nèi)的這些標(biāo)簽的相對頻率的變異隨后用于說明相應(yīng)基因的差異性表達(dá)(Okubo等1992 ；Matsubara和Okubo 1994)。此技術(shù)的進(jìn)一步發(fā)展是僅需要9個核苷酸作為標(biāo)簽因此允許更大通量的SAGE方法。因此，通過使用“數(shù)字化RNA印跡分析的基因的表達(dá)速率可以(根據(jù)文庫中相應(yīng)基因的標(biāo)簽的豐度)進(jìn)行歸類并且可以鑒定10%的表現(xiàn)最聞(豐度)基因表達(dá)速率的基因。使用在美國專利US 5，667，972、US 5，492，806、US 5，695，940、US5, 972，619、US6，018，041、US 6，451，996、US 6，309，824中所述的“通過雜交方法的測序”，有可能開展完整的cDNA文庫的計算機法克隆分布分析。所述的美國專利的全部內(nèi)容引用作為參考。本項技術(shù)是可商業(yè)獲得的并且可以與HySeq Inc.合作開展定制的實驗。為使用“通過雜交方法的測序”或“HySeq技術(shù)”確定克隆分布，將植物在多種條件和處理下生長，并且收集處于不同發(fā)育階段的組織。這以一種策略性方式完成以便使收獲至少一個或多個文庫中的所有可表達(dá)基因的概率最大化。隨后從已收集的每一份樣品內(nèi)提取mRNA并用于產(chǎn)生文庫。文庫可以從在寡dT柱上純化的mRNA產(chǎn)生。隨機挑取來自cDNA文庫所轉(zhuǎn)化大腸桿菌(E. coli)的菌落并置于微量滴定平板內(nèi)并隨后將DNA點樣至一個表面。將來自微量滴定平板中每一克隆的cDNA插入物進(jìn)行PCR擴(kuò)增并點樣至尼龍膜上。隨后將288個33_p標(biāo)記的7聚體寡核苷酸組依次與此膜雜交。雜交后，在磷光成像儀掃描期間捕獲印跡圖像以生成每個單一寡核苷酸的圖譜。絕對同一性通過條形碼成像盒、濾膜和盒內(nèi)的方向得到維持。隨后使用相對溫和的條件處理濾膜以去除結(jié)合的探針并隨后將濾膜返回雜交室用于下一輪雜交。重復(fù)雜交和成像循環(huán)直至用完整組288個寡聚物。在雜交結(jié)束后，每一個點(代表cDNA插入物)將記錄自288個7聚體寡核苷酸內(nèi)每一 7聚體寡核苷酸產(chǎn)生的放射信號的量。將何種寡聚物與每一獨立cDNA插入物(膜上的點)結(jié)合，結(jié)合至何種程度的圖譜定義為生成自該克隆的簽名。將每個克隆的簽名與來自同一生物的所有其它簽名進(jìn)行比較以鑒定相關(guān)簽名的簇。這個過程將來自一種生物的全部克隆在測序前“分類”成所謂的“簇”。在成簇的過程中，復(fù)雜的或組織特異性cDNA文庫使用一系列288個7堿基對寡核苷酸進(jìn)行“挖掘”。通過在這些寡聚物的雜交簽名上收集數(shù)據(jù)，文庫中隨機成組的克隆可以分類成“簇”。簇用于說明特定文庫中每一基因的豐度并且因此是單個基因的基因表達(dá)速率的度量。因此，基因的表達(dá)速率可以使用“HySeq”技術(shù)進(jìn)行分類并且可以鑒定屬于表現(xiàn)最高(豐度)基因表達(dá)速率的10 %的基因。選擇用于鑒定本發(fā)明內(nèi)含子的基因、cDNA或表達(dá)序列標(biāo)簽為10%、優(yōu)選地5%、更優(yōu)選地3%、最優(yōu)選地I %的在基因表達(dá)分析實驗中顯不最聞基因表達(dá)速率的基因，其中基因表達(dá)速率可以通過使用以上所述的方法間接地計算。在本發(fā)明優(yōu)選的實施方案中，10%的顯示最高基因表達(dá)速率的基因的核酸序列用來通過使用雜交方法或RACE克隆技術(shù)(cDNA末端快速擴(kuò)增)或染色體步移技術(shù)篩選例如適宜的含有DNA序列的數(shù)據(jù)庫或基因組DNA或基因組DNA文庫而分離相應(yīng)基因的(包括內(nèi)含子序列的)完整基因組DNA序列。在測定相應(yīng)候選基因的已分離的完整基因組DNA的序列后，存在于所述基因內(nèi)的內(nèi)含子序列使用如上所述的鑒定具有增強表達(dá)特性的那些內(nèi)含子的標(biāo)準(zhǔn)進(jìn)行篩選。用于選擇具有增強表達(dá)特性的內(nèi)含子的所述計算機方法具有高的成功概率，但是所述方法的效率可以通過與其它方法組合進(jìn)一步得到提高。因此在本發(fā)明一個優(yōu)選的實施方案中，獨立驗證在基因表達(dá)分析實驗中顯示最高基因表達(dá)速率的10%的基因使用替代性基因表達(dá)分析工具如RNA印跡分析或?qū)崟rPCR分析(見實施例)完成。在本發(fā)明優(yōu)選的實施方案中，使用自動化方法、更優(yōu)選地使用計算機裝置和算法，將用于鑒定或富集具有在植物中增強基因表達(dá)特性的內(nèi)含子的方法應(yīng)用于DNA序列數(shù)據(jù)庫，其中所述算法定義如此指令，該指令是實現(xiàn)在已篩選的DNA序列群體中鑒定或富集具有在植物中增強基因表達(dá)特性的內(nèi)含子的選擇步驟所需要的。本發(fā)明的又一個實施方案是定義指令的計算機算法，所述的指令是實現(xiàn)如上所述的用于鑒定或富集具有增強植物基因表達(dá)特性的內(nèi)含子的選擇步驟所需要的。有用的計算機算法在生物信息學(xué)領(lǐng)域或計算生物學(xué)領(lǐng)域內(nèi)眾所周知。生物信息學(xué)或計算生物學(xué)通過創(chuàng)造或使用計算機程序、數(shù)學(xué)模型或二者，利用數(shù)學(xué)技術(shù)和信息技術(shù)來分析序列數(shù)據(jù)(例如生成序列數(shù)據(jù)、序列比對、篩選序列數(shù)據(jù))。生物信息學(xué)的一個主要領(lǐng)域是對已匯集的不同來源的數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘和分析。其它領(lǐng)域是序列比對、蛋白質(zhì)結(jié)構(gòu)預(yù)測。生物信息學(xué)在序列分析中的另一個方面是自動檢索基因組內(nèi)的基因或調(diào)節(jié)序列(例如基因組DNA范圍內(nèi)的內(nèi)含子序列)。序列數(shù)據(jù)庫可以使用多種方法進(jìn)行搜索。最常見的搜索可能是搜索與特定靶基因相似的序列，其中靶基因的序列是用戶已知的。這種類型方法的有用程序是BLAST(基本局部比對搜索工具)程序。BLAST是用于比較生物學(xué)序列如不同基因的DNA序列的算法。給定序列的文庫或數(shù)據(jù)庫，BLAST搜索可以使搜索者尋找特定序列。BLAST算法和執(zhí)行該算法的計算機程序由美國國立生物技術(shù)信息中心(NCBI)的Stephen Altschul開發(fā)并可在網(wǎng)絡(luò)上在http://www. ncbi.nlm. nih. gov/BLAST獲得。BLAST程序可以下載并作為命令行應(yīng)用“blastall”運行，或通過網(wǎng)絡(luò)免費登錄。由NCBI主控的BLAST網(wǎng)絡(luò)服務(wù)器允許任何人用網(wǎng)絡(luò)瀏覽器針對蛋白質(zhì)和DNA持續(xù)更新的數(shù)據(jù)庫開展相似性搜索，其中所述的數(shù)據(jù)庫包括大部分最近已測序的生物。BLAST實際上是程序家族(blastall所包含的程序均可執(zhí)行)，除其它以外還包括核苷酸-核苷酸BLAST (BLASTN)。在給出DNA查詢時，該程序從用戶指定的DNA數(shù)據(jù)中返回最相似的序列。本領(lǐng)域技術(shù)人員知道如何從例如公共序列數(shù)據(jù)庫中產(chǎn)生或檢索序列數(shù)據(jù)庫和如何設(shè)計算法以便以定制的方式篩選成套的序列(見實施例)。
此外，本發(fā)明涉及定義指令的計算機算法，其中所述的指令是實現(xiàn)從植物基因組或內(nèi)含子群體中鑒定或富集具有在植物中增強基因表達(dá)特性的內(nèi)含子的選擇步驟所需要的，其中所述內(nèi)含子群體選自位于編碼蛋白質(zhì)的兩個外顯子之間的內(nèi)含子，和/或位于相應(yīng)基因的5'非翻譯區(qū)內(nèi)部的內(nèi)含子，和/或位于如此基因的DNA序列內(nèi)的內(nèi)含子，其中所述的基因代表在使用植物細(xì)胞、植物組織和/或完整植物所開展的基因表達(dá)分析實驗中具有最高表達(dá)速率的基因的10%部分。本發(fā)明的另一個實施方案是包含算法的計算機裝置或數(shù)據(jù)存儲裝置。存儲裝置可以是“硬盤”(或“硬盤驅(qū)動器”)或光學(xué)數(shù)據(jù)存儲介質(zhì)如CD-ROM( “壓縮的只讀存儲光盤” (ROM)或DVD (數(shù)字化通用光盤)或任何機械的、磁的或光的數(shù)據(jù)存儲介質(zhì)。本發(fā)明另一個實施方案涉及用于分離、提供或產(chǎn)生具有在植物中增強基因表達(dá)特性的內(nèi)含子的方法，包括如下步驟a)如上所述開展具有在植物中增強基因表達(dá)特性的內(nèi)含子的鑒定或富集并提供所述的已鑒定或已富集的內(nèi)含子的序列信息，和
b)提供在a)中已鑒定或已富集的所述內(nèi)含子的物理核苷酸序列，和c)評估在b)中提供的內(nèi)含子序列在體內(nèi)或體外表達(dá)實驗中的增強基因表達(dá)特性，和d)從所述的表達(dá)實驗c)中分離顯示增強表達(dá)特性的內(nèi)含子。優(yōu)選地，評估分離的內(nèi)含子的增強基因表達(dá)特性包括Cl)通過功能性地將來自步驟b)的各個核苷酸序列與至少一個在植物或植物細(xì)胞中有功能的啟動子序列和至少一個可輕易定量的核酸序列連接而提供重組表達(dá)構(gòu)建體，和c2)將所述的重組DNA表達(dá)構(gòu)建體導(dǎo)入植物細(xì)胞并評估所分離內(nèi)含子的增強基因表達(dá)特性。優(yōu)選地，增強基因表達(dá)特性的評估在植物細(xì)胞或穩(wěn)定轉(zhuǎn)化的植物內(nèi)完成并且其中所述分離的內(nèi)含子增強給定基因的表達(dá)至少兩倍(見實施例)。本發(fā)明的額外主題物涉及重組DNA表達(dá)構(gòu)建體，其包含在植物細(xì)胞中有功能的至少一個啟動子序列、至少一個核酸序列和選自SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21和22所描述序列中的至少一個內(nèi)含子及其功能性等效物，其中所述的啟動子序列和所述的至少一個內(nèi)含子序列功能性地連接于所述核酸序列，并且其中所述內(nèi)含子對所述的核酸序列或?qū)λ龅膯幼有蛄惺钱愒吹摹４送猓景l(fā)明涉及重組表達(dá)構(gòu)建體，其包含在植物細(xì)胞中有功能的至少一個啟動子序列、至少一個核酸序列和由序列SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21 和 22 中任意一個所描述內(nèi)含子的至少一個功能性等效物。優(yōu)選地，所述的功能性等效物包含內(nèi)含子的功能性元件，其中所述啟動子序列和至少一個所述的內(nèi)含子序列功能性地連接于所述的核酸序列，并且其中所述內(nèi)含子對所述的核酸序列或?qū)λ龅膯幼有蛄惺钱愒吹摹８鼉?yōu)選地，該功能性等效物還如下進(jìn)一步加以表征i)具有 SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21 或 22
中任意一個所描述內(nèi)含子序列的至少50個連續(xù)堿基對，或
ii)與SEQ ID NO : 1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22 中
任意一個所描述序列的跨越至少95個連續(xù)核酸堿基對具有至少80%同一性，或iii)在高度嚴(yán)格條件下與 SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21或22中任意一個所描述核酸分子中至少50個連續(xù)堿基對的核酸片段雜交。在本發(fā)明優(yōu)選的實施方案中，內(nèi)含子包含分別毗鄰于內(nèi)含子5'和3'剪接位點的序列/外顯子5'和3'的至少50個堿基對、更優(yōu)選地至少40個堿基對、最優(yōu)選地30個堿基對。在本發(fā)明的另一個實施方案中，本發(fā)明的重組DNA表達(dá)構(gòu)建體還包含與與啟動子功能性連接的一個或多個額外的調(diào)節(jié)序列。這些調(diào)節(jié)序列可以選自熱休克應(yīng)答元件、厭氧應(yīng)答元件、病原體應(yīng)答元件、干旱應(yīng)答元件、低溫應(yīng)答元件、ABA應(yīng)答元件、5'非翻譯基因區(qū)、3'非翻譯基因區(qū)、轉(zhuǎn)錄終止子、多腺苷酸化信號和增強子。參與ABA誘導(dǎo)性基因表達(dá)的順式作用因子和反式作用因子由Bray (1997) Plant Mol. Biol. 2 :48_54 ;Busk等(1998)Plant Mol. Biol. 37 :425_435 和 Shinozaki 和 Yamaguchi-Shinozaki(2000)Curr. Opin. Plant Biol. 3 :217_223綜述。眾多ABA誘導(dǎo)性基因在其啟動子區(qū)域內(nèi)含有保守的ABA應(yīng)答性順式作用元件，稱作 ABRE (ABA 應(yīng)答元件；PyACGTGGC) (Guiltinan 等(1990) Science250 267-271 ;Mundy 等(1990)Proc. Natl. Acad. Sci. USA 87:406-410)。分析了 rd29A 基因的啟動子區(qū)域并且在核苷酸序列中鑒定了負(fù)責(zé)脫水誘導(dǎo)性和寒冷誘導(dǎo)性表達(dá)的新的順式作用兀件(Yamaguchi-Shinozaki 和 Shinozaki (1994)Plant Cell 6:251-264)。稱作脫水應(yīng)答元件(DRE)的9-bp保守序列TACCGACAT對調(diào)節(jié)脫水應(yīng)答性基因表達(dá)是必需的。DRE相關(guān)的基序已經(jīng)在寒冷誘導(dǎo)型基因和干旱誘導(dǎo)型基因如kinl、cor6. 6和rdl7的啟動子區(qū)域內(nèi)得到報道(Wang 等(1995)Plant Mol. Biol. 28 :605_617 ；Iwasaki 等(1997)PlantPhysiol. 115 :1287)。熱休克基因的溫度誘導(dǎo)性歸因于熱休克因子(HSF)的激活。HSF通過高度保守的熱休克啟動子元件(HSE)發(fā)揮作用，其中所述的熱休克啟動子元件已經(jīng)定義為毗鄰且倒轉(zhuǎn)的重復(fù)基序 5' -nGAAn-3' (Amin 等(1988)Mol Cell Biol 8 :3761_3769)。防御應(yīng)答元件或病原體應(yīng)答元件的實例是W盒(TTGACY)和W盒樣元件，其代表參與植物發(fā)育和植物對環(huán)境脅迫應(yīng)答的植物特異性WRKY轉(zhuǎn)錄因子的結(jié)合位點(Eulgem等(2000) TrendsPlant Sci 5 199-206 ；Robatzek S等(2001)Plant J28 :123-133)，以及Myc元件(CACATG)(Rushton PJ 等(1998)Curr OpinPlant Biol 1:311-315)。可以與所述的啟動子一起使用的此類調(diào)節(jié)序列或元件包括5'非翻譯區(qū)、增強子序列和植物多腺苷酸化信號。可提及的翻譯增強子的實例是煙草花葉病毒5'前導(dǎo)序列(Gallie等(1987)Nucl Acids Resl5 8693-8711)，來自章魚堿合酶基因的增強子等等。此外，翻譯增強子可以促進(jìn)組織特異性(Rouster J等(1998) Plant J 15:435-440)。重組DNA表達(dá)構(gòu)建體通常將包含與:V末端核酸序列連在一起的目的基因，其中所述的3'末端核酸序列作為終止轉(zhuǎn)錄信號并隨后作為RNA的多腺苷酸化信號發(fā)揮作用。優(yōu)選的植物多腺苷酸化信號是基本上與來自根癌農(nóng)桿菌、尤其來自 Ti 質(zhì)粒 pTiACHS(Gielen 等(1984) EMBO J 3 :835_46)中 T-DNA (章魚堿合酶)的基因3的T-DNA多腺苷酸化信號或其功能性等效物相對應(yīng)的多腺苷酸化信號。基本上合適的終止子序列的實例是OCS (章魚堿合酶)終止子和NOS (胭脂氨酸合成酶)終止子。表達(dá)盒和衍生自該表達(dá)盒的載體可以包含其它的功能性元件。術(shù)語“功能性元件”應(yīng)在較寬泛的意義上理解并指影響本發(fā)明的表達(dá)盒、載體或重組生物的生成、擴(kuò)增或功能的全部元件。功能性元件可以通過舉例的方式提及，但不限于此
I.選擇標(biāo)記選擇標(biāo)記用于選擇和分離已成功轉(zhuǎn)化或同源重組的細(xì)胞。為選擇已成功發(fā)生同源重組的細(xì)胞或選擇已轉(zhuǎn)化的細(xì)胞，通常需要導(dǎo)入賦予已成功發(fā)生重組的細(xì)胞對殺生物劑(例如除草劑)、代謝抑制劑如2-脫氧葡萄糖-6-磷酸(W0 98/45456)或抗生素抗性的選擇標(biāo)記。選擇標(biāo)記允許從未轉(zhuǎn)化的細(xì)胞中選擇出已轉(zhuǎn)化的細(xì)胞(McCormick等(1986)PlantCell Reports 5 :81_84)。·I. I負(fù)向選擇標(biāo)記選擇標(biāo)記賦予對殺生物化合物如代謝抑制劑(例如2-脫氧葡萄糖-6-磷酸，WO98/45456)、抗生素(例如卡那霉素、G418、博來霉素或潮霉素)或除草劑(例如草丁膦或草甘膦的抗性)。特別優(yōu)選的負(fù)向選擇標(biāo)記是賦予除草劑抗性的的那些負(fù)向選擇標(biāo)記。可提及的實例是-草丁膦乙酰基轉(zhuǎn)移酶(PAT,也稱作Bialophos抗性；bar；de Block等(1987)EMBO J 6 2513-2518)-5-烯醇式丙酮基莽草酸-3-磷酸合成酶(EPSPS)，賦予草甘膦抗性(N_(磷酰甲基)甘氨酸)，-草甘膦降解酶(草甘膦氧化還原酶，gox)，-茅草枯失活性脫鹵素酶(deh)，-磺酰脲失活乙酰乳酸合成酶和咪唑啉酮失活乙酰乳酸合成酶((例如具有例如S4和/或Hra突變的突變ALS變體)，-溴苯腈降解性腈水解酶(bxn)-卡那霉素抗性或G418抗性基因(NPTII;NPTI)，編碼例如新霉素磷酸轉(zhuǎn)移酶，-2-脫氧葡萄糖-6-磷酸磷酸酯酶(D0GR1-基因產(chǎn)物；W0 98/45456 ；EP0807836)，賦予 2-脫氧葡萄糖抗性(Randez-Gil 等，1995 Yeastll :1233_1240)。其它合適的負(fù)向選擇標(biāo)記是賦予抗生素壯觀霉素抗性的aadA基因、賦予鏈霉素抗性的鏈霉素磷酸轉(zhuǎn)移酶(SPT)基因和介導(dǎo)潮霉素抗性的潮霉素磷酸轉(zhuǎn)移酶(HPT)基因。特別優(yōu)選的是賦予對D-氨基酸例如D-丙氨酸和D-絲氨酸所施加的毒性效應(yīng)具有抗性的負(fù)向選擇標(biāo)記(W0 03/060133 ；Erikson 2004)。作為本文中特別優(yōu)選的負(fù)向選擇標(biāo)記是來自瘦弱紅酵母(Rhodotorula gracilis)(圓紅冬酵母(Rhodosporidium toruloides))的daol基因(EC 1. 4. 3. 3 ；GenBank登錄號U60066)和大腸桿菌基因dsdA(D_絲氨酸脫水酶(D-絲氨酸脫氨基酶)[EC 4. 3. I. 18 ；GenBank 登錄號 J01603]。I. 2)反向選擇標(biāo)記反向選擇標(biāo)記特別適合選擇如此生物，其具有包含所述標(biāo)記的明確的失的序列(Koprek T等(1999)Plant J 19(6) :719_726)。反向選擇標(biāo)記的實例包括胸苷激酶(TK)、胞嘧啶脫氨基酶(Gleave AP 等(1999)Plant Mol Biol. 40(2) :223_35 ;Perera RJ 等(1993) Plant Mol. Biol 23(4) 793-799 ；StougaardJ. (1993) Plant J 3 :755_761)、細(xì)胞色素 P450 蛋白(Koprek 等(1999)Plant J16 :719_726)、鹵烷脫鹵素酶(Naested H(1999)Plant J 18:571-576)、iaaH 基因產(chǎn)物(Sundaresan V 等(1995)Gene & Development 9:1797-1810)、胞嘧啶脫氨基酶 codA(Schlaman HRM 和 Hooykaas PJJ(1997)Plant Jll 1377-1385)或 tms2 基因產(chǎn)物(Fedoroff NV & Smith DL，1993，Plant J3 :273_289)。
I. 3正向選擇標(biāo)記此外，可以采用正向選擇標(biāo)記。基因如來自根癌農(nóng)桿菌(菌株；P022 ;GenBank登錄號AB025109)的作為細(xì)胞分裂素生物合成關(guān)鍵酶的異戊烯基轉(zhuǎn)移酶可以促進(jìn)轉(zhuǎn)化植物的再生(例如通過在無細(xì)胞分裂素培養(yǎng)基上選擇)。描述了相應(yīng)的選擇方法(Ebinuma 2000a、b)。與非轉(zhuǎn)化植物相比，賦予轉(zhuǎn)化植物生長優(yōu)勢的其它正向選擇標(biāo)記在例如EP-A O 601092內(nèi)描述。生長刺激選擇標(biāo)記可以包括(但不應(yīng)當(dāng)限于)葡糖醛酸糖苷酶(與例如細(xì)胞分裂素葡糖苷酸組合)、甘露糖-6-磷酸異構(gòu)酶(與甘露糖組合)、UDP-半乳糖-4-差向異構(gòu)酶(與例如半乳糖組合)，其中特別優(yōu)選與甘露糖組合的甘露糖-6-磷酸異構(gòu)酶。2)報告基因報告基因編碼可輕易定量的蛋白質(zhì)，并通過它們的顏色或酶活性能夠評估轉(zhuǎn)化效率、表達(dá)的位點或表達(dá)的時間。在本上下文中極特別優(yōu)選編碼報告蛋白的基因(SchenbornE 和 Groskreutz D. (1999)Mol Biotechnol. 13 (I) :29_44),如綠色突光蛋白(GFP) (Sheen等(1995)Plant Journal8 (5) :777_784;Haseloff 等(1997)Proc.Natl. Acad. Sci.USA94(6) 2122-2127 ；Reichel 等(1996)Proc. Natl. Acad. Sci. USA93(12) =5888-5893 ；Tian 等(1997)Plant Cell Rep 16:267-271 ；W0 97/41228 ；Chui WL 等(1996)Curr Biol6 325-330 ；Leffel SM 等(1997)Biotechniques. 23(5) :912_8)、氯霉素轉(zhuǎn)移酶、螢光素酶(Ow等(1986)Science 234 :856_859 ;Millar等(1992)Plant Mol Biol Rep 10:324-414)、水母發(fā)光蛋白基因(Prasher等(1985)Biochem Biophys Res Commun 126(3) :1259_1268)、β-半乳糖苷酶、R基因座基因(編碼植物組織中調(diào)節(jié)花青素苷色素(呈紅色)的產(chǎn)生因而能夠?qū)幼踊钚灾苯臃治龆鵁o需添加其它輔助物質(zhì)或生色底物的蛋白質(zhì)；Dellaporta等(1988) Chromosome Structure and Function Impact of NewConcepts,18th StadlerGenetics Symposium 11 :263_282),極特別地優(yōu)選β -葡糖醒酸糖苷酶(Jefferson等(1987)EMBO J. 6 :3901_3907)。3)復(fù)制起點，其確保本發(fā)明的表達(dá)盒或載體在例如大腸桿菌內(nèi)擴(kuò)增。可提及的實例是 ORI (DNA 復(fù)制起點)、pBR322ori 或 P15A ori (Sambrook 等Molecular Cloning ALaboratory Manual,第二版，Cold SpringHarbor LaboratoryPress,Cold Spring Harbor,NY,1989)。4)農(nóng)桿菌介導(dǎo)性植物轉(zhuǎn)化所需要的元件，例如T-DNA的右邊界或左邊界或vir區(qū)域。本發(fā)明的重組表達(dá)構(gòu)建體地還含有除了編碼標(biāo)記蛋白的核酸序列外的可表達(dá)的核酸序列，或者與編碼標(biāo)記蛋白核酸序列不同的可表達(dá)的核酸序列。在本發(fā)明優(yōu)選的實施方案中，重組DNA表達(dá)構(gòu)建體包含編碼i)蛋白質(zhì)或ii)有義RNA、反義RNA或雙鏈RNA序列的核酸序列。在本發(fā)明又一個優(yōu)選的實施方案中，重組DNA表達(dá)構(gòu)建體含有編碼蛋白質(zhì)的核酸序列。在本發(fā)明的又一個實施方案中，重組DNA表達(dá)構(gòu)建體可以含有這樣的DNA，其目的是表達(dá)影響植物表型而又不被翻譯成蛋白質(zhì)的RNA轉(zhuǎn)錄物。此類不表達(dá)蛋白質(zhì)的序列包括反義RNA分子、有義RNA分子、具有核酶活性的RNA分子、形成雙鏈的RNA分子(RNAi)。本發(fā)明的轉(zhuǎn)基因表達(dá)構(gòu)建體可以用于通過“基因沉默”抑制或減少內(nèi)源性靶基因的表達(dá)。技術(shù)人員知道優(yōu)選的基因或蛋白質(zhì)，它的抑制導(dǎo)致有利的表型。此類實例包括但不限于下調(diào)擬南芥G蛋白的β-亞基以增加根的生物量(Ullah等(2003) Plant Celll5 :393_409)、使環(huán)核苷酸門控離子通道(CNGC)失活以改善抗病性(W02001007596)和下調(diào)4-香豆酸-CoA連接酶(4CL)基因以改變木質(zhì)素和纖維素含量(US 2002138870)。在本發(fā)明又一個優(yōu)選的實施方案中，本發(fā)明的轉(zhuǎn)基因表達(dá)構(gòu)建體含有在轉(zhuǎn)錄時產(chǎn)生RNA酶(核酶)的核酸，其中所述的RNA酶可以作為核酸內(nèi)切酶發(fā)揮作用并催化具有所選擇序列的RNA分子。切割所選擇的RNA可以導(dǎo)致減少它們編碼的多肽產(chǎn)物的產(chǎn)生。核酶具有具備核酸內(nèi)切酶活性的特異性催化結(jié)構(gòu)域(Kim 和 Ceck 1987, Proc. Natl. Acad. Sci. USA, 84 =8788-8792 ;Gerlach 等，1987，Nature, 328 802-805 ;Forster 和 Symons，1987，Cell，49 :211_220)。已經(jīng)描述具有 RNA 切割活性的數(shù)種不同的核酶基序(Symons, 1992, Annu. Rev. Biochem. ,61 :641_671)。實例包括來自包括煙草環(huán)斑病毒在內(nèi)的I組自我剪接型內(nèi)含子的序列(Prody等，1986，Science,231 :1577-1580)。其它合適的核酶包括來自具有切割活性的RNA酶P的序列(Yan等(1992)Proc. Natl. Acad. Sci. USA87 :4144_4148)、發(fā)夾核酶結(jié)構(gòu)(Berzal-Herranz 等(1992) Geneand Devel. 98 :1207-1210)和基于丁型肝炎病毒的核酶(美國專利第5，625，047號)。已經(jīng)詳細(xì)討論了核酶指導(dǎo)的RNA切割活性的常規(guī)設(shè)計和優(yōu)化(Haseloff和Gerlach(1988)Nature 224 :585_591 ；Symons (1992) Annu. Rev. Biochem. 61 :641_671 )。待送遞至宿主細(xì)胞或宿主植物的特定核酸序列的挑選取決于轉(zhuǎn)化目的。通常，產(chǎn)生轉(zhuǎn)基因植物的主要目的是向植物添加一些有益的性狀。在本發(fā)明的另一個實施方案中，重組表達(dá)構(gòu)建體包含編碼選擇標(biāo)記蛋白質(zhì)、篩選標(biāo)記蛋白質(zhì)、合成活性蛋白質(zhì)、分解活性蛋白質(zhì)、抗生物脅迫蛋白質(zhì)或抗非生物脅迫蛋白質(zhì)、雄性不育蛋白質(zhì)或影響植物農(nóng)學(xué)特征的蛋白質(zhì)的核酸序列。此類性狀包括但不限于，除草劑抗性或耐性、昆蟲抗性或耐性、(病毒、細(xì)菌、真菌、線蟲)疾病抗性或耐性；如對干旱、熱、寒冷、冰凍、鹽脅迫、氧化脅迫的脅迫耐性；增加產(chǎn)量、食品含量、雄性不育、淀粉數(shù)量和質(zhì)量、油含量和質(zhì)量、維生素含量和質(zhì)量(例如維生素E)等等。人們可能需要引入賦予任何此類所需要性狀的一種或多種核酸序列。此外，本發(fā)明的重組表達(dá)構(gòu)建體可以包含人工轉(zhuǎn)錄因子(例如鋅指型蛋白質(zhì)；Beerli (2000)Proc. Natl. Acad. Sci. USA 97(4) 1495-500) 這些因子結(jié)合至待表達(dá)或待抑制的內(nèi)源性基因的調(diào)節(jié)區(qū)域內(nèi)(這取決于因子的設(shè)計)，引起內(nèi)源性基因的表達(dá)或抑制。如下可以通過舉例方式而不通過限制方式提及作為可用于這些應(yīng)用的核酸序列或多肽。通過過表達(dá)例如來自短角床杜父魚(Myoxocephalus scorpius) (W000/00512) >多刺床杜父魚(Myoxocephalus octodecemspinosus)的抗冰凍多肽、擬南芥菜轉(zhuǎn)錄激活物CBF1、谷氨酸脫氫酶(W0 97/12983，W098/11240)、晚期胚胎發(fā)生基因(LEA)，例如來自大麥(W0 97/13843)、鈣依賴性蛋白激酶基因(W0 98/26045)、神經(jīng)鈣蛋白(W0 99/05902)、法尼基轉(zhuǎn)移酶(W0 99/06580, Pei 1998)、鐵蛋白(Deak 1999)、草酸氧化酶(W099/04013 ；Dunwell 1998)、DREBlA因子(脫水應(yīng)答元件B IA ；Kasugal999)、甘露醇或海藻糖合成基因如海藻糖磷酸合酶或海藻糖磷酸磷酸酯酶(W0 97/42326)或通過抑制基因如海藻糖基因(W0 97/50561)改善了對植物胚胎抗生物性脅迫如干旱、高溫或低溫的保護(hù)。特別優(yōu)選的核酸是編碼來自擬南芥菜的轉(zhuǎn)錄激活物CBFl (GenBank登錄號U77378)或多刺床杜父魚抗冰凍蛋白(GenBank登錄號AF306348)或其功能性等效物的那些核酸。為了在植物中表達(dá)，核酸分子必須與合適的啟動子有效地連接。本發(fā)明重組表達(dá)構(gòu)建體的植物特異性啟動子、調(diào)節(jié)性元件和終止子不需要是植物來源的，并且可以源自病毒或微生物，尤其例如來自侵襲植物細(xì)胞的病毒。本發(fā)明的又一個主題物是將本發(fā)明的內(nèi)含子序列經(jīng)同源重組(HR)導(dǎo)入靶核酸序列。作為重組表達(dá)構(gòu)建體與基因組靶核酸序列之間發(fā)生HR的前提，重組表達(dá)構(gòu)建體必須含有具有足夠長度和同源性的靶核酸序列的片段。在本發(fā)明優(yōu)選的實施方案中，將必須經(jīng)HR插入目的基因的內(nèi)含子序列放置在(重組表達(dá)構(gòu)建體內(nèi))與優(yōu)選插入位置的5'和3'區(qū)域完全相同的一對DNA序列之間。在此情況下，重組表達(dá)構(gòu)建體可以僅包含內(nèi)含子序列和為誘導(dǎo)HR事件所需要的核酸序列。在本發(fā)明優(yōu)選的實施方案中，側(cè)翼分布有靶DNA的核酸序列的內(nèi)含子序列含有能夠表達(dá)選擇標(biāo)記蛋白質(zhì)的表達(dá)盒，該表達(dá)盒允許選擇已在轉(zhuǎn)化后發(fā)生同源重組或無效重組的轉(zhuǎn)基因植物。驅(qū)動選擇標(biāo)記蛋白質(zhì)表達(dá)的表達(dá)盒可以在側(cè)翼分布有特異性核酸內(nèi)切酶或重組酶可識別的HR控制序列，以便于從基因組中去除此表達(dá)盒。此類所謂的標(biāo)記切除法例如cre/lox技術(shù)允許從宿主生物基因組中組織特異性地去除表達(dá)盒，其根據(jù)需要可是誘導(dǎo)性去除(Sauer B (1998)Methods. 14(4) :381_92)。在這種方法中，特異性側(cè)翼序列(Iox序列)與靶基因連接，其中特異性側(cè)翼序列允許稍后借助ere重組酶加以去除。
具體地，本發(fā)明涉及包含如下具有在植物中增強基因表達(dá)特性的內(nèi)含子的轉(zhuǎn)基因表達(dá)盒I)分離自稻金屬硫蛋白樣基因的第一內(nèi)含子序列(BPSI. 1，SEQ IDN01)(GeneBank登錄號AP002540，稻(日本栽培變種)基因組DNA，染色體1，PAC克隆P0434B04，基因標(biāo)識號=“P0434B04. 31”，蛋白質(zhì)標(biāo)識=“BAB44010. 1”，互補的連接序列142304.·142409、143021. · 143098、143683. · 143747 ；Hsieh, H. Μ.等，RNA expressionpatterns of a type 2metallothioneine_like gene from rice. Plant Mol. Biol. 32(3),525-529(1996))。該基因包含兩個內(nèi)含子和三個外顯子。稻金屬硫蛋白樣基因的第一內(nèi)含子(BPSI. I, SEQ ID NO 1)在側(cè)翼分布著5'剪接位點(5'-⑶-3'，SEQ ID NO 1中的堿基對(bp) 1-2)和3'剪接位點(5' -CAG-3'，SEQID NO: I中的堿基對582-584)。在本發(fā)明優(yōu)選的實施方案中，稻金屬硫蛋白樣基因的第一內(nèi)含子(BPSI. 1,SEQ ID NO 1)包含分別與內(nèi)含子(SEQ IDN0:82)的5'和3'剪接位點毗鄰的5'和3'序列的至少28個堿基對、更優(yōu)選地至少40個堿基對、最優(yōu)選地至少50個堿基對。在核苷酸水平，稻金屬硫蛋白樣基因與來自其它單子葉植物或雙子葉植物的正向同源基因的編碼區(qū)共有高的同源性或同一性，例如與玉米CL1155 3mRNA序列(登錄號AY109343)具有89%的同一性、與偏生早熟禾(Poa secunda)金屬硫蛋白樣蛋白質(zhì)2型mRNA (登錄號AF246982. I)具有88%的同一性、與普通小麥(Triticumaestivum)金屬硫蛋白mRNA部分編碼序列(登錄號AF470355. I)具有93%的同一性、與Nicotiana plumbaginifolia金屬硫蛋白樣蛋白mRNA(登錄號NPU35225)具有89%的同一性與甘藍(lán)栽培變種Green King金屬硫蛋白樣蛋白質(zhì)2 (登錄號AF200712)具有86%的同一1丨生,分別與栽培大麥(Hordeumvulgare subsp. vulgare)金屬硫蛋白2型mt2b(登錄號HVU511346)和mtb2a(登錄號HVU511345)基因的部分mRNA具有95%和88%的同一性(同一性使用BLASTN 2. 2. 9算法計算[2004年5月I日]Altschul，StephenF.等，(1997), Gapped BLAST and PSI-BLAST a new generation of proteindatabasesearch programs, Nucleic Acids Res. 25 :3389_3402)。2)分離自稻蔗糖UDP葡糖基轉(zhuǎn)移酶-2基因的第一內(nèi)含子序列(BPSI. 2，SEQID NO 2) (GeneBank登錄號AC084380，稻(日本栽培變種)基因組DNA，染色體3，BAC0SJNBa0090P23,基因標(biāo)識號=“0SJNBa0090P23. 15”，蛋白質(zhì)標(biāo)識號=AAK5219. 1，互補結(jié)合(核苷酸 62884 至 65255,65350. · 65594,65693. · 66011,66098. · 66322,66427. · 66593、66677..66793,66881..67054,67136..67231,67316..67532,67652..67770、67896. · 68088,68209. · 68360,68456. · 68585,69314. · 69453 和 70899. · 72082)。該基因包含13個內(nèi)含子和14個外顯子。稻蔗糖UDP葡糖基轉(zhuǎn)移酶_2基因的第一內(nèi)含子(BPSI. 2，SEQ ID NO 2)的側(cè)翼分布著5'剪接位點(5' -GU-3'，在SEQ ID NO :2中的bpl_2)和3'剪接位點(5' -CAG-3'，在SEQ ID NO :2中的bp726_728)。在本發(fā)明優(yōu)選的實施方案中，稻蔗糖Μ)Ρ葡糖基轉(zhuǎn)移酶-2基因的第一內(nèi)含子(SEQ ID NO :2)包含內(nèi)含子(SEQ IDNO83)5/ -剪接位點的5'序列的至少19個堿基對和內(nèi)含子(SEQ ID NO :83) 3'-剪接位點的3'序列/外顯子的23個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 2包含分別與內(nèi)含子5'和3'剪接位點毗鄰的5'和3'序列的至少40個堿基對、更優(yōu)選地是至少50個堿基對。3)分離自稻蔗糖UDP葡糖基轉(zhuǎn)移酶_2基因的第二內(nèi)含子序列(BPSI. 3，SEQ ID NO 3) ο所述的第二內(nèi)含子在側(cè)翼分布著5' -GU-3'，在SEQ ID NO :3中的bpl_2)和3' (5' -CAG-3'，在 SEQ ID NO :3 中的 bp93-953)剪接位點。在本發(fā)明優(yōu)選的實施方案中，稻蔗糖UDP葡糖基轉(zhuǎn)移酶-2基因的第二內(nèi)含子(SEQID NO: 3)包含內(nèi)含子(SEQ ID N0:84)5'-剪接位點的5'序列的至少25個堿基對和內(nèi)含子(SEQ ID N0:84)3'-剪接位點的3'序列的30個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 3包含分別與內(nèi)含子5'和3'剪接位點毗鄰的5'和3'序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。在核苷酸水平，稻蔗糖Μ)Ρ葡糖基轉(zhuǎn)移酶_2基因與來自其它單子葉植物或雙子葉植物的正向同源基因的編碼區(qū)共有高的同源性或同一性，例如與玉米蔗糖合成酶(SusI)mRNA(登錄號L22296. I)具有88%同一性、與普通小麥蔗糖合成酶2型的mRNA(登錄號AJ000153)具有85 %的同一性，與大麥(H. vulgare)蔗糖合成酶的mRNA (登錄號X69931)具有85%同一性、與甘蔗的蔗糖合成酶-2的mRNA (登錄號AF263384. I)具有80%同一性、與稻蔗糖合成酶(S464基因)的mRNA部分序列(登錄號D10418)具有95%同一性、與大豆蔗糖合成酶1^應(yīng)(登錄號4 03231)具有79%同一性。同一性已經(jīng)使用 BLASTN 2. 2. 9 算法計算[2004 年 5 月 I H ]Altschul, StephenF.等，(1997)，Gapped BLAST and PSI-BLAST a new generation of protein databasesearch programs,Nucleic Acids Res. 25 :3389_3402)。4)分離自編碼蔗糖轉(zhuǎn)運蛋白的稻基因(GeneBank登錄號AF280050)的第八內(nèi)含子序列(BPSI.5，SEQ ID NO :5)。此第八內(nèi)含子(SEQ ID NO 5)的側(cè)翼分布著5'剪接位點(5' -GU-3 '，在 SEQ ID NO :中的 bpl_2)和 3 '剪接位點(5' -CAG-3 '，在 SEQ IDN05中的bp223-225)。在本發(fā)明優(yōu)選的實施方案中，編碼蔗糖轉(zhuǎn)運蛋白的稻基因的第八內(nèi)含子(SEQ ID NO 5)包含內(nèi)含子(SEQID NO 86)5/ -剪接位點的5'序列的至少35個堿基對和內(nèi)含子(SEQ IDNO :86) 3'-剪接位點的3'序列的30個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 5包含分別與內(nèi)含子的5'和3'剪接位點毗鄰的5'和3'序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。在更優(yōu)選的實施方案中，第八內(nèi)含子(BPSI. 5, SEQ ID NO 5)的5'和3'剪接位點使用PCR誘變法進(jìn)行修飾(SEQID NO 87)以便匹配對于5'剪接位點是5' -AG: :GTAAGT-3' (SEQ ID N0:80)和對于3'剪接位點是5' -CAG: IGT-Si (SEQ ID NO 81)的植物共有序列。5)分離自稻基因(GeneBank登錄號BAA94221)的第四內(nèi)含子序列(BPSI. 6，SEQID NO :6)，其中所述的稻基因編碼與來自克隆T22013、F12K2的編碼推定性脂酶的擬南芥菜染色體II序列(AC006233)具有同源性的未知蛋白質(zhì)。此第四內(nèi)含子(SEQ ID NO 6)的側(cè)翼分布著5'剪接位點(5' -GU-3'，在SEQ ID NO :6中的bpl_2)和3'剪接位點(5' -CAG-3'，在SEQ IDNO :6中的bp768_770)點。在本發(fā)明優(yōu)選的實施方案中，稻基因(登錄號BAA94221)的第四內(nèi)含子(SEQ ID NO 6)包含內(nèi)含子(SEQ ID NO 88)5/ -剪接位點的5'序列的至少34個堿基對和內(nèi)含子(SEQ ID NO 88) 3'-剪接位點的3'序列的34個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 6包含分別與內(nèi)含子的5'和3'剪接位點毗鄰的5'和3'序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。在更優(yōu)選的實施方案中，第四內(nèi)含子(BPSI.6，SEQ IDNO :6)的5'和3'剪接位點使用PCR誘變方法進(jìn)行修飾(SEQ ID NO 89)以便匹配對于5'剪接位點是5' -AG: : GTAAGT-3' (SEQ ID NO: 80)和對于3,剪接位點是5' -CAG::GT-3' (SEQ ID NO 81)的植物共有序列。6)分離自編碼推定的肉桂醇脫氫酶的稻基因(登錄號BAB90130)的第四內(nèi)含子序列(BPSI.7，SEQ ID NO :7)。此第四內(nèi)含子(SEQ ID NO 7)的側(cè)翼分布著5'剪接位點(5' -GU-3'，在 SEQ ID NO :7 中的 bpl-27)和 3'剪接位點(5' -CAG-3'，在 SEQ IDN0:7中的713-715bp)。在本發(fā)明優(yōu)選的實施方案中，稻基因(登錄號BAB90130)的第四內(nèi)含子(SEQ ID NO 7)包含內(nèi)含子(SEQID NO 90)5/ -剪接位點的5'序列的至少34個堿基對和內(nèi)含子(SEQ IDNO 90) 3'-剪接位點的3'序列的26個堿基對)。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 7包含分別與內(nèi)含子的5'和3'剪接位點毗鄰的5'和3'序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。在更優(yōu)選的實施方案，第四內(nèi)含子(BPSI. 7, SEQ ID NO 7)的5'和3'剪接位點使用PCR誘變方法進(jìn)行修飾(SEQID NO 91)以便匹配對于5'剪接位點是5' -AG: :GTAAGT-3' (SEQ ID N0:80)和對于3'剪接位點是5' -CAG^GTI' (SEQ ID NO 81)的植物共有序列。7)分離自編碼推定的蛋白激酶的稻基因(登錄號AP003300)的第三內(nèi)含子序列(BPSI. 10，SEQ ID N0:10)。此第三內(nèi)含子(SEQ ID NO 10)的側(cè)翼分布著5'剪接位點(5' -GU-3'，在 SEQ ID NO : 10 中的 bpl_2)和 3'剪接位點(5' -CAG-3'，在 SEQ ID NO:10中的536-538bp)。在本發(fā)明優(yōu)選的實施方案中，稻基因(登錄號AP003300)的第三內(nèi)含子(SEQ ID NO 10)包含內(nèi)含子(SEQ ID NO :94)5'-剪接位點的5'序列的至少31個堿基對和內(nèi)含子(SEQ IDNO :94) 3'-剪接位點的3'序列的31個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 10包含分別與內(nèi)含子的5'和3'剪接位點毗鄰的5'和3'序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。在更優(yōu)選的實施方案中，第三內(nèi)含子(BPSI. 10，SEQ ID NO :10)的Y和:V剪接位點使用PCR誘變方法進(jìn)行修飾(SEQ ID NO 95)以便匹配對于5'剪接位點是5' -AG: :GTAAGT-3' (SEQID NO :80)和對于3'剪接位點是5' -CAG::GT-3' (SEQ ID NO :81)的植物共有序列。8)分離自編碼MADS3盒蛋白的稻基因(登錄號L37528)的第一內(nèi)含子序列(BPSI.11, SEQ ID N0:11)。此第一內(nèi)含子(SEQ ID N011)的側(cè)翼分布著5'剪接位點(5' -GU-3'，在 SEQ ID NO :11 中的 bpl-2)和 3'剪接位點(5' -CAG-3'，在 SEQ ID NO 11中的bp329-331)。在本發(fā)明優(yōu)選的實施方案中，稻基因(登錄號L37528)的第一內(nèi)含子(SEQ ID NO 11)包含內(nèi)含子(SEQID NO 96)5/ -剪接位點的5'序列的至少35個堿基對和內(nèi)含子(SEQ IDNO 96)3/ -剪接位點的3'序列的34個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 11包含分別與內(nèi)含子的5'和3'剪接位點毗鄰的5'和3'序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。在更優(yōu)選的實施方案，第一內(nèi)含子(BPSI. 11，SEQ ID N011)的5'和3'剪接位點使用PCR誘變方法進(jìn)行修飾(SEQ ID NO 97)以便匹配對于5'剪接位點是5' -AG: :GTAAGT-3' (SEQ IDNO :80)和對于Y剪接位點是5' -CAG^GTI' (SEQ ID NO 81)的植物共有序列。9)分離自編碼推定的腺苷甲硫氨酸脫羧酶的稻基因(登錄號CB625805)的第一內(nèi)含子序列(BPSI. 12，SEQ ID N0:12)。此第一內(nèi)含子(SEQ IDNO 12)的側(cè)翼分布著5'剪接位點(5' -GU-3'，在SEQ ID NO : 12中的bpl_2)和3'剪接位點(5' -CAG-3'，在SEQ ID N0:12中的bp959-961)。在本發(fā)明優(yōu)選的實施方案中，稻基因(登錄號CB625805) 的第一內(nèi)含子(SEQ ID NO 12)包含內(nèi)含子(SEQ ID NO 98)5/ -剪接位點的5'序列的至少26個堿基對和內(nèi)含子(SEQ ID NO 98)3/ -剪接位點的3'序列的26個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 12包含分別與內(nèi)含子的5'和3'剪接位點毗鄰的5'和3'序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。10)分離自編碼天冬氨酸蛋白酶的稻基因(登錄號CF297669)的第一內(nèi)含子序列(BPSI. 13, SEQ ID NO 13)0此第一內(nèi)含子(SEQ ID NO 13)的側(cè)翼分布著5'剪接位點(5' -GU-3'，在 SEQ ID NO : 13 中的 bpl_2)和 3'剪接位點(5' -CAG-3'，在 SEQ ID NO:13中的bp593-595)。在本發(fā)明優(yōu)選的實施方案中，稻基因(登錄號CF297669)的第一內(nèi)含子(SEQ ID NO 13)包含內(nèi)含子(SEQ ID NO -.99)5'-剪接位點的5'序列的至少26個堿基對和內(nèi)含子(SEQ IDNO :99) 3'-剪接位點的3'序列的24個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 13包含分別與內(nèi)含子的5'和3'剪接位點毗鄰的5'和3'序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。11)分離自編碼Lec 14b蛋白質(zhì)的稻基因(登錄號CB674940)的第一內(nèi)含子序列(BPSI. 14，SEQ ID N0:14)。此第一內(nèi)含子(SEQ ID NO 14)的側(cè)翼分布著5'剪接位點(5' -GU-3'，在 SEQ ID NO :14 中的 bpl_2)和 3'剪接位點(5' -CAG-3'，在 SEQ ID NO:14中的bpl43-145)。在本發(fā)明優(yōu)選的實施方案中，稻基因(登錄號CB674940)的第一內(nèi)含子(SEQ ID NO 14)包含內(nèi)含子(SEQ ID NO 100)5/ -剪接位點的5'序列的至少26個堿基對和內(nèi)含子(SEQID N0:100)3'-剪接位點的3'序列的25個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 14包含分別與內(nèi)含子的5'和3'剪接位點毗鄰的5'和3'序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。12)分離自編碼推定的SalT蛋白質(zhì)前體的稻基因(登錄號BAD37295. I)的5' UTR的第一內(nèi)含子序列(BPSI. 15，SEQ ID NO : 15)。此第一內(nèi)含子(SEQID NO 15)的側(cè)翼分布著5'剪接位點(5' -GU-3'，在SEQ ID NO :15 中的bpl_2)和 3'剪接位點(5' -CAG-3'，在SEQ ID N0:15中的bp312-314)。在本發(fā)明優(yōu)選的實施方案中，稻基因(登錄號BAD37295. I)的第一內(nèi)含子(SEQ IDNO 15)包含內(nèi)含子(SEQ ID NO :101)5'-剪接位點的5'序列的至少26個堿基對和內(nèi)含子(SEQ ID NO : 101) 3'-剪接位點的3'序列的25個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 15包含分別與內(nèi)含子的5'和3'剪接位點毗鄰的5'和3'序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。13)分離自編碼推定的reticulon的稻基因(登錄號BX928664)的第一內(nèi)含子序列(BPSI. 16, SEQ ID NO 16)0此第一內(nèi)含子(SEQ ID NO 16)的側(cè)翼分布著5'剪接位點(5' -GU-3'，在 SEQ ID NO : 16 中的 bpl_2)和 3'剪接位點(5' -CAG-3'，在 SEQ ID NO:16中的bp650-652)。在本發(fā)明優(yōu)選的實施方案中，稻基因(登錄號BX928664)的第一內(nèi)含子(SEQ ID NO 16)包含內(nèi)含子(SEQ ID NO 102)5/ -剪接位點的5'序列的至少26個堿基對和內(nèi)含子(SEQID N0:102)3'-剪接位點的3'序列的23個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 16包含分別與內(nèi)含子的5'和3'剪接位點毗鄰的5'和3'序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。14)分離自編碼葡糖酸氧化酶的稻基因(登錄號AA752970)的第一內(nèi)含子序列(BPSI. 17, SEQ ID N0:17)。此第一內(nèi)含子(SEQ ID NO 17)的側(cè)翼分布著5'剪接位點(5' -GU-3'，在 SEQ ID NO :17 中的 bpl_2)和 3'剪接位點(5' -CAG-3'，在 SEQ ID NO:17中的bp266-268)。在本發(fā)明優(yōu)選的實施方案中，稻基因(登錄號AA752970)的第一內(nèi)含子(SEQ ID NO 17)包含內(nèi)含子(SEQ ID NO 103)5/ -剪接位點的5'序列的至少26個堿基對和內(nèi)含子(SEQID N0:103)3'-剪接位點的3'序列的35個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 17包含分別與內(nèi)含子的5'和3'剪接位點毗鄰的5'和3'序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。15)分離自與AT4g33690相似的稻克隆GI40253643 (登錄號AK064428)的第一內(nèi)含子序列(BPSI. 18，SEQ ID N0:18)。此第一內(nèi)含子(SEQ IDNO : 18)的側(cè)翼分布著Y剪接位點(5' -GU-3'，在 SEQ ID N0:18 中的 bpl-2)和 3'剪接位點(5' -CAG-3'，在 SEQID NO :18中的bp544-546)。在本發(fā)明優(yōu)選的實施方案中，稻基因(登錄號AK064428)的第一內(nèi)含子(SEQ ID NO 18)包含內(nèi)含子(SEQ ID N0:104)5'-剪接位點的5'序列的至少26個堿基對和內(nèi)含子(SEQ ID NO :104)3'-剪接位點的3'序列的21個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 18包含分別與內(nèi)含子的5'和3'剪接位點毗鄰的5'和
序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。16)分離自稻克隆GI51091887(登錄號AK062197))的第一內(nèi)含子序列(BPSI. 19，SEQ ID N0:19)。此第一內(nèi)含子(SEQ ID NO 19)的側(cè)翼分布著5'剪接位點(5' -GU-3'，在 SEQ ID NO :19 中的 bpl-2)和 3 '剪接位點(5' -CAG-3 '，在 SEQ ID N0:19 中的bp810-812)。在本發(fā)明優(yōu)選的實施方案中，稻基因(登錄號AK062197)的第一內(nèi)含子(SEQID NO: 19)包含內(nèi)含子(SEQ ID NO 105)5/ -剪接位點的5'序列的至少26個堿基對和內(nèi)含子(SEQID N0:105)3'-剪接位點的3'序列的26個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 19包含分別與內(nèi)含子的5'和3'剪接位點毗鄰的5'和3'序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。17)分離自編碼假設(shè)的蛋白質(zhì)克隆(GI33657147)的稻基因(登錄號CF279761)的第一內(nèi)含子序列(BPSI.20，SEQ ID NO :20)。此第一內(nèi)含子(SEQ ID NO 20)的側(cè)翼分布著5'剪接位點(5' -GU-3'，在 SEQ ID NO :20 中的 bpl_2)和 3'剪接位點(5' -CAG-3'，在SEQ ID NO :20中的bp369-371)剪接位點。在本發(fā)明優(yōu)選的實施方案中，稻基因(登錄號CF279761)的第一內(nèi)含子(SEQ ID NO 20)包含內(nèi)含子(SEQ ID NO 106)5/ -剪接位點的5'序列的至少26個堿基對和內(nèi)含子(SEQ ID NO 106)3/ -剪接位點的3'序列的27個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 20包含分別與內(nèi)含子的5'和3'剪接位點毗鄰的5'和3'序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。18)分離自編碼推定的膜轉(zhuǎn)運蛋白的稻基因(登錄號CF326058)的第一內(nèi)含子序列(BPSI.21,SEQ ID NO :21)。此第一內(nèi)含子(SEQ ID NO 21)的側(cè)翼分布著5'剪接位點(5' -GU-3'，在 SEQ ID NO :21 中的 bpl_2)和 3'剪接位點(5' -CAG-3'，在 SEQ ID NO:21中的bp720-722)。在本發(fā)明優(yōu)選的實施方案中，稻基因(登錄號CF326058)的第一內(nèi)含子(SEQ ID NO 21)包含內(nèi)含子(SEQ ID NO 107)5/ -剪接位點的5'序列的至少26個堿基對和內(nèi)含子(SEQID N0:107)3'-剪接位點的3'序列的25個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 21包含分別與內(nèi)含子的5'和3'剪接位點毗鄰的5'和3'序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。19)分離自編碼推定的ACT結(jié)構(gòu)域重復(fù)蛋白的稻基因(登錄號C26044)的第一內(nèi)含子序列(BPSI.22，SEQ ID NO :22)。此第一內(nèi)含子(SEQ IDNO 22)的側(cè)翼分布著5'剪接位點(5' -GU-3'，在 SEQ ID N0:22 中的 bpl-2)和 3'剪接位點(5' -CAG-3'，在 SEQID NO :22中的bp386-388)。在本發(fā)明優(yōu)選的實施方案中，稻基因(登錄號C26044)的第一內(nèi)含子(SEQ ID NO 22)包含內(nèi)含子(SEQ ID NO 108)5/ -剪接位點的5'序列的至少26個堿基對和內(nèi)含子(SEQ ID NO 108) 3'-剪接位點的3'序列的28個堿基對。在特別優(yōu)選的實施方案中，內(nèi)含子BPSI. 22包含分別與內(nèi)含子的5'和3'剪接位點毗鄰的5'和
序列的至少40個堿基對、更優(yōu)選地至少50個堿基對。表I :從中優(yōu)選地分離本發(fā)明內(nèi)含子的基因，該基因推定的功能、由該基因編碼的cDNA和蛋白質(zhì)
權(quán)利要求
1.重組DNA表達(dá)構(gòu)建體，包含a)至少一個在植物或植物細(xì)胞中有功能的啟動子序列，和b)選自SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21 和 22 所描述序列的至少一個內(nèi)含子及其功能性等效物，和c)至少一個核酸序列，其中至少一個所述的啟動子序列和至少一個所述的內(nèi)含子序列功能性地連接于至少一個所述的核酸序列，并且其中所述的內(nèi)含子對所述的核酸序列和/或?qū)λ龅膯幼有蛄惺钱愒吹摹?br> 2.權(quán)利要求I所述的重組DNA表達(dá)構(gòu)建體，其中所述其功能性等效物包含內(nèi)含子的功能性元件并且由如下序列表征，其中所述序列1.具有SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21 或 22 中任意一個所描述內(nèi)含子序列的至少50個連續(xù)堿基對，或2.與由SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、20、21 或 22 中任意一個所描述序列的跨越至少95個連續(xù)核酸堿基對的序列具有至少80%同一性，或3.在高度嚴(yán)格條件下與SEQ ID NO :1、2、3、5、6、7、10、11、12、13、14、15、16、17、18、19、 20,21或22中任意一個所描述核酸分子中至少50個連續(xù)堿基對的核酸片段雜交。
3.權(quán)利要求I至2所述的重組DNA表達(dá)構(gòu)建體，還包含與所述啟動子功能性連接的一種或多種額外的調(diào)節(jié)序列。
4.權(quán)利要求3所述的重組DNA表達(dá)構(gòu)建體，其中調(diào)節(jié)序列選自熱休克應(yīng)答元件、厭氧應(yīng)答元件、病原體應(yīng)答元件、干旱應(yīng)答元件、低溫應(yīng)答元件、ABA應(yīng)答元件、5'-非翻譯基因區(qū)、3'-非翻譯基因區(qū)、轉(zhuǎn)錄終止子、多腺苷酸化信號和增強子。
5.權(quán)利要求I至4中任意一項所述的重組DNA表達(dá)構(gòu)建體，其中所述的核酸編碼i)蛋白質(zhì)或ii)有義RNA、反義RNA或雙鏈RNA序列。
6.權(quán)利要求I至5中任意一項所述的重組DNA表達(dá)構(gòu)建體，其中所述的核酸序列編碼選擇標(biāo)記蛋白質(zhì)、篩選標(biāo)記蛋白質(zhì)、合成活性蛋白質(zhì)、分解活性蛋白質(zhì)、抗生物脅迫蛋白質(zhì)或抗非生物脅迫蛋白質(zhì)、雄性不育蛋白質(zhì)或影響植物農(nóng)學(xué)特征的蛋白質(zhì)。
7.權(quán)利要求I至6中任意一項所述的重組DNA表達(dá)構(gòu)建體，其中在植物或植物細(xì)胞中有功能的所述啟動子序列選自a)如SEQID NO 113中核苷酸I至854所述的稻葉綠體蛋白12啟動子，或與所述片段具有至少60%同一性的序列，或在嚴(yán)格條件下與所述片段雜交的序列，或包含所述片段中至少50個連續(xù)核苷酸的序列，和b)如SEQID NO :114中核苷酸I至1184所述的玉米羥脯氨酸豐富糖蛋白啟動子，或與所述片段具有至少60%同一性的序列，或在嚴(yán)格條件下與所述片段雜交的序列，或包含所述片段中至少50個連續(xù)核苷酸的序列，和c)如SEQID NO : 115中核苷酸I至1034所述的p-咖啡酰輔酶A 3-0-甲基轉(zhuǎn)移酶啟動子，或與所述片段具有至少60%同一性的序列，或在嚴(yán)格條件下與所述片段雜交的序列，或包含所述片段中至少50個連續(xù)核苷酸的序列，和d)如SEQID NO :116中核苷酸I至1440所述的玉米球蛋白-UZmGlbl]啟動子(W64A)，或與所述片段具有至少60%同一性的序列，或在嚴(yán)格條件下與所述片段雜交的序列，或包含所述片段中至少50個連續(xù)核苷酸的序列，和e)如SEQID NO :117中核苷酸I至1589所述的推定的稻H+轉(zhuǎn)運ATP合酶啟動子，或與所述片段具有至少60%同一性的序列，或在嚴(yán)格條件下與所述片段雜交的序列，或包含所述片段中至少50個連續(xù)核苷酸的序列，和f)如SEQID NO 118中核苷酸I至796所述的推定的稻C-8，7固醇異構(gòu)酶啟動子，或與所述片段具有至少60%同一性的序列，或在嚴(yán)格條件下與所述片段雜交的序列，或包含所述片段中至少50個連續(xù)核苷酸的序列，和g)如SEQID NO 119中核苷酸I至1062所述的玉米乳酸脫氫酶啟動子，或與所述片段具有至少60%同一性的序列，或在嚴(yán)格條件下與所述片段雜交的序列，或包含所述片段中至少50個連續(xù)核苷酸的序列，和h)如SEQID NO 121中核苷酸I至1386所述的稻Lea啟動子，或與所述片段具有至少60%同一性的序列，或在嚴(yán)格條件下與所述片段雜交的序列，或包含所述片段中至少50 個連續(xù)核苷酸的序列。
8.權(quán)利要求I至7中任意一項所述的重組DNA表達(dá)構(gòu)建體，其中所述表達(dá)構(gòu)建體包含權(quán)利要求7的啟動子與選自如下的內(nèi)含子的組合i)如SEQID NO :113中核苷酸888至1470所述的BPSI. I內(nèi)含子，或與所述片段具有至少60%同一性的序列，或在嚴(yán)格條件下與所述片段雜交的序列，或包含所述片段中至少 50個連續(xù)核苷酸的序列；和ii)如SEQ ID NO: 120中核苷酸1068至1318所述的BPSI. 5內(nèi)含子，或與所述片段具有至少60%同一性的序列，或在嚴(yán)格條件下與所述片段雜交的序列，或包含所述片段中至少50個連續(xù)核苷酸的序列。
9.權(quán)利要求I至8中任意一項所述的重組DNA表達(dá)構(gòu)建體，其中所述的表達(dá)構(gòu)建體包含選自如下的啟動子與內(nèi)含子的組合i)如SEQ ID NO :113、114、115、116、117、118、119、120 或 121 中任意一個所描述的序列，和ii)具有SEQ ID NO :113、114、115、116、117、118、119、120 或 121 中任意一個所描述序列中至少50個連續(xù)核苷酸的序列，和iii)與SEQ ID NO :113、114、115、116、117、118、119、120 或 121 中任意一個所描述序列具有至少60 %同一性的序列,和iv)與SEQ ID NO :113、114、115、116、117、118、119、120 或 121 中任意一個所描述序列在嚴(yán)格條件下雜交的序列。
10.表達(dá)載體，包含權(quán)利要求I至9中任意一項所述的重組表達(dá)構(gòu)建體。
11.轉(zhuǎn)基因細(xì)胞或轉(zhuǎn)基因非人生物，包含如權(quán)利要求10的表達(dá)載體或權(quán)利要求I至9 中任意一項所述的表達(dá)構(gòu)建體。
12.權(quán)利要求11所述的細(xì)胞或非人生物，選自細(xì)菌、真菌、酵母和植物。
13.權(quán)利要求11或12所述的轉(zhuǎn)基因細(xì)胞或非人生物，其中所述的細(xì)胞或生物是選自大麥屬(Hordeum)、燕麥屬(Avena)、黑麥屬(Secale)、小麥屬(Triticum)、高粱屬(Sorghum)、玉蜀黍?qū)?Zea)、甘鹿屬(Saccharum)和稻屬(Oryza)的單子葉植物細(xì)胞或生物。
14.衍生自權(quán)利要求11至13所述轉(zhuǎn)基因細(xì)胞生物的細(xì)胞培養(yǎng)物、部分或繁殖材料。
15.提供用于增強核酸序列在植物或植物細(xì)胞中表達(dá)的表達(dá)盒的方法，包括將如權(quán)利要求I至2中所述的至少一個內(nèi)含子功能性地連接于所述核酸序列的步驟。
16.用于增強核酸序列在植物或植物細(xì)胞中表達(dá)的方法，包括將如權(quán)利要求I至2中所述的至少一個內(nèi)含子功能性地連接于所述核酸序列。
17.如權(quán)利要求15至16所述的方法，其中在植物中有功能的啟動子序列還與所述的核酸序列連接。
18.如權(quán)利要求15至16所述的方法，其中內(nèi)含子經(jīng)同源重組插入植物基因組DNA內(nèi)而與所述核酸序列連接。
19.權(quán)利要求15至18中任意一項所述的方法，其中所述的植物或植物細(xì)胞是單子葉植物或植物細(xì)胞。
20.權(quán)利要求15至19所述的方法，其中所述的核酸編碼如權(quán)利要求6中所述的蛋白質(zhì)或有義RNA、反義RNA或雙鏈RNA。
21.如權(quán)利要求11至13所述的轉(zhuǎn)基因生物或從其中衍生的如權(quán)利要求14所述的細(xì)胞培養(yǎng)物、部分或轉(zhuǎn)基因繁殖材料的用途，用于產(chǎn)生食品、動物飼料、種子、藥物或精細(xì)化學(xué)品O
全文摘要
本發(fā)明涉及增強表達(dá)的內(nèi)含子序列，用于鑒定并使用具有增強基因表達(dá)特性的內(nèi)含子的方法。根據(jù)本發(fā)明教導(dǎo)能夠鑒定引起內(nèi)含子介導(dǎo)性基因表達(dá)增強(IME)的內(nèi)含子。本發(fā)明還涉及包含與啟動子序列和核酸序列有效連接的所述IME內(nèi)含子的重組表達(dá)構(gòu)建體和重組表達(dá)載體。本發(fā)明還涉及用這些重組表達(dá)構(gòu)建體或載體所轉(zhuǎn)化的轉(zhuǎn)基因植物或轉(zhuǎn)基因植物細(xì)胞，涉及從其衍生的培養(yǎng)物、部分或繁殖材料，并涉及它們用于制備食品、動物飼料、種子、藥物或精細(xì)化學(xué)品的用途，涉及改善植物生物量，產(chǎn)量或提供需要的表型。
文檔編號C12N1/21GK102925479SQ20121040555
公開日2013年2月13日申請日期2006年3月7日優(yōu)先權(quán)日2005年3月8日
發(fā)明者H-S·宋, C·達(dá)曼, M·莫拉, J·A·布朗, L·邢, H·賈申請人:巴斯福植物科學(xué)有限公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：H-S·宋;C·達(dá)曼;M·莫拉;J·A·布朗;L·邢;H·賈
技術(shù)所有人：巴斯福植物科學(xué)有限公司
我是此專利的發(fā)明人

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點此查看客服電話進(jìn)行咨詢。
1、李老師：1.食品功能因子基因工程菌種的構(gòu)建、智能高通量進(jìn)化篩選 2.發(fā)酵工藝優(yōu)化
2、馬老師：1.酶工程與生物催化 2.釀造技術(shù)與風(fēng)味分析 3.生物質(zhì)資源綜合利用
3、林老師：1.釀造微生物育種及關(guān)鍵釀造工藝開發(fā) 2. 真菌基因功能及調(diào)控網(wǎng)絡(luò)解析 3.精細(xì)化學(xué)品、蛋白真菌細(xì)胞底盤開發(fā)
4、張老師：1.發(fā)酵食品安全：危害物相關(guān)基因的篩選，危害物產(chǎn)生菌的快速檢測，危害物的預(yù)警和發(fā)酵過程控制 2.真菌次級代謝與調(diào)控 3.釀造酒相關(guān)研究
5、郭老師：1.現(xiàn)代釀造技術(shù)與食品安全 2. 酵母生物學(xué) 3.生物基化學(xué)品與合成生物學(xué)
如您是高校老師，可以點此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

內(nèi)含子序列相關(guān)技術(shù)

增強子序列相關(guān)技術(shù)

增強子序列特征相關(guān)技術(shù)

麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

增強表達(dá)的內(nèi)含子序列的制作方法