本發(fā)明涉及基因工程領(lǐng)域,具體涉及一種可以增大電子傳遞的融合蛋白與其應(yīng)用。
背景技術(shù):
由于化石燃料日益枯竭并且燃燒后造成環(huán)境污染,所以尋找清潔能源是解決問題的關(guān)鍵。氫能是所有的能源中能量密度最大的能量源,且燃燒后形成水,不會(huì)污染環(huán)境。特別是在當(dāng)今環(huán)境問題已經(jīng)嚴(yán)重影響人們的生活情況下,發(fā)展可再生和環(huán)境友好性能源是解決經(jīng)濟(jì)發(fā)展瓶頸的關(guān)鍵要素之一。在生產(chǎn)氫的過程中,利用生物產(chǎn)氫是不占用耕地、不消耗糧食,藻類生物利用無機(jī)物合成有機(jī)物并可以生產(chǎn)氫氣,被認(rèn)為是最具吸引力的獲得氫氣的方式之一。但是,其中需要解決的關(guān)鍵問題是有效提高藻類產(chǎn)H2量。其中,魚腥藻7120(Anabaena sp.PCC 7120)是絲狀藍(lán)藻,是廣泛用于光合作用與產(chǎn)H2的重要模式藻種。因此,研究魚腥藻7120產(chǎn)氫過程中的相關(guān)問題,能夠更好的獲得更多的H2,也為其他生物的產(chǎn)氫提高提供理論基礎(chǔ)。
近年來,人們將基因工程在藻類中應(yīng)用來提高H2量,在此過程中基因元件是重要的基礎(chǔ)。開發(fā)具有能夠提高藻類產(chǎn)H2能力的新蛋白,不僅可以為工程藻株的設(shè)計(jì)提供可利用的基因元件,也可以對(duì)發(fā)展提高藻類產(chǎn)H2的新方法提供依據(jù),并對(duì)促進(jìn)藻類能源資源的可持續(xù)發(fā)展有重要價(jià)值。
固氮酶將氫質(zhì)子和電子生成H2,但是由于固氮酶是以復(fù)合體形式存在,調(diào)控其酶的表達(dá)量是很難做到的,所以產(chǎn)氫階段如何改變細(xì)胞中電子的流向,使之更多的流向固氮酶獲得更高的H2產(chǎn)量是藻類產(chǎn)氫研究的重中之重,目前大量研究多集中在胞內(nèi)電子傳遞鏈阻斷和產(chǎn)氫環(huán)境的研究上(比如加入電子傳遞抑制劑、刪除非目的電子傳遞鏈上關(guān)鍵基因或利用缺硫培養(yǎng)環(huán)境等等)。但是,產(chǎn)氫過程中的關(guān)鍵酶是固氮酶,本發(fā)明擬對(duì)固氮酶及其所涉及的電子傳遞路徑做相關(guān)修飾以便提高H2的產(chǎn)量。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明發(fā)現(xiàn)將魚腥藻7120的Fd蛋白與nifH蛋白連接形成融合蛋白(FNET1蛋白),能夠顯著生產(chǎn)更多的H2。不囿于任何理論的,發(fā)明人推測(cè)FNET1蛋白可以做為電子傳遞的元件在細(xì)胞中行使功能,傳遞電子至固氮酶反應(yīng)中心,能夠與固氮酶其余亞基形成新的復(fù)合體, 消耗電子和質(zhì)子生成氫氣,所以FNET1蛋白能夠在具有固氮酶的宿主中傳遞電子后生成H2的作用。
本發(fā)明的目的是提供一種增大電子傳遞的融合蛋白及其應(yīng)用。
本發(fā)明所涉及的蛋白命名為FNET1,其氨基酸序列為SEQ ID No:2所示,含有鐵硫簇。此蛋白可人工合成,也可先合成其編碼基因再進(jìn)行生物表達(dá)得到。因此,編碼所述蛋白的核酸分子也屬于本發(fā)明的保護(hù)范圍。
所述核酸分子可以是DNA,如cDNA、基因組DNA或重組DNA;所述核酸分子也可以是RNA、hnRNA或tRNA等。
在本發(fā)明的一個(gè)實(shí)施例中,所述核酸分子具體為核苷酸序列如SEQ ID No:1所示的DNA分子。
具體地,該DNA分子由1191個(gè)核苷酸組成,第1至1191位為ORF,編碼氨基酸如SEQ ID No:2所示的FNET1蛋白。
含有上述核酸分子的重組載體、表達(dá)盒、轉(zhuǎn)基因細(xì)胞系或重組菌也屬于本發(fā)明的保護(hù)范圍。
所述重組載體可為重組表達(dá)載體,也可為重組克隆載體。
所述重組表達(dá)載體可用現(xiàn)有的載體構(gòu)建。所述生物轉(zhuǎn)運(yùn)載體包括運(yùn)載質(zhì)粒,如pRL271、pRL277等或其它衍生載體(Javier et al.Role of a Microcin-C-like biosynthetic gene cluster in allelopathic interactions in marine Synechococcus,Proc.Natl.Acad.Sci.U.S.A.,2013;Jeff et al.Reduction of conjugal transfer efficiency by three restriction activities of Anabaena sp.strain PCC 7120,J.Bacteriol.,1997)。使用所述基因構(gòu)建重組載體時(shí),在其轉(zhuǎn)錄起始核苷酸前加上一種增強(qiáng)型、組成型、組織特異性或誘導(dǎo)性啟動(dòng)子,例如銅離子啟動(dòng)子PpetE,光誘導(dǎo)啟動(dòng)子PpsbAII等等。此外,使用本發(fā)明的基因構(gòu)建重組載體時(shí),啟動(dòng)子區(qū)域可以是ATG起始密碼子或鄰接區(qū)域起始密碼子等,但必需與編碼序列的閱讀框相同,以保證整個(gè)序列的正確翻譯。所述翻譯控制信號(hào)和起始密碼子的來源是廣泛的,可以是天然的,也可以是合成的。翻譯起始區(qū)域可以來自轉(zhuǎn)錄起始區(qū)域或結(jié)構(gòu)基因。為了便于對(duì)轉(zhuǎn)基因細(xì)胞或植物進(jìn)行鑒定及篩選,可對(duì)所用重組載體進(jìn)行加工,加入具有抗抗生素的基因等,以便獲得轉(zhuǎn)化株。
本發(fā)明中,所述重組載體中啟動(dòng)所述fnet1基因轉(zhuǎn)錄的啟動(dòng)子為銅離子誘導(dǎo)型啟動(dòng)子PpetE(在本文中有時(shí)也簡(jiǎn)寫為啟動(dòng)子P,例如在質(zhì)粒圖1中)。
更為具體的,所述構(gòu)建重組載體的起始載體是pRL271,最終的運(yùn)載質(zhì)粒是fnet1-pRL271。在本發(fā)明的一個(gè)實(shí)施例中,所述的重組克隆方法是SLIC。
所述表達(dá)盒有能夠啟動(dòng)所述fnet1基因表達(dá)的啟動(dòng)子,所述fnet1基因,以及轉(zhuǎn)錄終止序 列組成。
所述FNET1蛋白,或所述核酸分子fnet1,或所述重組載體、表達(dá)盒或重組菌任一的應(yīng)用也屬于本發(fā)明的保護(hù)范圍:
(a1)調(diào)控魚腥藻7120的產(chǎn)氫量;
(a2)電子傳遞鏈的重新構(gòu)建;
(a3)選育產(chǎn)氫量提高的魚腥藻7120種株。
在本發(fā)明中,所述調(diào)控魚腥藻7120的產(chǎn)氫量具體體現(xiàn)在:在所述魚腥藻7120體內(nèi),若fnet1轉(zhuǎn)錄表達(dá),則所述轉(zhuǎn)基因藻株的產(chǎn)氫量會(huì)被提高。
在上述獲得的陽性轉(zhuǎn)基因藻株中,將攜帶有fnet1基因(FNET1的編碼基因)的重組載體導(dǎo)入所述目的藻中,具體可為:通過三親結(jié)合轉(zhuǎn)化方法轉(zhuǎn)化魚腥藻7120(Anabaena sp.PCC 7120)細(xì)胞,從而獲得魚腥藻7120的FNET1過表達(dá)藻株。
本發(fā)明的另一個(gè)目的是提供一種電子傳遞鏈修改的方法。因?yàn)镕NET1蛋白含有鐵硫簇,為電子載體,可以傳遞電子。電子從光系統(tǒng)I被FNET1接收后直接傳遞至固氮酶反應(yīng)中心。
本發(fā)明所提供的修改電子傳遞鏈的方法,包括如下步驟:
a)將本發(fā)明所述的FNET1蛋白的編碼基因?qū)媵~腥藻7120中獲得到轉(zhuǎn)基因魚腥藻7120藻株,并將其置于適合所述編碼基因轉(zhuǎn)錄、表達(dá)的條件下;和
b)從步驟a)所得轉(zhuǎn)基因藻株中選出與野生型魚腥藻7120藻株相比產(chǎn)氫量提高的轉(zhuǎn)基因陽性藻株。
在此基礎(chǔ)上,可通過如下步驟驗(yàn)證轉(zhuǎn)基因藻株的產(chǎn)氫量是由于FNET1蛋白的作用所引起:
c)將步驟b)獲得的陽性轉(zhuǎn)基因魚腥藻7120藻株和野生型同時(shí)放置于缺銅培養(yǎng)基中培養(yǎng);和
d)當(dāng)所述藻株生長(zhǎng)至對(duì)數(shù)期,光厭氧條件下測(cè)定H2產(chǎn)量。
如野生型與轉(zhuǎn)基因藻株的產(chǎn)氫量相當(dāng),則證明轉(zhuǎn)基因藻株的產(chǎn)氫量是由于FNET1蛋白的作用所引起的。
上述獲得的陽性轉(zhuǎn)基因藻株中,其細(xì)胞內(nèi)的電子傳遞鏈?zhǔn)潜恍薷牡?,F(xiàn)NET1可以接受PSI的電子直接傳遞到反應(yīng)中心生成H2。
所述FNET1蛋白的編碼基因具體可通過含有所述FNET1蛋白的編碼基因的重組載體導(dǎo)入所述目的魚腥藻中或整合至基因組上,并且所述FNET1蛋白的轉(zhuǎn)錄啟動(dòng)是受銅離子誘導(dǎo),所以在有銅離子的環(huán)境中,轉(zhuǎn)基因株氫氣的產(chǎn)量是高于野生株。當(dāng)所述轉(zhuǎn)基因株放置于缺銅 培養(yǎng)基中培養(yǎng)時(shí),啟動(dòng)子是不工作的,所以在缺少銅離子的培養(yǎng)環(huán)境中,F(xiàn)NET1蛋白不被表達(dá),產(chǎn)H2總積累量與野生型相當(dāng),從而說明提高H2的產(chǎn)量是FNET1的作用。
附圖說明
圖1為pPT27質(zhì)粒示意圖。
圖2為fnet1-pPT27質(zhì)粒構(gòu)建示意圖,箭頭方向代表著基因的轉(zhuǎn)錄方向。
圖3為SLIC克隆方法構(gòu)建pPT27運(yùn)載質(zhì)粒的流程示意圖。
圖4為野生株和轉(zhuǎn)基因藻株的產(chǎn)氫積累量圖。其中wt代表野生型魚腥藻7120;FNET1代表轉(zhuǎn)基因株。
圖5為野生株和轉(zhuǎn)基因藻株培養(yǎng)在缺銅環(huán)境中光誘導(dǎo)條件下,測(cè)定的產(chǎn)氫積累量。
圖6a和6b分別為野生株和轉(zhuǎn)基因藻株在誘導(dǎo)產(chǎn)H2階段,反應(yīng)中心亞基nifD和nifK的轉(zhuǎn)錄量變化。
具體實(shí)施方式
下述實(shí)施例中所用的材料、試劑等,如無特殊說明,均可從商業(yè)途徑得到。
魚腥藻7120(Anabaena sp.PCC 7120,簡(jiǎn)稱野生型藻株或wt株),從中科院水生所購(gòu)得。
三親結(jié)合轉(zhuǎn)化的初始質(zhì)粒RP4或pIncP、pRL623、pRL271由Wolk教授提供。
下述實(shí)施例中所用的培養(yǎng)基:
(1)BGII0培養(yǎng)基:NaCl 1.03g/L,K2HPO4 0.04g/L,MgSO4 0.075g/L,CaCl2·2H2O 0.036g/L,檸檬酸0.006g/L,檸檬酸鐵0.006g/L,Na2EDTA 0.001g/L,Na2CO3 0.02g/L,A5液(A5液:H3BO3 2.86g/L,MnCl2·4H2O 1.81g/L,ZnSO4·7H2O 0.222g/L,Na2MoO4·H2O 0.39g/L,CuSO4·5H2O 0.079g/L,Co(NO3)2·6H2O 0.0494g/L)1mL,pH為8.0。
(2)固體BGII0培養(yǎng)基:在BGII0培養(yǎng)基中加入1.5%的瓊脂粉。
(3)缺銅BGII0培養(yǎng)基:NaCl 1.03g/L,K2HPO4 0.04g/L,MgSO4 0.075g/L,CaCl2·2H2O 0.036g/L,檸檬酸0.006g/L,檸檬酸鐵0.006g/L,Na2EDTA 0.001g/L,Na2CO3 0.02g/L,A5液(A5液:H3BO3 2.86g/L,MnCl2·4H2O 1.81g/L,ZnSO4·7H2O 0.222g/L,Na2MoO4·H2O 0.39g/L,F(xiàn)eSO4·7H2O 0.088g/L,Co(NO3)2·6H2O 0.0494g/L)1mL,pH為8.0。
下述實(shí)施例中,關(guān)于作為實(shí)驗(yàn)材料的魚腥藻7120的培養(yǎng)具體如下:配制培養(yǎng)基溶液,121℃高溫滅菌20min。待培養(yǎng)基溫度降至室溫后再使用,用接種針從固體培養(yǎng)基上挑取單克隆至液體培養(yǎng)基中光照培養(yǎng),培養(yǎng)溫度是30度。固體培養(yǎng)時(shí),將單克隆轉(zhuǎn)到固體培養(yǎng)基上劃線培養(yǎng)。
實(shí)施例一 魚腥藻7120FNET1基因的獲得
1.魚腥藻7120總DNA提取
100mg材料,加入1mL預(yù)熱CTAB提取液(100mmol/L Tris,100mmol/L EDTA,1.4mol/L NaCI,2%CTAB),使用前加入2%β巰基乙醇和0.1ml玻璃珠用震蕩器破碎,隨后65℃水浴l h,其間每隔5min振蕩混勻。加入等體積的苯酚-氯仿-異戊醇(25:24:1)混合振蕩20min,10000rpm離心10min,取上清,加入0.35倍體積的無水乙醇和0.2體積的5mol/L的KAc混勻,離心后取上清加入半體積異丙醇,-20℃冷凍30min,10000rpm離心10min,吹干后加入400μM NaCl和1.5μl RNase,37℃水浴30min消解RNA。加入預(yù)冷的無水乙醇沉淀,-20℃靜置10min后離心,沉淀用70%酒精洗滌,晾干后溶于200μl TE中。
2.FNET1基因序列的擴(kuò)增
以步驟一提取的總DNA為模板,分別使用片段一上下游引物和片段二上下游引物進(jìn)行PCR反應(yīng)。反應(yīng)程序:98℃預(yù)變性5分鐘;98℃變形10s,60℃退火15s,72℃延伸1min,35個(gè)循環(huán);72℃延伸10min。引物由生工生物工程股份有限公司合成,序列如下:
片段一上游引物:
CAGGTTAGGAGAACGCCGTCGACATGGCTAGCTACCAAGTTAG(SEQ ID No:9)
片段一下游引物:
CTAATGTTTTCGTCAGTCATGGTACCAGCAAGGTACGGTTCTTG(SEQ ID No:10)
片段二上游引物:
GGTACCATGACTGACGAAAACATTAG(SEQ ID No:11)
片段二下游引物:
CCAATATTTTAATGATTTCAAGTCTAGACTATTTGGTAGCTTCTGCGG(SEQ ID No:12)
將通過上述PCR得到的片段一和片段二利用融合PCR的方法(將上述片段一和片段二在95度變性30秒,再迅速降低至55度15秒,72度延伸1分45秒,并做30個(gè)循環(huán)回收)連接為一個(gè)片段,即fnet1,并連接至T載體上進(jìn)行序列測(cè)序?qū)嶒?yàn),測(cè)序結(jié)果為SEQ ID No:1。
實(shí)施例二 轉(zhuǎn)基因藻株的獲得
1.通用運(yùn)載質(zhì)粒的構(gòu)建
使用以下步驟構(gòu)建通用運(yùn)載質(zhì)粒pPT27:
A.使用限制性內(nèi)切酶XhoI酶切含有蔗糖致死基因的載體質(zhì)粒pRL271,使其線性化并回收片段;
B.從魚腥藻7120基因組DNA擴(kuò)增同源重組雙交換上游片段(SEQ ID No:5)、下游片段 (SEQ ID No:6)和誘導(dǎo)型啟動(dòng)子P(SEQ ID No:7),從質(zhì)粒kan-pUC19中擴(kuò)增篩選抗性基因kan(SEQ ID No:8);
C.將步驟B獲得的同源重組雙交換片段上游片段、下游片段、誘導(dǎo)型啟動(dòng)子P和篩選抗性基因kan及線性pRL271連接獲得pPT27質(zhì)粒(SEQ ID No:3,見圖1)。
2.穿梭質(zhì)粒的構(gòu)建
使用前述構(gòu)建的通用運(yùn)載質(zhì)粒pPT27,利用SLIC的方法獲得最后的穿梭運(yùn)載質(zhì)粒fnet1-pPT27(SEQ ID No:4,見圖2和圖3)。
3.轉(zhuǎn)基因藻株的獲得
使用先前文獻(xiàn)記載的方法,將前述獲得的穿梭運(yùn)載質(zhì)粒fnet1-pPT27以及幫助質(zhì)粒pRL623和結(jié)合質(zhì)粒pIncP與野生型魚腥藻7120共培養(yǎng),2~3周獲得轉(zhuǎn)化子,之后液體擴(kuò)培。
4.驗(yàn)證整合情況
利用以下引物對(duì):
上游引物:
GCAGAAATTCGATATCTAGATCTCGAGTCTTCCTGTAAACGGTATGG(SEQ ID No:13)
下游引物:
GGCGGACGGGAAGTATCCAGCTCGAGGTATGAGACTTATGACAAACCC(SEQ ID No:14)通過PCR擴(kuò)增檢測(cè)藻株的整合情況。當(dāng)轉(zhuǎn)化子所擴(kuò)增的片段大于野生型擴(kuò)增片段時(shí),說明整合成功。然后提取野生株和轉(zhuǎn)基因株的總蛋白,使用NifH抗體鑒定蛋白的表達(dá)情況以再次確認(rèn)。
實(shí)施例三 藻株產(chǎn)氫量的檢測(cè)
以實(shí)施例2獲得的FNET1轉(zhuǎn)基因藻和野生型分別在BGII0培養(yǎng)基和缺銅BGII0培養(yǎng)基上培養(yǎng),測(cè)定各藻株和在各條件下的產(chǎn)氫量和葉綠素含量(測(cè)定方法請(qǐng)參見Improving conversion efficiency of solar energy to electricity in cyanobacterial PEMFC by high levels of photo-H 2production,International Journal of Hydrogen Energy,2013)。
結(jié)果顯示,F(xiàn)NET1蛋白的表達(dá)可以顯著提高H2的產(chǎn)量,H2的產(chǎn)量被提升了3.9倍(圖3)。由于FNET1含有鐵硫簇,可以轉(zhuǎn)移電子,將電子直接轉(zhuǎn)移至固氮酶反應(yīng)中心,進(jìn)而修改電子傳遞鏈。當(dāng)野生型和轉(zhuǎn)基因藻株培養(yǎng)在缺銅培養(yǎng)基生長(zhǎng)至對(duì)數(shù)期,在光厭氧條件下測(cè)定產(chǎn)氫積累量,結(jié)果揭示野生株和轉(zhuǎn)基因藻株產(chǎn)氫總量相同(圖4)。這說明FNET1蛋白在魚腥藻7120產(chǎn)氫過程中起著重要的角色。在產(chǎn)氫階段,檢測(cè)固氮酶反應(yīng)中心亞基的轉(zhuǎn)錄量可以反映出潛在產(chǎn)氫能力的變化,通過實(shí)驗(yàn)證明在轉(zhuǎn)基因藻株中nifD和nifK的轉(zhuǎn)錄量是增大的(圖 5)。
分析產(chǎn)氫提高的原因,由于FNET1含有鐵硫簇,并且會(huì)接收來自光合系統(tǒng)I傳遞的電子,所以修改了胞內(nèi)的電子傳遞量。在產(chǎn)氫過程中,分析野生型和轉(zhuǎn)基因株中固氮酶核心亞基nifD/nifK的轉(zhuǎn)錄量變化時(shí)發(fā)現(xiàn),在轉(zhuǎn)基因藻株中,二個(gè)基因的轉(zhuǎn)錄是被提高的。
實(shí)施例四藻株中糖原的含量
當(dāng)藻株生長(zhǎng)OD750至0.5、0.85、1.1時(shí)收集細(xì)胞,加入5%H2SO4沸水浴處理30min。10000rpm離心后,過濾除雜質(zhì),HPLC測(cè)定葡萄糖含量。這一過程中需要測(cè)定葉綠素含量。
結(jié)果顯示,表達(dá)FNET1蛋白的轉(zhuǎn)基因株中含有的糖原的量要高于野生株。nifH的調(diào)節(jié)是受光照影響,而fnet1序列也含有這一受調(diào)控的功能域。在藻絲體生長(zhǎng)階段,并至OD750約為0.85時(shí),nifH的轉(zhuǎn)錄量是所受影響的是有限,而Fd的轉(zhuǎn)錄量是增大的,說明增大了流向碳循環(huán)的電子,使糖原的含量增加(表1)。這說明FNET1蛋白在整個(gè)電子傳遞鏈中起著不可忽視的作用,無論是光發(fā)酵產(chǎn)氫階段或是藻體生長(zhǎng)階段。
表1.野生株和轉(zhuǎn)基因藻株在生長(zhǎng)階段的糖原含量變化
SEQUENCE LISTING
<110> 清華大學(xué)
<120> 一種可以增大電子傳遞的融合蛋白及其應(yīng)用
<130> 20161213-2
<160> 14
<170> PatentIn version 3.3
<210> 1
<211> 1191
<212> DNA
<213> 人工序列
<400> 1
atggctagct accaagttag attgatcaac aagaaacaag acatcgatac taccatcgag 60
attgatgaag aaaccacaat tttagatggc gcagaagaaa atggtattga attacctttc 120
tcttgccatt ctggttcttg ttctagctgt gtaggcaaag ttgttgaagg tgaagttgac 180
caatctgatc aaatcttctt agatgatgaa cagatgggta aaggcttcgc tctactttgt 240
gttacttacc ctcgttccaa ctgcacaatt aagacccacc aagaaccgta ccttgctggt 300
accatgactg acgaaaacat tagacagata gctttctacg gtaaaggcgg tatcggtaaa 360
tctaccacct cccaaaacac ccttgcagct atggcagaaa tgggtcaacg catcatgatt 420
gtaggttgcg accctaaagc tgactccacc cgtctgatgc ttcactccaa agctcaaacc 480
accgtactac acttagctgc tgaacgcggt gcagtagaag acttagaact ccacgaagta 540
atgttgaccg gtttccgtgg cgttaagtgc gtagaatctg gtggtccaga acccggtgta 600
ggttgcgccg gtcgtggtat catcaccgcc attaacttct tagaagaaaa cggcgcttac 660
caagacctag acttcgtatc ctacgacgta ttgggtgacg ttgtatgtgg tggtttcgct 720
atgcctatcc gtgaaggtaa agcacaagaa atctacatcg ttacctctgg tgaaatgatg 780
gcgatgtatg ctgctaacaa catcgctcgc ggtattttga aatatgctca ctccggtggt 840
gtacgtttag gtggtttgat ctgtaacagc cgtaaggttg accgtgaaga cgagttaatc 900
atgaacttgg ctgaacgttt gaacacccaa atgattcact tcgtacctcg tgacaacatc 960
gttcaacacg cagaattgcg ccgtatgacc gttaacgagt acgcaccaga cagcaaccaa 1020
ggtcaagagt accgcgcatt agctaagaag atcatcaaca acgacaagct caccattcct 1080
acaccaatgg aaatggatga actagaagct ctgttgatcg aatacggtct attagacgac 1140
gacaccaagc actctgaaat catcggtaag cccgcagaag ctaccaaata g 1191
<210> 2
<211> 396
<212> PRT
<213> 人工序列
<400> 2
Met Ala Ser Tyr Gln Val Arg Leu Ile Asn Lys Lys Gln Asp Ile Asp
1 5 10 15
Thr Thr Ile Glu Ile Asp Glu Glu Thr Thr Ile Leu Asp Gly Ala Glu
20 25 30
Glu Asn Gly Ile Glu Leu Pro Phe Ser Cys His Ser Gly Ser Cys Ser
35 40 45
Ser Cys Val Gly Lys Val Val Glu Gly Glu Val Asp Gln Ser Asp Gln
50 55 60
Ile Phe Leu Asp Asp Glu Gln Met Gly Lys Gly Phe Ala Leu Leu Cys
65 70 75 80
Val Thr Tyr Pro Arg Ser Asn Cys Thr Ile Lys Thr His Gln Glu Pro
85 90 95
Tyr Leu Ala Gly Thr Met Thr Asp Glu Asn Ile Arg Gln Ile Ala Phe
100 105 110
Tyr Gly Lys Gly Gly Ile Gly Lys Ser Thr Thr Ser Gln Asn Thr Leu
115 120 125
Ala Ala Met Ala Glu Met Gly Gln Arg Ile Met Ile Val Gly Cys Asp
130 135 140
Pro Lys Ala Asp Ser Thr Arg Leu Met Leu His Ser Lys Ala Gln Thr
145 150 155 160
Thr Val Leu His Leu Ala Ala Glu Arg Gly Ala Val Glu Asp Leu Glu
165 170 175
Leu His Glu Val Met Leu Thr Gly Phe Arg Gly Val Lys Cys Val Glu
180 185 190
Ser Gly Gly Pro Glu Pro Gly Val Gly Cys Ala Gly Arg Gly Ile Ile
195 200 205
Thr Ala Ile Asn Phe Leu Glu Glu Asn Gly Ala Tyr Gln Asp Leu Asp
210 215 220
Phe Val Ser Tyr Asp Val Leu Gly Asp Val Val Cys Gly Gly Phe Ala
225 230 235 240
Met Pro Ile Arg Glu Gly Lys Ala Gln Glu Ile Tyr Ile Val Thr Ser
245 250 255
Gly Glu Met Met Ala Met Tyr Ala Ala Asn Asn Ile Ala Arg Gly Ile
260 265 270
Leu Lys Tyr Ala His Ser Gly Gly Val Arg Leu Gly Gly Leu Ile Cys
275 280 285
Asn Ser Arg Lys Val Asp Arg Glu Asp Glu Leu Ile Met Asn Leu Ala
290 295 300
Glu Arg Leu Asn Thr Gln Met Ile His Phe Val Pro Arg Asp Asn Ile
305 310 315 320
Val Gln His Ala Glu Leu Arg Arg Met Thr Val Asn Glu Tyr Ala Pro
325 330 335
Asp Ser Asn Gln Gly Gln Glu Tyr Arg Ala Leu Ala Lys Lys Ile Ile
340 345 350
Asn Asn Asp Lys Leu Thr Ile Pro Thr Pro Met Glu Met Asp Glu Leu
355 360 365
Glu Ala Leu Leu Ile Glu Tyr Gly Leu Leu Asp Asp Asp Thr Lys His
370 375 380
Ser Glu Ile Ile Gly Lys Pro Ala Glu Ala Thr Lys
385 390 395
<210> 3
<211> 9733
<212> DNA
<213> 人工序列
<400> 3
gctggctgtt ttacgcgtat gacaggctcc ggaagacggt tgttgcgcac gtattcggtg 60
aacgcactat ggcgacgctg gggcgtctta tgagcctgct gtcacccttt gacgtggtga 120
tatggatgac ggatggctgg ccgctgtatg aatcccgcct gaagggaaag ctgcacgtaa 180
tcagcaagcg atatacgcag cgaattgagc ggcataacct gaatctgagg cagcacctgg 240
cacggctggg acggaagtcg ctgtcgttct caaaatcggt ggagctgcat gacaaagtca 300
tcgggcatta tctgaacata aaacactatc aataagttgg agtcattacc aaaaggttag 360
gaatacggtt agccatttgc ctgcttttat atagttcata tgggattcac ctttatgttg 420
ataagaaata aaagaaaatg ccaataggat atcggcattt tcttttgcgt ttttatttgt 480
taactgttaa ttgtccttgt tcaaggatgc tgtctttgac aacagatgtt ttcttgcctt 540
tgatgttcag caggaagctt ggcgcaaacg ttgattgttt gtctgcgtag aatcctctgt 600
ttgtcatata gcttgtaatc acgacattgt ttcctttcgc ttgaggtaca gcgaagtgtg 660
agtaagtaaa ggttacatcg ttaggatcaa gatccatttt taacacaagg ccagttttgt 720
tcagcggctt gtatgggcca gttaaagaat tagaaacata accaagcatg taaatatcgt 780
tagacgtaat gccgtcaatc gtcatttttg atccgcggga gtcagtgaac aggtaccatt 840
tgccgttcat tttaaagacg ttcgcgcgtt caatttcatc tgttactgtg ttagatgcaa 900
tcagcggttt catcactttt ttcagtgtgt aatcatcgtt tagctcaatc ataccgagag 960
cgccgtttgc taactcagcc gtgcgttttt tatcgctttg cagaagtttt tgactttctt 1020
gacggaagaa tgatgtgctt ttgccatagt atgctttgtt aaataaagat tcttcgcctt 1080
ggtagccatc ttcagttcca gtgtttgctt caaatactaa gtatttgtgg cctttatctt 1140
ctacgtagtg aggatctctc agcgtatggt tgtcgcctga gctgtagttg ccttcatcga 1200
tgaactgctg tacattttga tacgtttttc cgtcaccgtc aaagattgat ttataatcct 1260
ctacaccgtt gatgttcaaa gagctgtctg atgctgatac gttaacttgt gcagttgtca 1320
gtgtttgttt gccgtaatgt ttaccggaga aatcagtgta gaataaacgg atttttccgt 1380
cagatgtaaa tgtggctgaa cctgaccatt cttgtgtttg gtcttttagg atagaatcat 1440
ttgcatcgaa tttgtcgctg tctttaaaga cgcggccagc gtttttccag ctgtcaatag 1500
aagtttcgcc gactttttga tagaacatgt aaatcgatgt gtcatccgca tttttaggat 1560
ctccggctaa tgcaaagacg atgtggtagc cgtgatagtt tgcgacagtg ccgtcagcgt 1620
tttgtaatgg ccagctgtcc caaacctcca ggccttttgc agaagagata tttttaattg 1680
tggacgaatc gaattcagga acttgatatt tttcattttt ttgctgttca gggatttgca 1740
gcatatcatg gcgtgtaata tgggaaatgc cgtatgtttc cttatatggc ttttggttcg 1800
tttctttcgc aaacgcttga gttgcgcctc ctgccagcag tgcggtagta aaggttaata 1860
ctgttgcttg ttttgcaaac tttttgatgt tcatcgttca tgtctccttt tttatgtact 1920
gtgttagcgg tctgcttctt ccagccctcc tgtttgaaga tggcaagtta gttacgcaca 1980
ataaaaaaag acctaaaata tgtaaggggt gacgccaaag tatacacttt gccctttaca 2040
cattttaggt cttgcctgct ttatcagtaa caaacccgcg cgatttactt ttcgacctca 2100
ttctattaga ctctcgtttg gattgcaact ggtctatttt cctcttttgt ttgatagaaa 2160
atcataaaag gatttgcaga ctacgggcct aaagaactaa aaaatctatc tgtttctttt 2220
cattctctgt attttttata gtttctgttg catgggcata aagttgcctt tttaatcaca 2280
attcagaaaa tatcataata tctcatttca ctaaataata gtgaacggca ggtatatgtg 2340
atgggttaaa aaggatcgat cctctagcta gagtcgacct gcatccctta acttacttat 2400
taaataattt atagctattg aaaagagata agaattgttc aaagctaata ttgtttaaat 2460
cgtcaattcc tgcatgtttt aaggaattgt taaattgatt ttttgtaaat attttcttgt 2520
attctttgtt aacccatttc ataacgaaat aattatactt ttgtttatct ttgtgtgata 2580
ttcttgattt ttttctactt aatctgataa gtgagctatt cactttaggt ttaggatgaa 2640
aatattctct tggaaccata cttaatatag aaatatcaac ttctgccatt aaaagtaatg 2700
ccaatgagcg ttttgtattt aataatcttt tagcaaaccc gtattccacg attaaataaa 2760
tctcattagc tatactatca aaaacaattt tgcgtattat atccgtactt atgttataag 2820
gtatattacc atatatttta taggattggt ttttaggaaa tttaaactgc aatatatcct 2880
tgtttaaaac ttggaaatta tcgtgatcaa caagtttatt ttctgtagtt ttgcataatt 2940
tatggtctat ttcaatggca gttacgaaat tacacctctt tactaattca agggtaaaat 3000
ggccttttcc tgagccgatt tcaaagatat tatcatgttc atttaatctt atatttgtca 3060
ttattttatc tatattatgt tttgaagtaa taaagttttg actgtgtttt atatttttct 3120
cgttcattat aaccctcttt aatttggtta tatgaatttt gcttattaac gattcattat 3180
aaccacttat tttttgtttg gttgataatg aactgtgctg attacaaaaa tactaaaaat 3240
gcccatattt tttcctcctt ataaaattag tataattata gcacgcgaat tcatcgaata 3300
aatacctgtg acggaagatc acttcgcaga ataaataaat cctggtgtcc ctgttgatac 3360
cgggaagccc tgggccaact tttggcgaaa atgagacgtt gatcggcacg taagaggttc 3420
caactttcac cataatgaaa taagatcact accgggcgta ttttttgagt tatcgagatt 3480
ttcaggagct aaggaagcta aaatggagaa aaaaatcact ggatatacca ccgttgatat 3540
atcccaatgg catcgtaaag aacattttga ggcatttcag tcagttgctc aatgtaccta 3600
taaccagacc gttcagctgg atattacggc ctttttaaag accgtaaaga aaaataagca 3660
caagttttat ccggccttta ttcacattct tgcccgcctg atgaatgctc atccggaatt 3720
ccgtatggca atgaaagacg gtgagctggt gatatgggat agtgttcacc cttgttacac 3780
cgttttccat gagcaaactg aaacgttttc atcgctctgg agtgaatacc acgacgattt 3840
ccggcagttt ctacacatat attcgcaaga tgtggcgtgt tacggtgaaa acctggccta 3900
tttccctaaa gggtttattg agaatatgtt tttcgtctca gccaatccct gggtgagttt 3960
caccagtttt gatttaaacg tggccaatat ggacaacttc ttcgcccccg ttttcaccat 4020
gggcaaatat tatacgcaag gcgacaaggt gctgatgccg ctggcgattc aggttcatca 4080
tgccgtttgt gatggcttcc atgtcggcag aatgcttaat gaattacaac agtactgcga 4140
tgagtggcag ggcggggcgt aattttttta aggcagttat tggtgccctt aaacgcctgg 4200
tgctacgcct gaataagtga taataagcgg atgaatggca gaaattcgat atctagatct 4260
cgagtcttcc tgtaaacggt atggatcatt gcttcccatc aaatgcagtg tccaactctg 4320
gcttaattct cgaagaattc agggagattt aacttcgaga actatatcga tcctataaat 4380
ttgaggagaa tcggcaaatg gctagctacc aagttagatt gatcaacaag aaacaagaca 4440
tcgatactac catcgagatt gatgaagaaa ccacaatttt agatggcgca gaagaaaatg 4500
gtattgaatt acctttctct tgccattctg gttcttgttc tagctgtgta ggcaaagttg 4560
ttgaaggtga agttgaccaa tctgatcaaa tcttcttaga tgatgaacag atgggtaaag 4620
gcttcgctct actttgtgtt acttaccctc gttccaactg cacaattaag acccaccaag 4680
aaccgtacct tgcttaattc attgctgtag tcgctactat ttacagcttg tgcaagtgta 4740
gcttaaatca ggatgaagga tatttttcat cctgatttct tatataaatc tattctgaat 4800
ttattaacac caatgtttac tccatttact gtaaatggca gttctttgca attgctaaaa 4860
gttggcgatc gcggaatagt caagttctgc aatattcaag ataaaaatat tctcaaaaaa 4920
ctcaagtctc tgggcttaaa taccggagtc actatcacca tagagcaaga attcccttct 4980
ttaattattc aagtaggaag cattctctta gaaatagata aagaacttgc tcgtaacatc 5040
tacgttcgtg taattaataa ttgattgaat tgagaaaaat cttcattaat aagtactata 5100
tcttacagta ttagagtacc tcacgctgcc gcaagcactc agggcgcaag ggctgctaaa 5160
ggaagcggaa cacgtagaaa gccagtccgc agaaacggtg ctgaccccgg atgaatgtca 5220
gctactgggc tatctggaca agggaaaacg caagcgcaaa gagaaagcag gtagcttgca 5280
gtgggcttac atggcgatak ctagactgkk yggtttwatg gaaccagcca aggcgaaccg 5340
ggaattcgcc cagykggggc cgcccttctg gataagggtt ggggaagccc ctgacaaagt 5400
aaactggatg gctttcytgc cgccaaggat ctgatggcgc aggggatcaa gatctgatca 5460
aggagacagg atgaggatcg tttcgcatga ttgaacaagg tggattgcac gcaggttctc 5520
cggccgcttg ggtggagagg ctattcggct atgactgggc acaacagaca atcggctgct 5580
ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc cggttctttt tgtcaagacc 5640
gacctgtccg gtgccctgaa tgaactgcag gacgaggcag cgcggctatc gtggctggcc 5700
acgacgggcg ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg 5760
ctgctattgg gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag 5820
aaagtatcca tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc 5880
ccattcgacc accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt 5940
cttgtcgatc aggatgatct ggacgaagag catcasgggc tcgcgccagc cgaactgttc 6000
gccaggctca aggcgcgcat gcccgacggc gatgatctcg tcgtgaccca tggcgatgcc 6060
tgcttgccga atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg 6120
ctgggtgtgg cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaarag 6180
cttggcggcg aatgggctga ccgccttcct cstgcttwac ggtatcgccg ccttccsgat 6240
tcgcagcgca wcggcctyct atcggccttc ttggacgagt tcttctgagc gggactctgg 6300
ggttcgaaat gaccgaccaa gcgacgccca acctgccatc acgagatttc gattccaccg 6360
ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg ggacgccggc tggatgatcc 6420
tccagcgcgg ggatctcatg ctggagttct tcgcccaccg gggatcccag tactcagaat 6480
tttttgctga ggtactgagt acacagctaa taaaattggg caatctccgc gcctctatga 6540
cttgaaggag agtgtagggg tataggggaa agatatcttt tatctacatc acataaataa 6600
aaaatttaat ttgtcgctct ggctgcatat attgatgtat ttttagccat aagtttttta 6660
gtgccatgta attatagtga tttttagcga tcgcagagca tttttccctg gatttatcgc 6720
gatctcaaaa aaaatttgcc cgaagtatga cagattgtca tatttggtgt cgattttatt 6780
taaaatgaaa taagaaaaat aaaactacag gttaggagaa cgccgtcgac tctagacttg 6840
aaatcattaa aatattggga aaataaaata aatagagact ttaatatata acgtctctat 6900
ttagggaata aaggtaagcc atttaattag ttttggttta atcaacagca actatcacat 6960
ctgaggattt aattaaagcg tatgcttgct taccctcagc cagttggagt ttatctgctg 7020
atgatttggt gatgatcgaa actatctcta ctccaggagc tagttctaat gttacttcgg 7080
tgttaactgt accaggcaca acttttttaa cagttgtttt cagaaaatta cgtgcgctaa 7140
cttccatatc ttataatctt acctgtttac aggaaacaga ataccaacat ttacggtaaa 7200
taaaatcacc cctttagact tttttaatta tttcgataga tataaattta aaccaaaacc 7260
aaaaaccaga tacccgactt ctttaagaag tcgggtatct atggggattt tggtagctga 7320
catcatacaa gataactgtc aaaatagctg ccgttgtagt attttttaag cggatttaat 7380
caatgtacac ggcgatcgtt ataaacattc ataatctaag cttatcagag tgataatata 7440
taagtaagct aaattgttgc tagtgaacct agacctcagc aaaaagcgat tacagggtta 7500
tctcagacat tcctacctta atactggtca atcttagaaa ttgggtagat ggtcatatat 7560
cttcaagatg atactctcgg aacgctgcgg aaatcttcaa acaaaaacaa ccagatttat 7620
tagggtttgt cataagtctc atacctcgag ctggatactt cccgtccgcc agggggacat 7680
gccggcgatg ctgaaggtcg cgcgcattcc cgatgaagag gccggttacc gcctgtttga 7740
ggatatagta atctttctaa atagctttgg attggaggag tatggccact aatactaagt 7800
tcagctaata aaaaaatttg ctaaagaact ccagctggat ttcactgatg agaatatcgt 7860
cggagataaa tataataatt ccacggacta tagactatac tagtatactc cgtctactgt 7920
acgatacact tccgctcagg tccttgtcct ttaacgagga ttgttacgta cgctaatggc 7980
gtcaaaacaa agactctaga cctaggcctt aagatcgaaa gagctggtag ttggcgcact 8040
gttcgaagaa ctgccgatgt ccagtaagat tcttactatg ctggttgaac cggatgctgg 8100
taaagctact tgggttgctg cttctactta tggtaccgat acaactactg gtgaggaagt 8160
taaaggagct cgcgaaagct tgcatgcctg cagcaatggc aacaacgttg cgcaaactat 8220
taactggcga actacttact ctagcttccc ggcaacaatt aatagactgg atggaggcgg 8280
ataaagttgc aggaccactt ctgcgctcgg cccttccggc tggctggttt attgctgata 8340
aatctggagc cggtgagcgt gggtctcgcg gtatcattgc agcactgggg ccagatggta 8400
agccctcccg tatcgtagtt atctacacga cggggagtca ggcaactatg gatgaacgaa 8460
atagacagat cgctgagata ggtgcctcac tgattaagca ttggtaactg tcagaccaag 8520
tttactcata tatactttag attgatttaa aacttcattt ttaatttaaa aggatctagg 8580
tgaagatcct ttttgataat ctcatgacca aaatccctta acgtgagttt tcgttccact 8640
gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg agatcctttt tttctgcgcg 8700
taatctgctg cttgcaaaca aaaaaaccac cgctaccagc ggtggtttgt ttgccggatc 8760
aagagctacc aactcttttt ccgaaggtaa ctggcttcag cagagcgcag ataccaaata 8820
ctgtccttct agtgtagccg tagttaggcc accacttcaa gaactctgta gcaccgccta 8880
catacctcgc tctgctaatc ctgttaccag tggctgctgc cagtggcgat aagtcgtgtc 8940
ttaccgggtt ggactcaaga cgatagttac cggataaggc gcagcggtcg ggctgaacgg 9000
ggggttcgtg cacacagccc agcttggagc gaacgaccta caccgaactg agatacctac 9060
agcgtgagca ttgagaaagc gccacgcttc ccgaagggag aaaggcggac aggtatccgg 9120
taagcggcag ggtcggaaca ggagagcgca cgagggagct tccaggggga aacgcctggt 9180
atctttatag tcctgtcggg tttcgccacc tctgacttga gcgtcgattt ttgtgatgct 9240
cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc ggccttttta cggttcctgg 9300
ccttttgctg gccttttgct cacatgttct ttcctgcgtt atcccctgat tctgtggata 9360
accgtattac cgcctttgag tgagctgata ccgctcgccg cagccgaacg accgagcgca 9420
gcgagtcagt gagcgaggaa gcggaagagc gcctgatgcg gtattttctc cttacgcatc 9480
tgtgcggtat ttcacaccgc atatggtgca ctctcagtac aatctgctct gatgccgcat 9540
agttaagcca gtatacactc cgctatcgct acgtgactgg gtcatggctg cgccccgaca 9600
cccgccaaca cccgctgacg cgccctgacg ggcttgtctg ctcccggcat ccgcttacag 9660
acaagctgtg accgtctccg ggagctgcat gtgtcagagg ttttcaccgt catcaccgaa 9720
acgcgcgagg cag 9733
<210> 4
<211> 10924
<212> DNA
<213> 人工序列
<400> 4
gctggctgtt ttacgcgtat gacaggctcc ggaagacggt tgttgcgcac gtattcggtg 60
aacgcactat ggcgacgctg gggcgtctta tgagcctgct gtcacccttt gacgtggtga 120
tatggatgac ggatggctgg ccgctgtatg aatcccgcct gaagggaaag ctgcacgtaa 180
tcagcaagcg atatacgcag cgaattgagc ggcataacct gaatctgagg cagcacctgg 240
cacggctggg acggaagtcg ctgtcgttct caaaatcggt ggagctgcat gacaaagtca 300
tcgggcatta tctgaacata aaacactatc aataagttgg agtcattacc aaaaggttag 360
gaatacggtt agccatttgc ctgcttttat atagttcata tgggattcac ctttatgttg 420
ataagaaata aaagaaaatg ccaataggat atcggcattt tcttttgcgt ttttatttgt 480
taactgttaa ttgtccttgt tcaaggatgc tgtctttgac aacagatgtt ttcttgcctt 540
tgatgttcag caggaagctt ggcgcaaacg ttgattgttt gtctgcgtag aatcctctgt 600
ttgtcatata gcttgtaatc acgacattgt ttcctttcgc ttgaggtaca gcgaagtgtg 660
agtaagtaaa ggttacatcg ttaggatcaa gatccatttt taacacaagg ccagttttgt 720
tcagcggctt gtatgggcca gttaaagaat tagaaacata accaagcatg taaatatcgt 780
tagacgtaat gccgtcaatc gtcatttttg atccgcggga gtcagtgaac aggtaccatt 840
tgccgttcat tttaaagacg ttcgcgcgtt caatttcatc tgttactgtg ttagatgcaa 900
tcagcggttt catcactttt ttcagtgtgt aatcatcgtt tagctcaatc ataccgagag 960
cgccgtttgc taactcagcc gtgcgttttt tatcgctttg cagaagtttt tgactttctt 1020
gacggaagaa tgatgtgctt ttgccatagt atgctttgtt aaataaagat tcttcgcctt 1080
ggtagccatc ttcagttcca gtgtttgctt caaatactaa gtatttgtgg cctttatctt 1140
ctacgtagtg aggatctctc agcgtatggt tgtcgcctga gctgtagttg ccttcatcga 1200
tgaactgctg tacattttga tacgtttttc cgtcaccgtc aaagattgat ttataatcct 1260
ctacaccgtt gatgttcaaa gagctgtctg atgctgatac gttaacttgt gcagttgtca 1320
gtgtttgttt gccgtaatgt ttaccggaga aatcagtgta gaataaacgg atttttccgt 1380
cagatgtaaa tgtggctgaa cctgaccatt cttgtgtttg gtcttttagg atagaatcat 1440
ttgcatcgaa tttgtcgctg tctttaaaga cgcggccagc gtttttccag ctgtcaatag 1500
aagtttcgcc gactttttga tagaacatgt aaatcgatgt gtcatccgca tttttaggat 1560
ctccggctaa tgcaaagacg atgtggtagc cgtgatagtt tgcgacagtg ccgtcagcgt 1620
tttgtaatgg ccagctgtcc caaacctcca ggccttttgc agaagagata tttttaattg 1680
tggacgaatc gaattcagga acttgatatt tttcattttt ttgctgttca gggatttgca 1740
gcatatcatg gcgtgtaata tgggaaatgc cgtatgtttc cttatatggc ttttggttcg 1800
tttctttcgc aaacgcttga gttgcgcctc ctgccagcag tgcggtagta aaggttaata 1860
ctgttgcttg ttttgcaaac tttttgatgt tcatcgttca tgtctccttt tttatgtact 1920
gtgttagcgg tctgcttctt ccagccctcc tgtttgaaga tggcaagtta gttacgcaca 1980
ataaaaaaag acctaaaata tgtaaggggt gacgccaaag tatacacttt gccctttaca 2040
cattttaggt cttgcctgct ttatcagtaa caaacccgcg cgatttactt ttcgacctca 2100
ttctattaga ctctcgtttg gattgcaact ggtctatttt cctcttttgt ttgatagaaa 2160
atcataaaag gatttgcaga ctacgggcct aaagaactaa aaaatctatc tgtttctttt 2220
cattctctgt attttttata gtttctgttg catgggcata aagttgcctt tttaatcaca 2280
attcagaaaa tatcataata tctcatttca ctaaataata gtgaacggca ggtatatgtg 2340
atgggttaaa aaggatcgat cctctagcta gagtcgacct gcatccctta acttacttat 2400
taaataattt atagctattg aaaagagata agaattgttc aaagctaata ttgtttaaat 2460
cgtcaattcc tgcatgtttt aaggaattgt taaattgatt ttttgtaaat attttcttgt 2520
attctttgtt aacccatttc ataacgaaat aattatactt ttgtttatct ttgtgtgata 2580
ttcttgattt ttttctactt aatctgataa gtgagctatt cactttaggt ttaggatgaa 2640
aatattctct tggaaccata cttaatatag aaatatcaac ttctgccatt aaaagtaatg 2700
ccaatgagcg ttttgtattt aataatcttt tagcaaaccc gtattccacg attaaataaa 2760
tctcattagc tatactatca aaaacaattt tgcgtattat atccgtactt atgttataag 2820
gtatattacc atatatttta taggattggt ttttaggaaa tttaaactgc aatatatcct 2880
tgtttaaaac ttggaaatta tcgtgatcaa caagtttatt ttctgtagtt ttgcataatt 2940
tatggtctat ttcaatggca gttacgaaat tacacctctt tactaattca agggtaaaat 3000
ggccttttcc tgagccgatt tcaaagatat tatcatgttc atttaatctt atatttgtca 3060
ttattttatc tatattatgt tttgaagtaa taaagttttg actgtgtttt atatttttct 3120
cgttcattat aaccctcttt aatttggtta tatgaatttt gcttattaac gattcattat 3180
aaccacttat tttttgtttg gttgataatg aactgtgctg attacaaaaa tactaaaaat 3240
gcccatattt tttcctcctt ataaaattag tataattata gcacgcgaat tcatcgaata 3300
aatacctgtg acggaagatc acttcgcaga ataaataaat cctggtgtcc ctgttgatac 3360
cgggaagccc tgggccaact tttggcgaaa atgagacgtt gatcggcacg taagaggttc 3420
caactttcac cataatgaaa taagatcact accgggcgta ttttttgagt tatcgagatt 3480
ttcaggagct aaggaagcta aaatggagaa aaaaatcact ggatatacca ccgttgatat 3540
atcccaatgg catcgtaaag aacattttga ggcatttcag tcagttgctc aatgtaccta 3600
taaccagacc gttcagctgg atattacggc ctttttaaag accgtaaaga aaaataagca 3660
caagttttat ccggccttta ttcacattct tgcccgcctg atgaatgctc atccggaatt 3720
ccgtatggca atgaaagacg gtgagctggt gatatgggat agtgttcacc cttgttacac 3780
cgttttccat gagcaaactg aaacgttttc atcgctctgg agtgaatacc acgacgattt 3840
ccggcagttt ctacacatat attcgcaaga tgtggcgtgt tacggtgaaa acctggccta 3900
tttccctaaa gggtttattg agaatatgtt tttcgtctca gccaatccct gggtgagttt 3960
caccagtttt gatttaaacg tggccaatat ggacaacttc ttcgcccccg ttttcaccat 4020
gggcaaatat tatacgcaag gcgacaaggt gctgatgccg ctggcgattc aggttcatca 4080
tgccgtttgt gatggcttcc atgtcggcag aatgcttaat gaattacaac agtactgcga 4140
tgagtggcag ggcggggcgt aattttttta aggcagttat tggtgccctt aaacgcctgg 4200
tgctacgcct gaataagtga taataagcgg atgaatggca gaaattcgat atctagatct 4260
cgagtcttcc tgtaaacggt atggatcatt gcttcccatc aaatgcagtg tccaactctg 4320
gcttaattct cgaagaattc agggagattt aacttcgaga actatatcga tcctataaat 4380
ttgaggagaa tcggcaaatg gctagctacc aagttagatt gatcaacaag aaacaagaca 4440
tcgatactac catcgagatt gatgaagaaa ccacaatttt agatggcgca gaagaaaatg 4500
gtattgaatt acctttctct tgccattctg gttcttgttc tagctgtgta ggcaaagttg 4560
ttgaaggtga agttgaccaa tctgatcaaa tcttcttaga tgatgaacag atgggtaaag 4620
gcttcgctct actttgtgtt acttaccctc gttccaactg cacaattaag acccaccaag 4680
aaccgtacct tgcttaattc attgctgtag tcgctactat ttacagcttg tgcaagtgta 4740
gcttaaatca ggatgaagga tatttttcat cctgatttct tatataaatc tattctgaat 4800
ttattaacac caatgtttac tccatttact gtaaatggca gttctttgca attgctaaaa 4860
gttggcgatc gcggaatagt caagttctgc aatattcaag ataaaaatat tctcaaaaaa 4920
ctcaagtctc tgggcttaaa taccggagtc actatcacca tagagcaaga attcccttct 4980
ttaattattc aagtaggaag cattctctta gaaatagata aagaacttgc tcgtaacatc 5040
tacgttcgtg taattaataa ttgattgaat tgagaaaaat cttcattaat aagtactata 5100
tcttacagta ttagagtacc tcacgctgcc gcaagcactc agggcgcaag ggctgctaaa 5160
ggaagcggaa cacgtagaaa gccagtccgc agaaacggtg ctgaccccgg atgaatgtca 5220
gctactgggc tatctggaca agggaaaacg caagcgcaaa gagaaagcag gtagcttgca 5280
gtgggcttac atggcgatak ctagactgkk yggtttwatg gaaccagcca aggcgaaccg 5340
ggaattcgcc cagykggggc cgcccttctg gataagggtt ggggaagccc ctgacaaagt 5400
aaactggatg gctttcytgc cgccaaggat ctgatggcgc aggggatcaa gatctgatca 5460
aggagacagg atgaggatcg tttcgcatga ttgaacaagg tggattgcac gcaggttctc 5520
cggccgcttg ggtggagagg ctattcggct atgactgggc acaacagaca atcggctgct 5580
ctgatgccgc cgtgttccgg ctgtcagcgc aggggcgccc cggttctttt tgtcaagacc 5640
gacctgtccg gtgccctgaa tgaactgcag gacgaggcag cgcggctatc gtggctggcc 5700
acgacgggcg ttccttgcgc agctgtgctc gacgttgtca ctgaagcggg aagggactgg 5760
ctgctattgg gcgaagtgcc ggggcaggat ctcctgtcat ctcaccttgc tcctgccgag 5820
aaagtatcca tcatggctga tgcaatgcgg cggctgcata cgcttgatcc ggctacctgc 5880
ccattcgacc accaagcgaa acatcgcatc gagcgagcac gtactcggat ggaagccggt 5940
cttgtcgatc aggatgatct ggacgaagag catcasgggc tcgcgccagc cgaactgttc 6000
gccaggctca aggcgcgcat gcccgacggc gatgatctcg tcgtgaccca tggcgatgcc 6060
tgcttgccga atatcatggt ggaaaatggc cgcttttctg gattcatcga ctgtggccgg 6120
ctgggtgtgg cggaccgcta tcaggacata gcgttggcta cccgtgatat tgctgaarag 6180
cttggcggcg aatgggctga ccgccttcct cstgcttwac ggtatcgccg ccttccsgat 6240
tcgcagcgca wcggcctyct atcggccttc ttggacgagt tcttctgagc gggactctgg 6300
ggttcgaaat gaccgaccaa gcgacgccca acctgccatc acgagatttc gattccaccg 6360
ccgccttcta tgaaaggttg ggcttcggaa tcgttttccg ggacgccggc tggatgatcc 6420
tccagcgcgg ggatctcatg ctggagttct tcgcccaccg gggatcccag tactcagaat 6480
tttttgctga ggtactgagt acacagctaa taaaattggg caatctccgc gcctctatga 6540
cttgaaggag agtgtagggg tataggggaa agatatcttt tatctacatc acataaataa 6600
aaaatttaat ttgtcgctct ggctgcatat attgatgtat ttttagccat aagtttttta 6660
gtgccatgta attatagtga tttttagcga tcgcagagca tttttccctg gatttatcgc 6720
gatctcaaaa aaaatttgcc cgaagtatga cagattgtca tatttggtgt cgattttatt 6780
taaaatgaaa taagaaaaat aaaactacag gttaggagaa cgccgtcgac atggctagct 6840
accaagttag attgatcaac aagaaacaag acatcgatac taccatcgag attgatgaag 6900
aaaccacaat tttagatggc gcagaagaaa atggtattga attacctttc tcttgccatt 6960
ctggttcttg ttctagctgt gtaggcaaag ttgttgaagg tgaagttgac caatctgatc 7020
aaatcttctt agatgatgaa cagatgggta aaggcttcgc tctactttgt gttacttacc 7080
ctcgttccaa ctgcacaatt aagacccacc aagaaccgta ccttgctggt accatgactg 7140
acgaaaacat tagacagata gctttctacg gtaaaggcgg tatcggtaaa tctaccacct 7200
cccaaaacac ccttgcagct atggcagaaa tgggtcaacg catcatgatt gtaggttgcg 7260
accctaaagc tgactccacc cgtctgatgc ttcactccaa agctcaaacc accgtactac 7320
acttagctgc tgaacgcggt gcagtagaag acttagaact ccacgaagta atgttgaccg 7380
gtttccgtgg cgttaagtgc gtagaatctg gtggtccaga acccggtgta ggttgcgccg 7440
gtcgtggtat catcaccgcc attaacttct tagaagaaaa cggcgcttac caagacctag 7500
acttcgtatc ctacgacgta ttgggtgacg ttgtatgtgg tggtttcgct atgcctatcc 7560
gtgaaggtaa agcacaagaa atctacatcg ttacctctgg tgaaatgatg gcgatgtatg 7620
ctgctaacaa catcgctcgc ggtattttga aatatgctca ctccggtggt gtacgtttag 7680
gtggtttgat ctgtaacagc cgtaaggttg accgtgaaga cgagttaatc atgaacttgg 7740
ctgaacgttt gaacacccaa atgattcact tcgtacctcg tgacaacatc gttcaacacg 7800
cagaattgcg ccgtatgacc gttaacgagt acgcaccaga cagcaaccaa ggtcaagagt 7860
accgcgcatt agctaagaag atcatcaaca acgacaagct caccattcct acaccaatgg 7920
aaatggatga actagaagct ctgttgatcg aatacggtct attagacgac gacaccaagc 7980
actctgaaat catcggtaag cccgcagaag ctaccaaata gtctagactt gaaatcatta 8040
aaatattggg aaaataaaat aaatagagac tttaatatat aacgtctcta tttagggaat 8100
aaaggtaagc catttaatta gttttggttt aatcaacagc aactatcaca tctgaggatt 8160
taattaaagc gtatgcttgc ttaccctcag ccagttggag tttatctgct gatgatttgg 8220
tgatgatcga aactatctct actccaggag ctagttctaa tgttacttcg gtgttaactg 8280
taccaggcac aactttttta acagttgttt tcagaaaatt acgtgcgcta acttccatat 8340
cttataatct tacctgttta caggaaacag aataccaaca tttacggtaa ataaaatcac 8400
ccctttagac ttttttaatt atttcgatag atataaattt aaaccaaaac caaaaaccag 8460
atacccgact tctttaagaa gtcgggtatc tatggggatt ttggtagctg acatcataca 8520
agataactgt caaaatagct gccgttgtag tattttttaa gcggatttaa tcaatgtaca 8580
cggcgatcgt tataaacatt cataatctaa gcttatcaga gtgataatat ataagtaagc 8640
taaattgttg ctagtgaacc tagacctcag caaaaagcga ttacagggtt atctcagaca 8700
ttcctacctt aatactggtc aatcttagaa attgggtaga tggtcatata tcttcaagat 8760
gatactctcg gaacgctgcg gaaatcttca aacaaaaaca accagattta ttagggtttg 8820
tcataagtct catacctcga gctggatact tcccgtccgc cagggggaca tgccggcgat 8880
gctgaaggtc gcgcgcattc ccgatgaaga ggccggttac cgcctgtttg aggatatagt 8940
aatctttcta aatagctttg gattggagga gtatggccac taatactaag ttcagctaat 9000
aaaaaaattt gctaaagaac tccagctgga tttcactgat gagaatatcg tcggagataa 9060
atataataat tccacggact atagactata ctagtatact ccgtctactg tacgatacac 9120
ttccgctcag gtccttgtcc tttaacgagg attgttacgt acgctaatgg cgtcaaaaca 9180
aagactctag acctaggcct taagatcgaa agagctggta gttggcgcac tgttcgaaga 9240
actgccgatg tccagtaaga ttcttactat gctggttgaa ccggatgctg gtaaagctac 9300
ttgggttgct gcttctactt atggtaccga tacaactact ggtgaggaag ttaaaggagc 9360
tcgcgaaagc ttgcatgcct gcagcaatgg caacaacgtt gcgcaaacta ttaactggcg 9420
aactacttac tctagcttcc cggcaacaat taatagactg gatggaggcg gataaagttg 9480
caggaccact tctgcgctcg gcccttccgg ctggctggtt tattgctgat aaatctggag 9540
ccggtgagcg tgggtctcgc ggtatcattg cagcactggg gccagatggt aagccctccc 9600
gtatcgtagt tatctacacg acggggagtc aggcaactat ggatgaacga aatagacaga 9660
tcgctgagat aggtgcctca ctgattaagc attggtaact gtcagaccaa gtttactcat 9720
atatacttta gattgattta aaacttcatt tttaatttaa aaggatctag gtgaagatcc 9780
tttttgataa tctcatgacc aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag 9840
accccgtaga aaagatcaaa ggatcttctt gagatccttt ttttctgcgc gtaatctgct 9900
gcttgcaaac aaaaaaacca ccgctaccag cggtggtttg tttgccggat caagagctac 9960
caactctttt tccgaaggta actggcttca gcagagcgca gataccaaat actgtccttc 10020
tagtgtagcc gtagttaggc caccacttca agaactctgt agcaccgcct acatacctcg 10080
ctctgctaat cctgttacca gtggctgctg ccagtggcga taagtcgtgt cttaccgggt 10140
tggactcaag acgatagtta ccggataagg cgcagcggtc gggctgaacg gggggttcgt 10200
gcacacagcc cagcttggag cgaacgacct acaccgaact gagataccta cagcgtgagc 10260
attgagaaag cgccacgctt cccgaaggga gaaaggcgga caggtatccg gtaagcggca 10320
gggtcggaac aggagagcgc acgagggagc ttccaggggg aaacgcctgg tatctttata 10380
gtcctgtcgg gtttcgccac ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg 10440
ggcggagcct atggaaaaac gccagcaacg cggccttttt acggttcctg gccttttgct 10500
ggccttttgc tcacatgttc tttcctgcgt tatcccctga ttctgtggat aaccgtatta 10560
ccgcctttga gtgagctgat accgctcgcc gcagccgaac gaccgagcgc agcgagtcag 10620
tgagcgagga agcggaagag cgcctgatgc ggtattttct ccttacgcat ctgtgcggta 10680
tttcacaccg catatggtgc actctcagta caatctgctc tgatgccgca tagttaagcc 10740
agtatacact ccgctatcgc tacgtgactg ggtcatggct gcgccccgac acccgccaac 10800
acccgctgac gcgccctgac gggcttgtct gctcccggca tccgcttaca gacaagctgt 10860
gaccgtctcc gggagctgca tgtgtcagag gttttcaccg tcatcaccga aacgcgcgag 10920
gcag 10924
<210> 5
<211> 903
<212> DNA
<213> 魚腥草
<400> 5
cagaaattcg atatctagat ctcgagtctt cctgtaaacg gtatggatca ttgcttccca 60
tcaaatgcag tgtccaactc tggcttaatt ctcgaagaat tcagggagat ttaacttcga 120
gaactatatc gatcctataa atttgaggag aatcggcaaa tggctagcta ccaagttaga 180
ttgatcaaca agaaacaaga catcgatact accatcgaga ttgatgaaga aaccacaatt 240
ttagatggcg cagaagaaaa tggtattgaa ttacctttct cttgccattc tggttcttgt 300
tctagctgtg taggcaaagt tgttgaaggt gaagttgacc aatctgatca aatcttctta 360
gatgatgaac agatgggtaa aggcttcgct ctactttgtg ttacttaccc tcgttccaac 420
tgcacaatta agacccacca agaaccgtac cttgcttaat tcattgctgt agtcgctact 480
atttacagct tgtgcaagtg tagcttaaat caggatgaag gatatttttc atcctgattt 540
cttatataaa tctattctga atttattaac accaatgttt actccattta ctgtaaatgg 600
cagttctttg caattgctaa aagttggcga tcgcggaata gtcaagttct gcaatattca 660
agataaaaat attctcaaaa aactcaagtc tctgggctta aataccggag tcactatcac 720
catagagcaa gaattccctt ctttaattat tcaagtagga agcattctct tagaaataga 780
taaagaactt gctcgtaaca tctacgttcg tgtaattaat aattgattga attgagaaaa 840
atcttcatta ataagtacta tatcttacag tattagagta cctcacgctg ccgcaagcac 900
tca 903
<210> 6
<211> 866
<212> DNA
<213> 魚腥草
<400> 6
caggttagga gaacgccgtc gactctagac ttgaaatcat taaaatattg ggaaaataaa 60
ataaatagag actttaatat ataacgtctc tatttaggga ataaaggtaa gccatttaat 120
tagttttggt ttaatcaaca gcaactatca catctgagga tttaattaaa gcgtatgctt 180
gcttaccctc agccagttgg agtttatctg ctgatgattt ggtgatgatc gaaactatct 240
ctactccagg agctagttct aatgttactt cggtgttaac tgtaccaggc acaacttttt 300
taacagttgt tttcagaaaa ttacgtgcgc taacttccat atcttataat cttacctgtt 360
tacaggaaac agaataccaa catttacggt aaataaaatc acccctttag acttttttaa 420
ttatttcgat agatataaat ttaaaccaaa accaaaaacc agatacccga cttctttaag 480
aagtcgggta tctatgggga ttttggtagc tgacatcata caagataact gtcaaaatag 540
ctgccgttgt agtatttttt aagcggattt aatcaatgta cacggcgatc gttataaaca 600
ttcataatct aagcttatca gagtgataat atataagtaa gctaaattgt tgctagtgaa 660
cctagacctc agcaaaaagc gattacaggg ttatctcaga cattcctacc ttaatactgg 720
tcaatcttag aaattgggta gatggtcata tatcttcaag atgatactct cggaacgctg 780
cggaaatctt caaacaaaaa caaccagatt tattagggtt tgtcataagt ctcatacctc 840
gagctggata cttcccgtcc gcctca 866
<210> 7
<211> 394
<212> DNA
<213> 魚腥草
<400> 7
catgctggag ttcttcgccc accggggatc ccagtactca gaattttttg ctgaggtact 60
gagtacacag ctaataaaat tgggcaatct ccgcgcctct atgacttgaa ggagagtgta 120
ggggtatagg ggaaagatat cttttatcta catcacataa ataaaaaatt taatttgtcg 180
ctctggctgc atatattgat gtatttttag ccataagttt tttagtgcca tgtaattata 240
gtgattttta gcgatcgcag agcatttttc cctggattta tcgcgatctc aaaaaaaatt 300
tgcccgaagt atgacagatt gtcatatttg gtgtcgattt tatttaaaat gaaataagaa 360
aaataaaact acaggttagg agaacgccgt cgac 394
<210> 8
<211> 1343
<212> DNA
<213> 人工序列
<400> 8
cctcacgctg ccgcaagcac tcagggcgca agggctgcta aaggaagcgg aacacgtaga 60
aagccagtcc gcagaaacgg tgctgacccc ggatgaatgt cagctactgg gctatctgga 120
caagggaaaa cgcaagcgca aagagaaagc aggtagcttg cagtgggctt acatggcgat 180
akctagactg kkyggtttwa tggaaccagc caaggcgaac cgggaattcg cccagykggg 240
gccgcccttc tggataaggg ttggggaagc ccctgacaaa gtaaactgga tggctttcyt 300
gccgccaagg atctgatggc gcaggggatc aagatctgat caaggagaca ggatgaggat 360
cgtttcgcat gattgaacaa ggtggattgc acgcaggttc tccggccgct tgggtggaga 420
ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 480
ggctgtcagc gcaggggcgc cccggttctt tttgtcaaga ccgacctgtc cggtgccctg 540
aatgaactgc aggacgaggc agcgcggcta tcgtggctgg ccacgacggg cgttccttgc 600
gcagctgtgc tcgacgttgt cactgaagcg ggaagggact ggctgctatt gggcgaagtg 660
ccggggcagg atctcctgtc atctcacctt gctcctgccg agaaagtatc catcatggct 720
gatgcaatgc ggcggctgca tacgcttgat ccggctacct gcccattcga ccaccaagcg 780
aaacatcgca tcgagcgagc acgtactcgg atggaagccg gtcttgtcga tcaggatgat 840
ctggacgaag agcatcasgg gctcgcgcca gccgaactgt tcgccaggct caaggcgcgc 900
atgcccgacg gcgatgatct cgtcgtgacc catggcgatg cctgcttgcc gaatatcatg 960
gtggaaaatg gccgcttttc tggattcatc gactgtggcc ggctgggtgt ggcggaccgc 1020
tatcaggaca tagcgttggc tacccgtgat attgctgaar agcttggcgg cgaatgggct 1080
gaccgccttc ctcstgcttw acggtatcgc cgccttccsg attcgcagcg cawcggccty 1140
ctatcggcct tcttggacga gttcttctga gcgggactct ggggttcgaa atgaccgacc 1200
aagcgacgcc caacctgcca tcacgagatt tcgattccac cgccgccttc tatgaaaggt 1260
tgggcttcgg aatcgttttc cgggacgccg gctggatgat cctccagcgc ggggatctca 1320
tgctggagtt cttcgcccac cgg 1343
<210> 9
<211> 43
<212> DNA
<213> 人工序列
<400> 9
caggttagga gaacgccgtc gacatggcta gctaccaagt tag 43
<210> 10
<211> 44
<212> DNA
<213> 人工序列
<400> 10
ctaatgtttt cgtcagtcat ggtaccagca aggtacggtt cttg 44
<210> 11
<211> 26
<212> DNA
<213> 人工序列
<400> 11
ggtaccatga ctgacgaaaa cattag 26
<210> 12
<211> 48
<212> DNA
<213> 人工序列
<400> 12
ccaatatttt aatgatttca agtctagact atttggtagc ttctgcgg 48
<210> 13
<211> 47
<212> DNA
<213> 人工序列
<400> 13
gcagaaattc gatatctaga tctcgagtct tcctgtaaac ggtatgg 47
<210> 14
<211> 48
<212> DNA
<213> 人工序列
<400> 15
ggcggacggg aagtatccag ctcgaggtat gagacttatg acaaaccc 48