本發明屬于生物制藥領域,具體涉及一種改進的轉氨酶、編碼基因及其在(R)-3-氨基丁醇制備上的應用。
背景技術:
(R)-3-氨基丁醇在化學反應和藥物合成方面有著廣泛的應用,可作為多種手性藥物的關鍵中間體。比如抗HIV藥物度魯特韋(Dolutegravir),該藥由葛蘭素史克(GSK)研發生產,2013年8月12日獲美國食品和藥物管理局(FDA)批準上市。度魯特韋自上市以來銷售額呈現飛躍式發展,2015年度全球銷售額高達90億美元。
(R)-3-氨基丁醇常溫常壓下是一種無色黏稠液體,分子量為89.14,可溶于水、乙醇、乙酸乙酯等溶劑中,其結構式如下所示:
目前公布的(R)-3-氨基丁醇的合成方法以化學法為主,一種是采用動力學拆分法獲得手性純的3-氨基丁醇(Journal of Organic Chemistry,42,1650,1977),該方法產品收率低,反應過程采用四氫鋁鋰作為還原劑,工業化放大生產較危險。另一種是以手性化合物作為起始原料,如D-丙氨酸或R型苯乙胺通過多步反應獲得手性純的3-氨基丁醇(Tetrahedron,61,9031,2005和CN 101417954B),這一類方法中手性純原料價格較貴,且反應步驟冗長,生產成本較高。
與化學合成法相比,生物合成法具有反應條件溫和、轉化率高和立體選擇性強等優點,目前利用生物法制備(R)-3-氨基丁醇的報道還較少。轉氨酶能夠不對稱催化潛手性酮類化合物一步合成手性胺類化合物,具有較好的應用前景。專利CN 104131048A公開了一種利用野生型D-轉氨酶不對稱催化4-羥基-2丁酮合成(R)-3-氨基丁醇的方法,但其反應底物濃度最高僅為300mM(26.4g/L),無法滿足工業化生產需求,僅停留在實驗室研究階段,同時反應過程中需使用10%的有機助溶劑DMSO或乙腈,這也增加了反應后處理的操作和成本,工業三廢排放量加大。
技術實現要素:
為了克服現有技術所存在的上述缺陷,本發明提供了一種改進的轉氨酶,同時還公開了該轉氨酶的編碼基因、重組表達基因工程菌及其在(R)-3-氨基丁醇制備上的應用。
本發明第一方面提供了一種改進的轉氨酶,其酶活性高于野生型轉氨酶的酶活性。
所述酶活性是指催化酮類化合物發生不對稱轉氨反應生成手性胺的酶活性。
所述野生型轉氨酶氨基酸序列如SEQ ID No.2所示,且來源于土曲霉菌Aspergillus terreus NIH2624。
在本發明的一個具體實施例中,所述酶活性是指催化底物4-羥基-2-丁酮發生不對稱轉氨反應生成(R)-3-氨基丁醇的酶活性。
所述改進的轉氨酶是在SEQ ID No.2所示氨基酸序列中經過取代、缺失或添加一個或幾個氨基酸殘基衍生的具有轉氨酶催化活性的蛋白質,且與SEQ ID No.2所示氨基酸序列有至少95%序列同源性。其中,所述的“幾個”是指2-15個,更佳地小于10個。根據本發明,在如SEQ ID No.2所示氨基酸序列的蛋白質分子中進行2、5、10個氨基酸殘基的突變得到SEQ ID No.4、6、8所示氨基酸序列的蛋白質均具有較高的轉氨酶的活性。
所述SEQ ID No.4是與SEQ ID No.2所示氨基酸序列有至少95%序列同源性的氨基酸序列,且對應于SEQ ID No.2所示氨基酸序列中的第55位和第215位分別為丙氨酸和脯氨酸。
所述SEQ ID No.6是與SEQ ID No.2所示氨基酸序列有至少95%序列同源性的氨基酸序列,且對應于SEQ ID No.2所示氨基酸序列中的第54位、第55位、第117位、第161位和第215位分別為酪氨酸、絲氨酸、丙氨酸、亮氨酸和脯氨酸。
所述SEQ ID No.8是與SEQ ID No.2所示氨基酸序列有至少95%序列同源性的氨基酸序列,且對應于SEQ ID No.2所示氨基酸序列中的第54位、第55位、第58位、第117位、第126位、第142位、第144位、第161位、第207位和第215位分別為酪氨酸、絲氨酸、丙氨酸、丙氨酸、脯氨酸、絲氨酸、半胱氨酸、亮氨酸、半胱氨酸和脯氨酸。
在本發明的一個具體實施例中,所述的改進的轉氨酶的氨基酸序列為SEQ ID No.4。
在本發明的一個具體實施例中,該改進的轉氨酶的酶活性是所述野生型轉氨酶酶活性的至少2倍。
本發明第二方面提供了編碼上述改進轉氨酶的基因,其包含與SEQ ID No.1所示的核苷酸序列有至少95%序列同源性的核苷酸序列。
所述改進的轉氨酶的編碼基因的核苷酸序列可選自SEQ ID No.3、SEQ ID No.5和SEQ ID No.7.
在本發明的一個具體實施例中,該改進的轉氨酶的編碼基因的核苷酸序列如SEQ ID No.3所示。
本發明第三方面提供了一種基因工程菌,該菌種表達上述改進的轉氨酶。
在本發明的一個具體實施例中,該基因工程菌所使用的表達載體為pET-24a,宿主細胞為大腸桿菌BL21(DE3)。
本發明第四方面提供了一種本發明所述的改進的轉氨酶在催化酮類化合物不對稱轉氨反應生成手性胺化合物中的應用。
上述應用中,所述反應的各條件可按本領域此類反應的常規條件進行選擇,優選如下:
在pH=7-9的緩沖液中,分別添加一定比例的異丙胺、磷酸吡哆醛(PLP)、4-羥基-2-丁酮及本發明所述改進的轉氨酶,在30-40℃下進行不對稱轉氨反應,生成光學活性的(R)-3-氨基丁醇。反應混合液中轉氨酶的濃度為5-10g/L、異丙胺的濃度為60-90g/L、4-羥基-2-丁酮的濃度為25-50g/L、PLP的濃度為0.1-1mM以及緩沖液的濃度為10-100mM。反應時間以反應過程中產物濃度不再增加的時間為準。反應結束后,可按本領域常規方法從反應液中提取產物(R)-3-氨基丁醇。
所述改進的轉氨酶由基因工程菌發酵得到,以酶粉、轉氨酶的細胞破碎液或者含酮還原酶的菌體細胞的形式加入,優選以酶粉形式加入。
在本發明的一個具體實施例中,轉氨酶酶粉可采用本領域常規的分子生物學、超聲破碎及真空冷凍干燥方法制得。
與現有技術相比,本發明提供了一種催化活性高、對映選擇性強、底物耐受性好的改進的轉氨酶,以及利用該轉氨酶催化合成(R)-3-氨基丁醇的方法。該方法反應條件溫和,產物手性純度及收率均較高,同時底物濃度高達50g/L,大大提高了(R)-3-氨基丁醇的制備效率,降低其生產成本,具有較好的工業應用前景。
附圖說明
圖1為本發明實施例1中突變基因融合PCR產物的瓊脂糖凝膠電泳圖;
圖2為本發明實施例3中表達AtATmut轉氨酶細胞破碎沉淀和上清液的聚丙烯酰胺凝膠電泳圖。A為破碎沉淀,B為破碎上清液。
具體實施方式
下面結合具體實施例對本發明的技術內容作進一步的闡述,其目的是為了更好的理解本發明的內容,但本發明的保護范圍不限于此。
實施例1 轉氨酶突變體庫的構建
全基因合成序列如SEQ ID No.1所示核苷酸,選擇NdeI和HindIII兩個酶切位點插入pET24a表達載體,獲得的重組表達載體命名為pET24a-AtAT。為構建突變體庫,我們設計了以下6條引物,詳見表1:
表1 PCR引物表
以pET24a-AtAT為模板利用上述引物進行PCR擴增,PCR體系為:10×PCR buffer為5uL,2.5mM dNTP為4uL,pfu DNA Polymerse為0.5uL,pET24a-AtAT模板為0.5uL(含DNA模板0.2ug),ddH2O為36uL,分別以表1中AtAT-up上游引物(SEQ ID No.9)與H55-down下游引物(SEQ ID No.12)、H55-up上游引物(SEQ ID No.11)與S215-down下游引物(SEQ ID No.14)、S215-up上游引物(SEQ ID No.13)與AtAT-down下游引物(SEQ ID No.10)各2uL(10umol/L)進行PCR擴增。PCR擴增步驟為:(1)95℃,預變性3min;(2)95℃,變性30s;(3)55℃退火30s;(4)72℃延伸1min;步驟(2)~(4)重復30次;(5)72℃繼續延伸10min,冷卻至4℃。PCR產物經瓊脂糖凝膠電泳純化后回收160、480、320bp左右的目標條帶。以這些PCR產物為模板,反應體系如下:10×PCR buffer為5uL,2.5mM dNTP為4uL,pfu DNA Polymerse為0.5uL,ddH2O為33.5uL,PCR回收片段各1uL,利用AtAT-up上游引物與AtAT-down下游引物各2uL進行PCR擴增,PCR擴增步驟為:(1)95℃,預變性3min;(2)95℃,變性30s;(3)55℃退火30s;(4)72℃延伸70s;步驟(2)~(4)重復30次;(5)72℃繼續延伸10min,冷卻至4℃。PCR產物經瓊脂糖凝膠電泳純化后回收1000bp左右的目標條帶(見圖1),該片段中則包含了具有兩個位點組合突變的所有突變序列。將上述基因片段和載體pET-24a質粒分別進行酶切反應(NdeI和HindIII,37℃酶切1h),酶切產物切膠回收后進行連接反應(16℃過夜反應),轉入E.coli BL21(DE3)感受態細胞,通過卡那霉素篩選獲得陽性單克隆。于96孔板中每孔加入LB+卡那霉素培養基0.6mL,每塊96孔板挑選93個陽性克隆和3個BL21(DE3)/pET24a-AtAT作為對照,共挑取6塊96孔板,在37℃搖床中震蕩培養16h,此即為突變體庫。
實施例2 轉氨酶突變體的表達及篩選
將培養過夜的突變體庫每孔取100uL菌液接種入一個新的96孔板,該板每孔內含新鮮LB+卡那霉素培養基1mL,在37℃條件下搖床培養至OD600值達到0.8~1.0,隨后加入IPTG至終濃度為1.0mM,于25℃誘導培養20小時左右,離心棄上清,收集菌體。每孔加入400uL反應液,其中包括:20g/L的底物4-羥基-2-丁酮,60g/L的異丙胺,1mM的輔酶PLP,100mM磷酸鉀緩沖液(pH=8.0),于30℃搖床振蕩反應24h后,每孔加入10M NaOH調節pH>13,加入等體積的乙酸乙酯萃取,離心后,吸取有機層進行GC分析,檢測突變體酶活。GC條件:Agilent 7820A氣相色譜儀;RESTEK(30m*0.25mm*0.25μm)毛細管柱;氫火焰離子化檢測器;檢測器溫度220℃;進樣口溫度200℃;程序升溫,初始溫度為100℃,10℃/min升至200℃,保持15min;進樣方式為分流進樣,分流比50:1。通過GC檢測獲得一株突變體轉化率>95%,而對照組轉化率<20%。為了從所篩選出表達突變體的細胞中獲得轉氨酶的編碼基因,將其所對應的菌種送測序,測序結果顯示含有SEQ ID No.3所示核苷酸序列,編碼SEQID No.4所示氨基酸序列。該改進的轉氨酶命名為AtATmut,菌種命名為BL21(DE3)/pET24a-AtATmut。
實施例3 AtATmut轉氨酶的表達及酶粉制備
轉接甘油保藏菌種BL21(DE3)/pET24a-AtATmut至5mL含卡那霉素的LB試管培養基中活化培養(37℃培養12h),按1%接種量轉接活化培養物至400mL含卡那霉素的LB液體培養基中,37℃培養OD至0.6-0.8,加入IPTG(終濃度0.1mM)于25℃誘導培養16h。離心收集菌體,用40mL磷酸鹽緩沖液(10mM,pH 7.5)重懸菌體后,于冰水浴中超聲破碎15min,離心收集上清和沉淀,SDS-PAGE檢測顯示AtATmut轉氨酶以部分可溶的形式存在(見圖2),上清液-20℃預凍后真空冷凍干燥48h后碾碎,即得AtATmut轉氨酶酶粉。
實施例4 AtATmut轉氨酶催化4-羥基-2-丁酮的不對稱轉氨反應
于100mL反應容器中加入100mM的磷酸鹽緩沖液(40mL,pH=7.5)和異丙胺(4.5g),用磷酸調節pH至7.5,加入底物4-羥基-2-丁酮(2.5g),攪拌均勻后加入AtATmut酶粉(0.25g)和輔酶PLP(13.25mg),定容至50mL,35℃下磁力攪拌敞口反應,反應過程中用異丙胺(4M)控制反應pH在7.5左右,TLC檢測反應進程。反應結束后80℃保溫2h使反應液中蛋白質變性,過濾去除蛋白質,加NaOH(10M)調節pH=13,等體積乙酸乙酯萃取三次,合并有機相,無水硫酸鈉干燥,減壓蒸餾獲得(R)-3-氨基丁醇(2.3g),產品收率91%。GC檢測轉化率為99%,R型產物ee值為99.5%。
實施例5 AtATmut轉氨酶催化4-羥基-2-丁酮的不對稱轉氨反應
于100mL反應容器中加入10mM的磷酸鹽緩沖液(40mL,pH=9.0)和異丙胺(3.0g),用磷酸調節pH至8.0,加入底物4-羥基-2-丁酮(2.0g),攪拌均勻后加入AtATmut酶粉(0.5g)和輔酶PLP(13.25mg),定容至50mL,40℃下磁力攪拌敞口反應,反應過程中用異丙胺(4M)控制反應pH在8.0左右,TLC檢測反應進程。反應結束后80℃保溫2h使反應液中蛋白質變性,過濾去除蛋白質,加NaOH(10M)調節pH=13,等體積乙酸乙酯萃取三次,合并有機相,無水硫酸鈉干燥,減壓蒸餾獲得(R)-3-氨基丁醇(1.93g),產品收率90%。GC檢測轉化率為99%,R型產物ee值為99.5%。
實施例6 AtATmut轉氨酶催化4-羥基-2-丁酮的不對稱轉氨反應
于100mL反應容器中加入10mM的磷酸鹽緩沖液(40mL,pH=7.0)和異丙胺(3.0g),用磷酸調節pH至7.0,加入底物4-羥基-2-丁酮(1.25g),攪拌均勻后加入AtATmut酶粉(0.5g)和輔酶PLP(1.325mg),定容至50mL,30℃下磁力攪拌敞口反應,反應過程中用異丙胺(4M)控制反應pH在7.0左右,TLC檢測反應進程。反應結束后80℃保溫2h使反應液中蛋白質變性,過濾去除蛋白質,加NaOH(10M)調節pH=13,等體積乙酸乙酯萃取三次,合并有機相,無水硫酸鈉干燥,減壓蒸餾獲得(R)-3-氨基丁醇(1.15g),產品收率92%。GC檢測轉化率為99%,R型產物ee值為99.5%。
SEQUENCE LISTING
<110> 尚科生物醫藥(上海)有限公司
<120> 一種改進的轉氨酶及其在(R)-3-氨基丁醇制備上的應用
<160> 14
<170> PatentIn version 3.3
<210> 1
<211> 978
<212> DNA
<213> 人工序列
<400> 1
atggcttcta tggacaaagt tttcgctggt tacgctgctc gtcaggctat cctggaatct 60
accgaaacca ccaacccgtt cgctaaaggt atcgcttggg ttgaaggtga actggttccg 120
ctggctgaag ctcgtatccc gctgctggac cagggtttca tgcactctga cctgacctac 180
gacgttccct ctgtgtggga cgggaggttc ttccgtctgg acgaccacat cacccgtctg 240
gaagctagtt gcaccaaact gcgtctgcgt ctgccgctgc cgcgtgacca ggttaaacag 300
atcctggttg aaatggttgc taaatctggt atccgtgacg ctttcgttga actgatcgtt 360
acccgtggtc tgaaaggtgt tcgtggtacc cgtccggaag acatcgttaa caacctgtac 420
atgttcgttc agccatacgt gtgggtcatg gaaccggaca tgcagcgtgt tggtggttct 480
gctgttgttg ctcgtaccgt tcgtcgtgtt ccgccgggtg ctatcgaccc gaccgttaaa 540
aacctgcagt ggggtgacct ggttcgtggt atgttcgaag ctgctgaccg tggtgctacc 600
tacccgttcc tgaccgacgg tgacgctcac ctgaccgaag gttctggttt caacatcgtt 660
ctggttaaag acggtgttct gtacaccccg gaccgtggtg ttctgcaggg tgttacccgt 720
aaatctgtta tcaacgctgc tgaagcgttc ggtatcgaag ttcgtgttga attcgttccg 780
gttgaactgg cttaccgttg cgacgaaatc ttcatgtgca ccaccgctgg tggtatcatg 840
ccgatcacca ccctggacgg tatgccggtt aacggtggtc agatcggtcc gatcaccaaa 900
aaaatctggg acggttactg ggctatgcac tacgacgctg cttactcttt cgaaatcgac 960
tacaacgaac gtaactaa 978
<210> 2
<211> 325
<212> PRT
<213> 人工序列
<400> 2
Met Ala Ser Met Asp Lys Val Phe Ala Gly Tyr Ala Ala Arg Gln Ala
1 5 10 15
Ile Leu Glu Ser Thr Glu Thr Thr Asn Pro Phe Ala Lys Gly Ile Ala
20 25 30
Trp Val Glu Gly Glu Leu Val Pro Leu Ala Glu Ala Arg Ile Pro Leu
35 40 45
Leu Asp Gln Gly Phe Met His Ser Asp Leu Thr Tyr Asp Val Pro Ser
50 55 60
Val Trp Asp Gly Arg Phe Phe Arg Leu Asp Asp His Ile Thr Arg Leu
65 70 75 80
Glu Ala Ser Cys Thr Lys Leu Arg Leu Arg Leu Pro Leu Pro Arg Asp
85 90 95
Gln Val Lys Gln Ile Leu Val Glu Met Val Ala Lys Ser Gly Ile Arg
100 105 110
Asp Ala Phe Val Glu Leu Ile Val Thr Arg Gly Leu Lys Gly Val Arg
115 120 125
Gly Thr Arg Pro Glu Asp Ile Val Asn Asn Leu Tyr Met Phe Val Gln
130 135 140
Pro Tyr Val Trp Val Met Glu Pro Asp Met Gln Arg Val Gly Gly Ser
145 150 155 160
Ala Val Val Ala Arg Thr Val Arg Arg Val Pro Pro Gly Ala Ile Asp
165 170 175
Pro Thr Val Lys Asn Leu Gln Trp Gly Asp Leu Val Arg Gly Met Phe
180 185 190
Glu Ala Ala Asp Arg Gly Ala Thr Tyr Pro Phe Leu Thr Asp Gly Asp
195 200 205
Ala His Leu Thr Glu Gly Ser Gly Phe Asn Ile Val Leu Val Lys Asp
210 215 220
Gly Val Leu Tyr Thr Pro Asp Arg Gly Val Leu Gln Gly Val Thr Arg
225 230 235 240
Lys Ser Val Ile Asn Ala Ala Glu Ala Phe Gly Ile Glu Val Arg Val
245 250 255
Glu Phe Val Pro Val Glu Leu Ala Tyr Arg Cys Asp Glu Ile Phe Met
260 265 270
Cys Thr Thr Ala Gly Gly Ile Met Pro Ile Thr Thr Leu Asp Gly Met
275 280 285
Pro Val Asn Gly Gly Gln Ile Gly Pro Ile Thr Lys Lys Ile Trp Asp
290 295 300
Gly Tyr Trp Ala Met His Tyr Asp Ala Ala Tyr Ser Phe Glu Ile Asp
305 310 315 320
Tyr Asn Glu Arg Asn
325
<210> 3
<211> 978
<212> DNA
<213> 人工序列
<400> 3
atggcttcta tggacaaagt tttcgctggt tacgctgctc gtcaggctat cctggaatct 60
accgaaacca ccaacccgtt cgctaaaggt atcgcttggg ttgaaggtga actggttccg 120
ctggctgaag ctcgtatccc gctgctggac cagggtttca tggcgtctga cctgacctac 180
gacgttccct ctgtgtggga cgggaggttc ttccgtctgg acgaccacat cacccgtctg 240
gaagctagtt gcaccaaact gcgtctgcgt ctgccgctgc cgcgtgacca ggttaaacag 300
atcctggttg aaatggttgc taaatctggt atccgtgacg ctttcgttga actgatcgtt 360
acccgtggtc tgaaaggtgt tcgtggtacc cgtccggaag acatcgttaa caacctgtac 420
atgttcgttc agccatacgt gtgggtcatg gaaccggaca tgcagcgtgt tggtggttct 480
gctgttgttg ctcgtaccgt tcgtcgtgtt ccgccgggtg ctatcgaccc gaccgttaaa 540
aacctgcagt ggggtgacct ggttcgtggt atgttcgaag ctgctgaccg tggtgctacc 600
tacccgttcc tgaccgacgg tgacgctcac ctgaccgaag gtcctggttt caacatcgtt 660
ctggttaaag acggtgttct gtacaccccg gaccgtggtg ttctgcaggg tgttacccgt 720
aaatctgtta tcaacgctgc tgaagcgttc ggtatcgaag ttcgtgttga attcgttccg 780
gttgaactgg cttaccgttg cgacgaaatc ttcatgtgca ccaccgctgg tggtatcatg 840
ccgatcacca ccctggacgg tatgccggtt aacggtggtc agatcggtcc gatcaccaaa 900
aaaatctggg acggttactg ggctatgcac tacgacgctg cttactcttt cgaaatcgac 960
tacaacgaac gtaactaa 978
<210> 4
<211> 325
<212> PRT
<213> 人工序列
<400> 4
Met Ala Ser Met Asp Lys Val Phe Ala Gly Tyr Ala Ala Arg Gln Ala
1 5 10 15
Ile Leu Glu Ser Thr Glu Thr Thr Asn Pro Phe Ala Lys Gly Ile Ala
20 25 30
Trp Val Glu Gly Glu Leu Val Pro Leu Ala Glu Ala Arg Ile Pro Leu
35 40 45
Leu Asp Gln Gly Phe Met Ala Ser Asp Leu Thr Tyr Asp Val Pro Ser
50 55 60
Val Trp Asp Gly Arg Phe Phe Arg Leu Asp Asp His Ile Thr Arg Leu
65 70 75 80
Glu Ala Ser Cys Thr Lys Leu Arg Leu Arg Leu Pro Leu Pro Arg Asp
85 90 95
Gln Val Lys Gln Ile Leu Val Glu Met Val Ala Lys Ser Gly Ile Arg
100 105 110
Asp Ala Phe Val Glu Leu Ile Val Thr Arg Gly Leu Lys Gly Val Arg
115 120 125
Gly Thr Arg Pro Glu Asp Ile Val Asn Asn Leu Tyr Met Phe Val Gln
130 135 140
Pro Tyr Val Trp Val Met Glu Pro Asp Met Gln Arg Val Gly Gly Ser
145 150 155 160
Ala Val Val Ala Arg Thr Val Arg Arg Val Pro Pro Gly Ala Ile Asp
165 170 175
Pro Thr Val Lys Asn Leu Gln Trp Gly Asp Leu Val Arg Gly Met Phe
180 185 190
Glu Ala Ala Asp Arg Gly Ala Thr Tyr Pro Phe Leu Thr Asp Gly Asp
195 200 205
Ala His Leu Thr Glu Gly Pro Gly Phe Asn Ile Val Leu Val Lys Asp
210 215 220
Gly Val Leu Tyr Thr Pro Asp Arg Gly Val Leu Gln Gly Val Thr Arg
225 230 235 240
Lys Ser Val Ile Asn Ala Ala Glu Ala Phe Gly Ile Glu Val Arg Val
245 250 255
Glu Phe Val Pro Val Glu Leu Ala Tyr Arg Cys Asp Glu Ile Phe Met
260 265 270
Cys Thr Thr Ala Gly Gly Ile Met Pro Ile Thr Thr Leu Asp Gly Met
275 280 285
Pro Val Asn Gly Gly Gln Ile Gly Pro Ile Thr Lys Lys Ile Trp Asp
290 295 300
Gly Tyr Trp Ala Met His Tyr Asp Ala Ala Tyr Ser Phe Glu Ile Asp
305 310 315 320
Tyr Asn Glu Arg Asn
325
<210> 5
<211> 978
<212> DNA
<213> 人工序列
<400> 5
atggcttcta tggacaaagt tttcgctggt tacgctgctc gtcaggctat cctggaatct 60
accgaaacca ccaacccgtt cgctaaaggt atcgcttggg ttgaaggtga actggttccg 120
ctggctgaag ctcgtatccc gctgctggac cagggtttct actcttctga cctgacctac 180
gacgttccct ctgtgtggga cgggaggttc ttccgtctgg acgaccacat cacccgtctg 240
gaagctagtt gcaccaaact gcgtctgcgt ctgccgctgc cgcgtgacca ggttaaacag 300
atcctggttg aaatggttgc taaatctggt atccgtgacg ctttcgttgc tctgatcgtt 360
acccgtggtc tgaaaggtgt tcgtggtacc cgtccggaag acatcgttaa caacctgtac 420
atgttcgttc agccatacgt gtgggtcatg gaaccggaca tgcagcgtgt tggtggttct 480
ctggttgttg ctcgtaccgt tcgtcgtgtt ccgccgggtg ctatcgaccc gaccgttaaa 540
aacctgcagt ggggtgacct ggttcgtggt atgttcgaag ctgctgaccg tggtgctacc 600
tacccgttcc tgaccgacgg tgacgctcac ctgaccgaag gtccgggttt caacatcgtt 660
ctggttaaag acggtgttct gtacaccccg gaccgtggtg ttctgcaggg tgttacccgt 720
aaatctgtta tcaacgctgc tgaagcgttc ggtatcgaag ttcgtgttga attcgttccg 780
gttgaactgg cttaccgttg cgacgaaatc ttcatgtgca ccaccgctgg tggtatcatg 840
ccgatcacca ccctggacgg tatgccggtt aacggtggtc agatcggtcc gatcaccaaa 900
aaaatctggg acggttactg ggctatgcac tacgacgctg cttactcttt cgaaatcgac 960
tacaacgaac gtaactaa 978
<210> 6
<211> 325
<212> PRT
<213> 人工序列
<400> 6
Met Ala Ser Met Asp Lys Val Phe Ala Gly Tyr Ala Ala Arg Gln Ala
1 5 10 15
Ile Leu Glu Ser Thr Glu Thr Thr Asn Pro Phe Ala Lys Gly Ile Ala
20 25 30
Trp Val Glu Gly Glu Leu Val Pro Leu Ala Glu Ala Arg Ile Pro Leu
35 40 45
Leu Asp Gln Gly Phe Tyr Ser Ser Asp Leu Thr Tyr Asp Val Pro Ser
50 55 60
Val Trp Asp Gly Arg Phe Phe Arg Leu Asp Asp His Ile Thr Arg Leu
65 70 75 80
Glu Ala Ser Cys Thr Lys Leu Arg Leu Arg Leu Pro Leu Pro Arg Asp
85 90 95
Gln Val Lys Gln Ile Leu Val Glu Met Val Ala Lys Ser Gly Ile Arg
100 105 110
Asp Ala Phe Val Ala Leu Ile Val Thr Arg Gly Leu Lys Gly Val Arg
115 120 125
Gly Thr Arg Pro Glu Asp Ile Val Asn Asn Leu Tyr Met Phe Val Gln
130 135 140
Pro Tyr Val Trp Val Met Glu Pro Asp Met Gln Arg Val Gly Gly Ser
145 150 155 160
Leu Val Val Ala Arg Thr Val Arg Arg Val Pro Pro Gly Ala Ile Asp
165 170 175
Pro Thr Val Lys Asn Leu Gln Trp Gly Asp Leu Val Arg Gly Met Phe
180 185 190
Glu Ala Ala Asp Arg Gly Ala Thr Tyr Pro Phe Leu Thr Asp Gly Asp
195 200 205
Ala His Leu Thr Glu Gly Pro Gly Phe Asn Ile Val Leu Val Lys Asp
210 215 220
Gly Val Leu Tyr Thr Pro Asp Arg Gly Val Leu Gln Gly Val Thr Arg
225 230 235 240
Lys Ser Val Ile Asn Ala Ala Glu Ala Phe Gly Ile Glu Val Arg Val
245 250 255
Glu Phe Val Pro Val Glu Leu Ala Tyr Arg Cys Asp Glu Ile Phe Met
260 265 270
Cys Thr Thr Ala Gly Gly Ile Met Pro Ile Thr Thr Leu Asp Gly Met
275 280 285
Pro Val Asn Gly Gly Gln Ile Gly Pro Ile Thr Lys Lys Ile Trp Asp
290 295 300
Gly Tyr Trp Ala Met His Tyr Asp Ala Ala Tyr Ser Phe Glu Ile Asp
305 310 315 320
Tyr Asn Glu Arg Asn
325
<210> 7
<211> 978
<212> DNA
<213> 人工序列
<400> 7
atggcttcta tggacaaagt tttcgctggt tacgctgctc gtcaggctat cctggaatct 60
accgaaacca ccaacccgtt cgctaaaggt atcgcttggg ttgaaggtga actggttccg 120
ctggctgaag ctcgtatccc gctgctggac cagggtttct actcttctga cgctacctac 180
gacgttccct ctgtgtggga cgggaggttc ttccgtctgg acgaccacat cacccgtctg 240
gaagctagtt gcaccaaact gcgtctgcgt ctgccgctgc cgcgtgacca ggttaaacag 300
atcctggttg aaatggttgc taaatctggt atccgtgacg ctttcgttgc tctgatcgtt 360
acccgtggtc tgaaaccggt tcgtggtacc cgtccggaag acatcgttaa caacctgtac 420
atgtctgttt gcccatacgt gtgggtcatg gaaccggaca tgcagcgtgt tggtggttct 480
ctggttgttg ctcgtaccgt tcgtcgtgtt ccgccgggtg ctatcgaccc gaccgttaaa 540
aacctgcagt ggggtgacct ggttcgtggt atgttcgaag ctgctgaccg tggtgctacc 600
tacccgttcc tgaccgactg cgacgctcac ctgaccgaag gtccgggttt caacatcgtt 660
ctggttaaag acggtgttct gtacaccccg gaccgtggtg ttctgcaggg tgttacccgt 720
aaatctgtta tcaacgctgc tgaagcgttc ggtatcgaag ttcgtgttga attcgttccg 780
gttgaactgg cttaccgttg cgacgaaatc ttcatgtgca ccaccgctgg tggtatcatg 840
ccgatcacca ccctggacgg tatgccggtt aacggtggtc agatcggtcc gatcaccaaa 900
aaaatctggg acggttactg ggctatgcac tacgacgctg cttactcttt cgaaatcgac 960
tacaacgaac gtaactaa 978
<210> 8
<211> 325
<212> PRT
<213> 人工序列
<400> 8
Met Ala Ser Met Asp Lys Val Phe Ala Gly Tyr Ala Ala Arg Gln Ala
1 5 10 15
Ile Leu Glu Ser Thr Glu Thr Thr Asn Pro Phe Ala Lys Gly Ile Ala
20 25 30
Trp Val Glu Gly Glu Leu Val Pro Leu Ala Glu Ala Arg Ile Pro Leu
35 40 45
Leu Asp Gln Gly Phe Tyr Ser Ser Asp Ala Thr Tyr Asp Val Pro Ser
50 55 60
Val Trp Asp Gly Arg Phe Phe Arg Leu Asp Asp His Ile Thr Arg Leu
65 70 75 80
Glu Ala Ser Cys Thr Lys Leu Arg Leu Arg Leu Pro Leu Pro Arg Asp
85 90 95
Gln Val Lys Gln Ile Leu Val Glu Met Val Ala Lys Ser Gly Ile Arg
100 105 110
Asp Ala Phe Val Ala Leu Ile Val Thr Arg Gly Leu Lys Pro Val Arg
115 120 125
Gly Thr Arg Pro Glu Asp Ile Val Asn Asn Leu Tyr Met Ser Val Cys
130 135 140
Pro Tyr Val Trp Val Met Glu Pro Asp Met Gln Arg Val Gly Gly Ser
145 150 155 160
Leu Val Val Ala Arg Thr Val Arg Arg Val Pro Pro Gly Ala Ile Asp
165 170 175
Pro Thr Val Lys Asn Leu Gln Trp Gly Asp Leu Val Arg Gly Met Phe
180 185 190
Glu Ala Ala Asp Arg Gly Ala Thr Tyr Pro Phe Leu Thr Asp Cys Asp
195 200 205
Ala His Leu Thr Glu Gly Pro Gly Phe Asn Ile Val Leu Val Lys Asp
210 215 220
Gly Val Leu Tyr Thr Pro Asp Arg Gly Val Leu Gln Gly Val Thr Arg
225 230 235 240
Lys Ser Val Ile Asn Ala Ala Glu Ala Phe Gly Ile Glu Val Arg Val
245 250 255
Glu Phe Val Pro Val Glu Leu Ala Tyr Arg Cys Asp Glu Ile Phe Met
260 265 270
Cys Thr Thr Ala Gly Gly Ile Met Pro Ile Thr Thr Leu Asp Gly Met
275 280 285
Pro Val Asn Gly Gly Gln Ile Gly Pro Ile Thr Lys Lys Ile Trp Asp
290 295 300
Gly Tyr Trp Ala Met His Tyr Asp Ala Ala Tyr Ser Phe Glu Ile Asp
305 310 315 320
Tyr Asn Glu Arg Asn
325
<210> 9
<211> 31
<212> DNA
<213> 人工序列
<400> 9
cccaagcttt tagttacgtt cgttgtagtc g 31
<210> 10
<211> 30
<212> DNA
<213> 人工序列
<400> 10
gggaattcca tatggcttct atggacaaag 30
<210> 11
<211> 32
<212> DNA
<213> 人工序列
<400> 11
ctggaccagg gtttcatgvn ctctgacctg ac 32
<210> 12
<211> 29
<212> DNA
<213> 人工序列
<400> 12
cgtaggtcag gtcagagnbc atgaaaccc 29
<210> 13
<211> 30
<212> DNA
<213> 人工序列
<400> 13
tcacctgacc gaaggtnnkg gtttcaacat 30
<210> 14
<211> 29
<212> DNA
<213> 人工序列
<400> 14
gaacgatgtt gaaaccmnna ccttcggtc 29