專利名稱:Gasci基因的制作方法
技術領域:
本發明涉及新基因,更具體涉及位于人食道鱗狀細胞中的染色體p23-24區域的新基因,并通過這些細胞的惡變可觀察到所述基因的擴增和過量的基因產物的表達。
食道癌在全世界癌癥死因中排名第6(Pisani,P.等,Int.J.Cancer,83,18-29(1999))。食道癌組織中所發現的兩個主要組織病理學類型的腫瘤是鱗狀細胞癌和腺癌。鱗狀細胞癌在日本和其他國家一樣是最常見的類型(公共福利白皮書(Public Welfare White Paper)1999)。
已經鑒定出有若干種基因修飾涉及食道鱗狀細胞癌的發生、發展和轉移(包括MYC、EGFR和CCND1的擴增)(Lu,S.H.等,Int.J.Cancer,42,502-505(1988);Jiang,W.等,Cancer Res.,52,2980-2983(1992))。
基于比較基因組雜交技術(CGH;Kallioniemi等,Science,258,818-821(1992))的最新研究已揭示出食道鱗狀細胞癌中至少有10個擴增區域(Pack,S.D.,Genes Chromosomes Cancer,25,160-168(1999);Shinomiya,T.等,Genes Chromosomes Cancer,24,337-344(1999);DuPlessis,L.等,Cancer Res.,59,1877-1883(1999))。然而,在那些被檢測的染色體擴增區域中未鑒定出涉及食道鱗狀細胞癌的基因。
本發明人在29種食道鱗狀細胞癌細胞系中搜索異常DNA拷貝數,結果檢測到數種新的擴增區域。這些擴增區域在染色體區域9p23-24中頻繁出現可得到證實。
另一方面,有報道染色體區域9p23-24中的基因組變化與各種惡性腫瘤相關,如非小細胞肺癌、肝癌、卵巢癌、子宮頸癌、乳腺癌、骨肉瘤以及縱隔B細胞淋巴瘤(Knuutila,S.等,Am.J.Pathol.,152,1107-1123(1998))。
從此報告可推斷出不管什么組織類型在上述染色體區域9p23-24中可發現由于擴增激活一個或幾個基因作為致癌基因起作用的可能性。
在該說明書中,本發明的基因(DNA分子)有時稱為“GASC1基因”,由GASC1基因所編碼的蛋白稱為“GASC1蛋白”,以及此蛋白的功能活性稱為“GASC1活性”。
基于上述研究結果所開發的本發明提供了下列主題(1)-(20)(1)包含下列多核苷酸(a)-(d)中一種的被分離的DNA分子。
(a)編碼由SEQ ID NO1所示的氨基酸序列組成的多肽的多核苷酸;(b)與SEQ ID NO2所示核苷酸序列比較具有至少95%同源性的多核苷酸;(c)在嚴格條件下能與SEQ ID NO2所示的核苷酸序列雜交的多核苷酸;(d)與上述多核苷酸(a)或(b)互補的多核苷酸。
(2)如上(1)所述的被分離的DNA分子,其是編碼由SEQ IDNO1所示的氨基酸序列組成的多肽的多核苷酸。
(3)如上(2)所述的被分離的DNA分子,其具有SEQ ID NO2所示的核苷酸序列。
(4)包含SEQ ID NO1所示的氨基酸序列的表達產物。
(5)包含如上(1)或(3)所述的被分離的DNA分子的重組表達載體。
(6)內含如上(5)所述的重組表達載體的宿主細胞。
(7)一種GASC1檢測用探針,其具有包含來自SEQ ID NO2所示核苷酸序列的至少15個連續核苷酸的序列。
(8)如上(7)所述的GASC1檢測用探針,其具有包含來自SEQ ID NO2所示核苷酸序列的至少30個連續核苷酸的序列。
(9)癌癥診斷劑,其包含如上(7)或(8)所述的探針作為活性成分。
(10)癌癥診斷試劑盒,其包含如上(7)或(8)所述的探針。
(11)抗體或抗體片段,其能與如上(1)所述的被分離的DNA分子的表達產物結合。
(12)診斷癌癥的方法,其包含下列步驟制備生物樣品,制備如上(11)所述的抗體或其片段,以及將上述樣品與上述抗體或片段進行免疫反應并且檢測樣品中的免疫反應產物。
本發明還提供下列主題(13)-(20)
(13)能表達如上(4)所述的表達產物的克隆的cDNA及其等價物,例如,對上述表達產物的修飾進行編碼的cDNA,所述修飾通過在表達產物的氨基酸序列中缺失、替換或添加一個或多個氨基酸殘基而衍生并與上述表達產物具有相同的活性,以及與這種cDNA具有某種水平的同源性的同系物。
(14)一種序列的反義核苷酸,該序列包含來自SEQ ID NO2所示核苷酸序列的至少15個連續核苷酸。
(15)如上(14)所述的反義核苷酸,其反義于一種序列,該序列包含來自SEQ ID NO2所示核苷酸序列的至少30個連續核苷酸。
(16)基因治療劑,其包含如上(14)或(15)所述的反義核苷酸作為活性成分。
(17)(a)包含SEQ ID NO1所示的氨基酸序列的蛋白或(b)包含修飾的氨基酸序列的蛋白,所述修飾的氨基酸序列通過缺失、替換或添加一個或多個氨基酸殘基而衍生自SEQ ID NO1所示的氨基酸序列,所述蛋白在活性上等價于包含SEQ ID NO1所示氨基酸序列的蛋白。
(18)篩選一種或多種物質(激動劑和/或拮抗劑)的方法,所述一種或多種物質能與如上(1)所述的被分離的DNA分子的表達產物相互作用,所述方法包含下列步驟在含有待篩選的測試物質的培養基中對含有如上(1)所述的被分離的DNA分子的宿主細胞進行培養,然后定量如上(1)所述的被分離的DNA分子的表達產物。
(19)如上(1)所述的被分離的DNA分子的同源染色體,其分離自選自人、狗、猴、馬、豬、羊和貓物種的哺乳動物。
(20)用于癌癥的治療劑,其包含有效量的如上(11)所述的抗體或其片段以及可藥用載體。
說明書中氨基酸、肽、核苷酸序列、核酸(核苷酸)等以縮寫表示,與IUPAC-IUB建議的規則、“專利說明書中核苷酸序列和/或氨基酸序列撰寫指南(Guideline for drafting patent specifications etc.relativeto nucleotide sequences and/or amino acid sequences)”(日本專利局編寫)以及本領域中有關密碼或符號用途的慣例一致。
本發明人采用29種食道鱗狀細胞癌細胞系實施了CGH(比較基因組雜交(comparative genomic hybridization)),結果證實在這些細胞系中的染色體區域9p23-24出現了新腫瘤相關的基因。
本發明人還以YAC(酵母人工染色體)和PAC(P1人工染色體)為探針進行了熒光原位雜交(FISH)以及DNA印跡分析,為9p23-24擴增子(擴增區域)繪制基因圖譜。
本發明人進一步進行了RNA印跡分析用于篩選擴增子或其轉錄物中出現的靶基因。以這種方式,本發明人成功克隆了在若干種食道鱗狀細胞癌細胞系中擴增和過量表達的新基因,并因此獲得了GASC1基因的克隆。
在從外科手術切除的腫瘤中建立了食道鱗狀細胞癌細胞系(KYSE系列)的CGH之后,本發明的GASC1基因在染色體區域9p23-24中顯示了高水平的擴增。根據RNA印跡結果,僅IMAGE克隆131865(cDNA克隆含有部分GASC1序列)在9p23-24上表現擴增的細胞系中顯示了過量的表達。
本發明GASC1基因的核苷酸序列的確定按下列程序進行。從胃癌細胞系(HSC39)-衍生的RNA中構建兩個cDNA文庫,使用IMAGE克隆131865作為探針篩選cDNA文庫,然后確定如此分離的陽性克隆的核苷酸序列。
本發明的GASC1基因指定為具有編碼SEQ ID NO1所示的1056個氨基酸殘基的可讀框的基因。
根據由本發明的GASC1基因編碼的氨基酸序列所計算的分子量為120.0kDa。
根據先前報道,在大范圍的人類癌癥包括食道鱗狀細胞癌中都觀察到染色體區域9p中的遺傳改變。基于較早對食道鱗狀細胞癌的分子遺傳學研究的結果,區域9p23-24引人關注。該區域尤其包括編碼細胞周期蛋白依賴的激酶4/6的抑制劑的MTS1(p16/CDKN2A),所述細胞周期蛋白依賴的激酶4/6阻遏地調節增殖細胞的G1/S過渡階段(Tanaka,H.等,Int.J.Cancer,70,437-442(1997))。
使用CGH和FISH(Inazawa,J.等,Jpn J.Cancer Res.,83,1248-1252(1992))的最新研究已表明如同在其他種類的腫瘤中,DNA擴增也經常在食道鱗狀細胞癌中的區域9p23-24中出現(Sonoda,G.等,GenesChromosomes Cancer,20,320-328(1997);Taguchi,T.等,GenesChromosomes Cancer,20,208-212(1997);Giollant,M.等,Hum.Genet.,98,265-270(1996);Fischer,U.等,Eur.J.Cancer,30,1124-1127(1994);Sevelyeva,L.等,Cancer Res.,58,863-866(1998))。
在對上述區域9p23-24中的DNA擴增的各種報道及相關報道中,有下列發現和文獻記載等。
人卵巢癌的CGH分析已揭示出9p21-pter是那些位點之一,其中容易出現拷貝數的增加。該分析的結果還說明九分之一的情況顯示了特異的9p24擴增,并進一步說明上述擴增更傾向于在腫瘤的發展階段頻繁出現(Sonoda,G.等,Genes Chromosomes Cancer,20,320-328(1997))。
在乳腺癌、肺癌、晚期星細胞瘤以及成膠質細胞瘤中也觀察到了9p23-24區域擴增(Taguchi,T.等,Genes Chromosomes Cancer,20,208-212(1997);Giollant,M.等,Hum.Genet.,98,265-270(1996);Fischer,U.等,Eur.J.Cancer,30,1124-1127(1994);Sevelyeva,L.等,Cancer Res.,58,863-866(1998))。
乳腺癌細胞系COLO824顯示DNA拷貝數增加了大約10倍,其出現在p16/CDKN2A終端的9p23-24區域中(Sevelyeva,L.等,CancerRes.,58,863-866(1998))。此外,在患有乳腺癌的三個兄弟中報道了9p23-24區域的豐余以及BRCA2的突變(Sevelyeva,L.等,Cancer Res.,58,863-866(1998))。
考慮這些報告暗示區域9p23-24與多種腫瘤種類有關,并具有至少一種腫瘤相關基因。
GASC1蛋白具有一個PX結構域和兩個PHD指狀結構。
PX結構域以各種蛋白出現。該基元可參與蛋白-蛋白的相互作用(Lock,P.,EMBO J.,17,4346-4357(1998))。然而,其功用仍未得到充分鑒定。
PHD指狀結構是一種鋅指狀序列,已被廣泛發現在與染色質-介導的轉錄調節相關的核蛋白中,如果蠅tr1基因產物和pc1基因產物(Aasland,R.等,Trends Biochem.Sci.,20,56-59(1995))。
近來,轉錄輔激活蛋白TIF1(轉錄中介因子1)、染色質-相關的乙酰基轉移酶MOZ(單核細胞白血病鋅指蛋白)以及若干種含有皮肌炎特異的自身抗原Mi2的含PHD指狀結構蛋白已被鑒定(Venturini,L.等,18,1209-1217(1999);Borrow,J.等,Nat.Gene,14m 33-41(1996);Zhang,Y.,Cell,95,279-289(1998))。
TIF1家族蛋白(α,β,γ)被認為在細胞分化、腫瘤發生以及信號轉導中發揮重要作用(Venturini,L.等,18,1209-1217(1999))。另一方面,在擁有組蛋白脫乙酰基轉移酶和改變核小體活性的復合體中發現了Mi2,并參與了染色質改組。Mi2中的PHD指狀結構似乎要求Mi2和組蛋白脫乙酰基轉移酶的直接相互作用(Zhang,Y.,Cell,95,279-289(1998))。
PHD基元也保留在若干原癌基因中。HRX/ALL1/MLL(HRX人trithorax;ALL急性原淋巴細胞白血病;MLL混合血統白血病)是trx的人同源染色體,經常在兒童的急性淋巴細胞白血病中發生變化(Tkachuk,D.C.等,Cell,71,691-700(1992))。而且,trx的另一人同源染色體MLL2的擴增已在衍生自各種實體組織的腫瘤細胞系中被觀察到(Huntsman,D.G.等,Oncogene,18,7975-7984(1999))。
在乳腺癌中始終如一地被觀察到PLU-1的表達;然而,其表達在正常組織中受到高度限制(Lu,P.等,J.Biol.Chem.,274,15633-15645(1999))。
在來自患有自身免疫疾病如APECED(自身免疫的多內分泌病-白假絲酵母病-外胚層的營養不良)的病人的DNA中已發現AIRE基因的PHD指狀結構內的突變(The Finnish-German APECED Consortium.Nat.Genet.,17,399-403(1997))。
在急性骨髓白血病的情況下,發現MOZ基因與CBP基因融合[t(8;16)(p11;p14)](Borrow,J.等,Nat.Genet.,14,33-41(1996))。已有報道在兒童乳頭狀甲狀腺癌的情況下,RET受體酪氨酸激酶基因與Tif1的融合(Klugbauer,S.,Rabes,H.M.,Oncogene,18,4388-4393(1999))。
具有由本發明GASC1基因編碼推導的氨基酸序列的GASC1蛋白包含兩個PHD指狀結構基元。如上所述,由于PHD指狀結構基元存在于染色質-介導的轉錄區域相關的核蛋白以及許多原癌基因中,因此過量表達的GASC1蛋白被認為在腫瘤發生和/或各種腫瘤包括食道鱗狀細胞癌的發展中發揮重要作用。
進一步,根據以下這些事實即PHD基元存在于許多原癌基因中,經常發現食道鱗狀細胞癌中有9p23-24區域的擴增,具有9p23-24區域擴增的傾向,尤其在腫瘤發展階段是普遍現象,以及如上所述在乳腺癌、肺癌、晚期星細胞瘤以及成膠質細胞瘤中也觀察到了9p23-24區域擴增,可以認為本發明的GASC1基因編碼含PHD基元的GASC1蛋白,在多種腫瘤的發生和發展中發揮著重要作用。
另外,如本發明下文所述,GASC1蛋白與鱗狀細胞癌如食道癌相關,因此依據推測本發明的基因屬于與這些癌癥相關的基因組別。
本發明的基因可調節各種細胞或在其中的增殖、分化、腫瘤發生以及轉錄激活等,并且依據這些活性,其可用于與這些活性相關疾病如惡性腫瘤的病理學解釋、診斷和治療等。
本發明基因的全部或部分可用于生產能夠與基因表達產物(蛋白)結合的抗體或其片段。所得的抗體或其片段可用于診斷本發明基因參與其中的上述疾病。
本發明基因的反義片段及其表達產物可用于控制上述疾病(如腫瘤發生)的發作。
本發明基因的全部或部分還可用作探針。通過使用該探針,診斷癌癥和制備用于癌癥診斷的試劑盒是可能的。
在腫瘤中觀察到本發明基因的擴增和增加表達,因此,本發明基因不僅可用于癌癥診斷中而且可用于判斷癌癥是否是惡性的。
本發明基因另外可用于篩選能夠與GASC1基因或GASC1蛋白相互作用的物質。
本發明基因的例子屬于人癌癥細胞起源。通過使用這種基因,獲得各種哺乳動物包括人的同源基因也是可能的。進一步,利用本發明基因使得鑒定編碼蛋白的基因成為可能,所述蛋白與具有由本發明基因編碼的氨基酸序列的蛋白在其C末端結合。本發明基因下文將詳細描述本發明的基因(DNA分子)。
在本說明書中,術語“基因(DNA分子)”不僅包括雙鏈DNA而且包括其組成的單鏈DNA,不管是有義還是無義,以及其片段。因此,除非另有說明,術語“本發明基因”包括含有人基因組DNA的雙鏈DNA、包括cDNA的單鏈DNA(有義鏈)、具有與有義鏈互補的序列的單鏈DNA(反義鏈)以及它們的片段。
本發明基因可含有前導序列、編碼區、外顯子和內含子。多核苷酸包括RNA和DNA。所述DNA包括cDNA、基因組DNA以及合成DNA。多肽包括其片段、同源物和突變體。突變體包括天然發生的等位基因突變體,非天然存在的突變體,含有通過缺失、替換、添加和/或插入而修飾的氨基酸序列的突變體,以及功能上等同于修飾的氨基酸序列的突變體。
本發明基因的特定例子是從DNA序列中推導出的基因,下文實施例章節中所示的被命名為GASC1的克隆擁有該DNA序列。
在該克隆中摻入的基因(GASC1基因)具有包含3168個核苷酸以及編碼GASC1蛋白的可讀框(SEQ ID NO2所示的核苷酸序列),所述GASC1蛋白含有如SEQ ID NO1所示的1056個氨基酸殘基。從衍生自陽性克隆的單向cDNA序列中,含有上述3168個核苷酸單個可讀框的4235個核苷酸的轉錄物得到確認。在此轉錄物中,翻譯起始的共有序列(“Kozak”規則)是高度保守的,因此,證實了起始密碼位于核苷酸第146-148位。此轉錄物的全長cDNA的核苷酸序列如SEQ ID NO3所示。
從本發明的GASC1基因中推導出的表達產物在其C末端含有兩個PHD指狀結構基元(殘基第687-749和殘基第807-867)和一個PX結構域(殘基第950-1047)。
本發明基因包括具有編碼蛋白的核苷酸序列的DNA分子和這種DNA分子的同源物,所述蛋白具有SEQ ID NO1所示的氨基酸序列。
上述同源物是多核苷酸,其與編碼具有SEQ ID NO1所示氨基酸序列的多肽的多核苷酸比較或與具有SEQ ID NO2所示序列的多核苷酸比較具有至少70%同源性,優選至少90%同源性,更優選至少95%同源性,最優選至少97%同源性。
這些同源基因包括具有核苷酸序列的基因,所述核苷酸序列在嚴格雜交條件下能夠與具有SEQ ID NO2所示序列的核苷酸第238-638位的序列的DNA雜交,所述嚴格雜交條件是在含有0.1% SDS的0.2×SCC中50℃或者在含有0.1%SDS的0.1×SCC中60℃。
具有與本發明基因同源的序列的DNA分子包括一系列相關基因,根據其結構特征、基因表達模式以及生物功能(包括表達產物蛋白的功能)與本發明基因的共同性或相似性,這些相關基因可識別為組成一個基因家族。當然,它們包括GASC1基因的等位基因。
具有序列同源性的DNA分子的特定例子是編碼蛋白的基因,所述蛋白對SEQ ID NO1所示的氨基酸序列進行某種修飾并且與含有那種指定氨基酸序列的蛋白具有相同活性。
“某種修飾”在其意思內包括“一種或若干種氨基酸序列或多種氨基酸殘基的缺失、替換或添加”。氨基酸缺失、替換或添加的范圍和位點不受特別限制,條件是修飾蛋白可充當等同物,其具有與含有SEQ ID NO1所示氨基酸序列的蛋白(GASC1蛋白)相同的GASC1活性。
具體而言,GASC1活性包括調節細胞增殖和分化的能力以及調節腫瘤發生和轉錄激活的能力。
氨基酸序列修飾(突變)可自然發生,例如通過自發突變或轉錄后修飾。根據天然基因(例如人GASC1基因),修飾也可人工誘導。
人工的意思包括例如遺傳工程技術如位點專一誘變[Methods inEnzymology,154,350,367-382(1987);ibid,100,468(1983);NucleicAcids Res.,12,9441(1984);Zoku Seikagaku Jikken Koza(Experiments inBiochemistry,Second Series)1“Idenshi Kenkyuho(Methods in GeneResearch)II”,Japanese Biochemical Society(編),第105頁(1986)],化學合成方法如磷酸三酯法和磷酰胺法(phosphoamidite method)[J.Am.Chem.Soc.,89,4801(1967);同上,91,3350(1969);Science,150,178(1968);Tetrahedron Lett.,22,1859(1981);同上,24,245(1983)]以及這類方法的組合。
更具體而言,DNA可由化學方法如磷酰胺法或磷酸三酯法合成,此合成可在市售的全自動寡核苷酸合成儀上實施。通過在適當條件下合成互補鏈并將這些鏈退火,或通過加入互補鏈利用適當的引物序列和DNA聚合酶,雙鏈片段可從化學合成的單鏈產物中獲得。
本發明基因包括編碼具有GASC1活性的修飾或突變的氨基酸序列的任何基因(修飾基因),不管這類修飾/突變的理由和手段。
編碼此類突變的氨基酸序列的基因包括對氨基酸替換沉默的基因,即基因的核苷酸序列不影響其所編碼的氨基酸序列,以及包括編碼保守替換的氨基酸殘基的密碼的基因。術語“保守替換的氨基酸殘基”是指除原始氨基酸殘基以外的替換的氨基酸殘基,在原始氨基酸殘基替換后,具有原始氨基酸殘基的多肽的活性仍將保留。這類替換的氨基酸殘基與相應的原始氨基酸殘基一起的例子如下顯示。
原始氨基酸殘基 保守替換的氨基酸殘基Ala SerArg LysAsn Gln或HisAsp GluCys SerGln AsnGlu AspGly ProHis Asn或GlnIle Leu或ValLeu Ile或ValLys Arg或GluMet Leu或IlePhe Met、Leu或TyrSer ThrThr SerTrp TyrTyr Trp或PheVal Ile或Leu此外,Cys可被各種氨基酸殘基如Ser、Ala或Val所替換。
在下列情況下,例如,由于組成多肽的氨基酸殘基的替換而產生的多肽一般都可預期較好地修飾其特征。
a)將例如Leu、Ile、Phe、Val或Ala替換成親水殘基如Ser或Thr;b)將任何其他各種氨基酸替換成Cys或Pro;c)將負電荷的氨基酸殘基如Val或Asp替換成帶有正電荷側鏈的氨基酸殘基如Lys、Arg或His;d)將無側鏈的氨基酸殘基如Gly替換成帶有龐大側鏈的氨基酸殘基如Phe。
上述修飾的氨基酸序列具有序列同源性,包括那些在運用FASTA或BLAST程序對其整個氨基酸序列檢索后而揭示出的具有至少約45%,優選至少約50%的同一性水平的氨基酸序列(Clustal,V.,MethodsMol.Biol.,25,307-318(1994))。對于PX結構域和PHD基元結構域來說,還包括顯示至少35%,優選至少45%的同一性水平的氨基酸序列。
本發明基因的特定實施方案是具有SEQ ID NO2所示的核苷酸序列的基因。該核苷酸序列的編碼區代表密碼子的組合的例子,所述密碼子針對SEQ ID NO1所示的氨基酸序列中的各自氨基酸殘基。
本發明基因中密碼子的組合不限于SEQ ID NO2所示的一種。密碼子的任意組合可用于各自的氨基酸殘基。密碼子的選擇可以常規方式進行。例如,參考宿主中密碼子的使用頻率可選擇適當的密碼子備用[Nucleic Acids Res.,9,43(1981)]。本發明基因的生產依據在此公開的本發明基因的序列信息,采用一般的遺傳工程技術[例如分子克隆第二版(Molecular Cloning 2ndEd),Cold Spring HarborLab.Press(1989);Zoku Seikagaku Jikken Koza(Experiments inBiochemistry,Second Series)“Idenshi Kenkyuho(Methods in GeneResearch)I、II、III,Japanese Biochemical Society(ed.),(1986)],可容易地生產和分離本發明基因。
更具體而言,本發明基因的生產方法是從其中表達本發明基因的適當來源中以常規程序制備cDNA文庫,并且使用適當的探針或特異于本發明基因的抗體從該文庫中篩選所需的克隆。
這種生產程序可根據文獻中所述的方法進行實施[例如Proc.Natl.Acad.Sci.,USA.,78,6613(1981);Science,222,778(1983)]。
適合用作cDNA來源的是例如表達本發明基因的各種細胞和組織以及從中衍生的培養細胞。來自這種來源的總RNA的分離、mRNA的分離和純化以及cDNA的獲取和克隆也可以常規方式進行。
此外,市售的cDNA文庫例如從Clotech Lab.公司獲得的各種cDNA文庫可用于本發明基因的生產。
從cDNA文庫生產的本發明基因,其篩選方法沒有特別的限制,可應用常規的方法。
篩選方法的例子包括使用針對由cDNA所產生的蛋白的特異抗體來篩選相應cDNA克隆的免疫篩選方法,使用探針選擇性地與目的DNA序列結合的方法,如噬菌斑雜交方法或菌落雜交方法,以及這些方法的組合。
作為用于上述方法的探針,一般可使用依據本發明基因的核苷酸序列的信息而化學合成的DNA。已獲得的本發明基因或其片段也可有利地用作探針。依據本發明基因的核苷酸信息而設計的有義引物和反義引物可用作篩選的探針。
用作上述探針的核苷酸序列可以是對應于SEQ ID NO2并包含至少15個連續核苷酸,優選20個連續核苷酸,更優選30個連續核苷酸,最優選50個連續核苷酸的部分核苷酸序列。此外,照此具有SEQID NO2所示序列的陽性克隆可用作探針。
在獲得本發明基因中,可有利地使用通過PCR的DNA/RNA擴增[Science,230,1350(1985)]。特別是當全長cDNA幾乎不能從文庫中得到時,可有利地使用RACE方法[cDNA末端的快速擴增(Rapidamplification of cDNA ends);Jikken Igaku(Experimental Medicine),12(6),35(1994)],尤其是5’-RACE方法[M.A.Frohman等,Proc.Natl.Acad.Sci.,USA.,8,8998(1988)]。
用于這些PCR方法中的引物可參考在此公開的本發明基因的序列信息而進行明智的設計,并可通過常規程序而合成。擴增的DNA/RNA的分離和純化可以如上所述的常規方式進行,例如通過凝膠電泳方法。
根據雙脫氧方法[Proc.Natl.Acad.Sci.,USA.,74,5463(1977)]或Maxam和Gilbert方法[Methods in Enzymology,65,499(1980)]或通過市售的測序試劑盒更快速地對如以上述方式獲得的本發明基因或其各種DNA片段進行測序。
本發明基因在單獨或給定組織中的表達或非表達通過使用部分或全部如上述方式獲得的本發明基因的核苷酸序列可特異地進行檢測。
上述檢測可通過常規程序進行,如通過RT-PCR[逆轉錄聚合酶鏈式反應;E.S.Kawasaki等,RNA擴增。PCR方案,方法和應用指南(PCR Protocol,A Guide to Methods and Applications),Academic Press,Inc.,SanDiego,21-27(1991)]的RNA擴增、RNA印跡分析[MolecularCloning,Cold Spring Harbor Lab.(1989)]、通過例如原位RT-PCR[Nucl.Acids Res.,21,3159-3166(1993)]或原位雜交對細胞水平進行測定、NASBA[基于核酸序列的擴增(nucleic acid sequence-basedamplification),Nature,350,91-92(1991)]等。可明智地使用RT-PCR檢測方法。
當選擇PCR方法用于上述檢測時,有待使用的引物可以是僅能導致本發明基因選擇性擴增的任何引物,并依據本發明基因的序列信息可被巧妙地設計和合成。通常,本發明基因的部分序列長度約是10-35個核苷酸,優選約15-30個核苷酸,可用作引物。
因此,本發明基因包括DNA片段,可用作檢測本發明基因的特異引物和/或特異探針。
上述DNA片段可定義成在嚴格條件下能與具有SEQ ID NO2所示核苷酸序列的DNA雜交的DNA。上述的嚴格條件可以是引物或探針在其下使用的普通條件。例如,上述條件即在含有0.1%SDS的0.2×SCC中50℃或者在含有0.1%SDS的0.1×SCC中60℃可被提及。
通過使用本發明基因和常規遺傳工程技術,方便和穩定地大量生產本發明基因的表達產物或含有同樣表達產物的蛋白成為可能。本發明蛋白及其生產本發明進一步提供由本發明基因編碼的蛋白;生產該蛋白的載體,例如含有本發明基因的重組表達載體;用該載體轉化的宿主細胞以及生產本發明蛋白的方法,該方法包括培養宿主細胞。
本發明蛋白的特定實施方案是具有SEQ ID NO1所示氨基酸序列的GASC1蛋白。本發明蛋白還包括其任何同系物。所述同系物可以是具有氨基酸序列并保留GASC1活性的蛋白,所述氨基酸序列通過缺失、替換或添加一種或若干種或多種氨基酸而衍生自SEQ ID NO1所示氨基酸序列。同系物的特定例子是SEQ ID NO3所示GASC1基因的同系物的表達產物(GASC1等同基因包括其等位基因)。
另外,本發明的GASC1蛋白的同系物包括具有與GASC1蛋白活性或功能相同的蛋白,所述GASC1蛋白具有SEQ ID NO1所示的氨基酸序列,如同衍生自人、馬、羊、牛、犬、猿、貓和其他哺乳動物物種以及嚙齒動物如大鼠、小鼠和兔。
本發明蛋白可通過常規重組DNA技術[Science,224,1431(1984);Biochem.Biophys.Res.Comm.,130,692(1985);Proc.Natl.Acad.Sci.,USA.,80,5990(1983)]依據如本發明所提供的GASC1基因的序列信息來制備。
更具體而言,本發明蛋白的生產方法如下構建重組DNA(表達載體),其允許在宿主細胞中編碼目的蛋白基因的表達,通過向其中轉導載體轉化宿主細胞,使所得的轉化子生長,以及從培養液中收集蛋白。
宿主細胞可以是任何原核細胞和真核細胞。通常用作原核宿主最多的是大腸桿菌(Escherichia coli)和枯草芽孢桿菌(Bacillus subtilis)等。可有利地使用尤其包括在大腸桿菌K12菌株的大腸桿菌菌株。真核宿主細胞包括脊椎動物細胞和酵母,前者包括猿細胞系COS[Cell,23175(1981)]、中國倉鼠卵巢細胞及其二氫葉酸還原酶-缺陷的細胞[Proc.Natl.Acad.Sci.,USA.,774216(1980)]。后者包括酵母屬的酵母細胞,但這些不是專有的選擇。
當原核細胞用作宿主細胞時,表達質粒的構建方法是使用在宿主細胞中可復制的載體,并在本發明基因的上游添加啟動子和SD(Shine和Dalgarno)序列,以便該基因可在其中表達,以及可有利地采用對起始蛋白合成是必須的起始密碼子(例如ATG)。作為上述載體,經常使用衍生自大腸桿菌的質粒,如pBR322、pBR325、pUC12和pUC13等。然而,這些不是專有的選擇,還可使用各種已知的載體。市售用于大腸桿菌表達系統的載體的例子包括pGEX-4T(AmershamPharmacia Biotech)、pMAL-C2、pMA1-P2(New England Biolabs)、pET-21、pET-21/lacq(Invitrogen)和pBAD/His(Invitrogen)。
作為用于宿主細胞是脊椎動物細胞時的表達載體,準備使用的載體一般在待表達的本發明基因的上游具有啟動子、RNA剪接位點、多腺苷酸化位點和轉錄終止序列。如果需要,該載體可進一步具有復制起點。表達載體的特定例子是具有SV40早期啟動子的pSV2dhfr[Mol.Cell.Biol.,1854(1981)]。除上述載體以外,可使用各種市售的已知載體。市售用于動物細胞表達系統中的載體的例子包括動物細胞的載體,如pEGFP-N、pEGFP-C(Clontech)、pIND(Invitrogen)和pcDNA3.1/His(Invitrogen)等,以及昆蟲細胞的載體,如pFastBac HT(Gibco BRL)、pAcGHLT(PharMingen)、pAc5/V5-His、pMT/V5-His、pMT/Bip/V5-His(全部為Invitrogen)。
pAM82具有酸性磷酸酶基因的啟動子[Proc.Natl.Acad.Sci.,USA.,801(1983)],是酵母細胞用作宿主細胞時表達載體的特定例子。市售酵母細胞的表達載體包括pPICZ(Invitrogen)和pPICZα(Invitrogen)。
啟動子同樣不受到特別限制,本領域已知的任何一個啟動子均可使用。當大腸屬的菌株用作宿主時,可有利地使用色氨酸(trp)啟動子、lpp啟動子、lac啟動子、recA啟動子、PL/PR啟動子等。當宿主是芽孢桿菌屬的菌株時,優選使用SP01啟動子、SP02啟動子、penP啟動子等。當酵母菌株用作宿主時,可有利地使用pH05啟動子、PGK啟動子、GAP啟動子、ADH啟動子等。當宿主細胞是動物細胞時,優選的啟動子包括SV40衍生的啟動子、反轉錄病毒啟動子、金屬硫蛋白啟動子、熱休克啟動子、巨細胞病毒啟動子以及SRα啟動子。這些啟動子可單獨使用,也可它們中的兩個或多個組合使用,例如以連接形式。
作為本發明基因的表達載體,可有利地使用任何常規融合蛋白表達載體。用于表達谷胱甘肽-S-轉移酶(GST)-融合蛋白的pGENX(Promega)就是這種載體的特定的例子。
將所需的重組DNA(表達載體)導入到宿主細胞中的方法以及相關的轉化方法不受特別限制,可使用各種標準化的方法。可將所得的轉化子以常規方式培養,由此本發明的目的蛋白在轉化子的細胞內、細胞外或細胞膜上表達和產生(積累/分泌)。
準備用于上述培養的培養基根據所采用宿主細胞的種類可明智地從各種常規的培養基中選擇,而且培養也可在有利于宿主細胞生長的條件下進行。
如此獲得的本發明的重組蛋白通過各種分離技術利用其物理和/或化學特性可被任選分離和純化,例如[″Seikagaku Data Book(Biochemical Data Book)II″,1175-1259,第一版,第一次印刷,1980年6月23日Tokyo Kagaku Dozin K.K.出版;Biochemistry,25(25),8274(1986);Eur.J.Biochem.,163,313(1987)等]。
上述技術具體包括一些常規方法,如重建處理、用蛋白沉淀劑處理(鹽析方法)、離心、滲透壓休克方法、超聲破碎、超濾、各種類型的層析如分子篩層析(凝膠過濾)、吸附層析、離子交換層析、親和層析和高效液相層析(HPLC)、透析以及這些方法的組合。特別優選的技術是使用柱的親和層析,針對本發明蛋白的特異抗體已偶聯到該柱上。
在設計編碼本發明蛋白的目的基因時,可有利地使用如SEQ IDNO2所示的GASC1基因的核苷酸序列。如果需要,該基因可經適當選擇和變更指定各自氨基酸殘基的密碼子后才被使用。此外,當由GASC1基因編碼的氨基酸序列的任意氨基酸殘基或部分序列通過替換、缺失或添加而必須被修飾時,這些修飾可通過上述的各種方法進行,例如通過位點專一誘變。
根據SEQ ID NO1所示的氨基酸序列通過化學合成的標準方案也可生產本發明蛋白。該方法包括常規合成肽的液相方法和固相方法。
更具體而言,合成肽的方法包括所謂的逐步延伸方法,其中為了鏈延長組成的氨基酸一個接一個地被偶聯,以及片段縮合方法,該方法包括合成片段并將片段偶聯在一起,各片段預先由若干氨基酸所組成。本發明蛋白可通過上述兩種方法的任一種合成。
用于上述肽合成的縮合的方法也可以是一種常規方法,包括疊氮化物方法、混合酸酸酐方法、DCC方法、活性酯方法、氧還方法、DPPA(二苯基磷酰疊氮)方法、DCC+添加劑(1-羥基苯并三噻唑,N-羥基琥珀酰亞胺、N-羥基-5-降冰片烯-2,3-二羧酰亞胺等)方法以及伍德瓦德試劑方法。
這些方法中所用的溶劑也可明智地選自本領域熟知的用于這類肽形成縮合反應的常用溶劑。溶劑的例子包括二甲基甲酰胺(DMF)、二甲亞砜(DMSO)、六甲基磷酰胺、二噁烷、四氫呋喃(THF)、乙酸乙酯等以及它們的混合物。
在進行肽合成反應中,任何不應參與反應的氨基酸或片段肽的羧基可預先被保護,一般采用酯化以低級烷酯的形式,如甲酯、乙酯或叔丁酯,或芳烷酯如苯甲酸酯、對甲氧基苯甲酸酯、對硝基苯甲酸酯等。
關于在其側鏈具有功能基團的任意氨基酸,例如酪氨酸殘基的羥基可預先用例如乙酰基、芐基、芐氧基羰基或叔丁基保護,盡管此種保護不是必不可少的。此外,精氨酸殘基的胍基可用適當的保護基保護,如硝基、甲苯磺酰基、對甲氧基苯磺酰基、亞甲基-2-磺酰基、芐氧基羰基、異龍腦氧基羰基、金剛烷氧基羧基等。
從本發明的被保護的氨基酸、肽或終產物蛋白中消除這些保護性基因的反應也可以常規方式進行,例如通過催化還原或通過使用液氨/鈉、氟化氫、溴化氫、氯化氫、三氟乙酸、乙酸、甲酸、甲磺酸等。
如此生產的本發明蛋白可按需要通過上述各種技術被純化,例如離子交換樹脂層析法、分配色譜法、凝膠層析法、逆流分配法以及肽化學領域中常用的類似方法。抗本發明蛋白的抗體本發明蛋白或其片段可有利地用作制備特異抗體的免疫原。使用該免疫原,可提供所需的抗血清(多克隆抗體)和單克隆抗體。
生產抗體的技術對本領域技術人員來說是眾所周知的,這些常規程序也可用于操作本發明[例如Zoku Seikagaku Jikken Koza(Experiments in Biochemistry,second series)″Men-eki SeikagakuKenkyuho(Methods in Immunobiochemistry)″,edited by JapaneseBiochemical Society(1986)]。
如此得到的抗體通過免疫學技術等可有利地用于本發明蛋白的純化及其測定或鑒定。更具體而言,由于本發明基因的擴增和增加的表達已在癌細胞中得到證實,因此該抗體可用于癌癥診斷或癌癥是否是惡性的判斷。此外,上述抗體可用于生產包含相同抗體作為活性成分的藥品,例如用于癌癥的診斷劑。本發明的藥物組合物本發明進一步提供了藥物組合物,例如用于癌癥的治療劑,其包含針對本發明蛋白的抗體作為活性成分或其片段,以及生產這種組合物或藥劑的方法。
本發明的藥物組合物的制備方法是采用包含有效量的針對本發明蛋白的抗體或其片段和可藥用載體一起(包括稀釋劑)的形式。
根據待制備制劑的用途方式、其劑量形式以及其他因素可適當選擇能用于該藥物組合物(藥物制劑)中的載體。其包括例如稀釋劑或賦形劑如填充劑、體積構件、粘合劑、濕潤劑、崩解劑、表面活性劑和潤滑劑。
最優選的是本發明藥物組合物的制備采用各種成分,這些成分可制成普通的蛋白制劑,如穩定劑、生物殺滅劑、緩沖液、等滲劑、螯合劑、pH控制劑以及表面活性劑。
穩定劑包括例如人血清白蛋白、普通的L-氨基酸、糖或糖類以及纖維素衍生物。這些穩定劑可單獨使用或與表面活性劑等組合使用。特別是與表面活性劑的組合使用可導致活性成分更有效的穩定。
L-氨基酸不受到特別地限制,例如可采用甘氨酸、半胱氨酸和谷氨酸的任一種。
糖不受特別限制,其包括單糖如葡萄糖、甘露糖、半乳糖和果糖,糖醇如甘露醇、肌醇以及木糖醇;二糖如蔗糖、麥芽糖和乳糖;多糖如葡聚糖、羥丙基淀粉、硫酸軟骨素和透明質酸;以及它們的衍生物。
表面活性劑也不受特別限制,離子和非離子的表面活性劑均可被采用。特定的例子是聚乙二醇、山梨聚糖醇烷酯、聚氧乙烯烷基醚、山梨聚糖醇單酰酯以及脂肪酸甘油酯。
可用的纖維素衍生物也不受特別限制,其包括甲基纖維素、乙基纖維素、羥乙基纖維素、羥丙基纖維素、羥丙基甲基纖維素以及羧甲基纖維素鈉。
糖的添加量為每微克(μg)活性成分不少于約0.0001mg,優選在約0.01-約10mg的范圍內。表面活性劑的添加量為每μg活性成分不少于約0.00001mg,優選在約0.0001-約0.01mg的范圍內。人血清白蛋白的添加量為每μg活性成分不少于約0.0001mg,優選在約0.001-約0.1mg的范圍內。氨基酸使用的量為每μg活性成分約0.001-約10mg的范圍內。纖維素衍生物的添加量為每μg活性成分不少于約0.00001mg,優選在約0.001-約0.1mg的范圍內。
本發明的藥物制劑中活性成分的量可不受限制地選自寬的范圍。一般而言,根據藥物制劑的重量其按重量計在約0.00001-約70%的范圍內,優選約0.0001-約5%的范圍內。
本發明的藥物組合物可進一步補充各種添加劑如緩沖液、等滲劑以及螯合劑。緩沖液包括硼酸、磷酸、乙酸、檸檬酸、ε-氨基己酸、谷氨酸和/或其對應鹽(它們的堿金屬或堿土金屬鹽,如鈉鹽、鉀鹽、鈣鹽和鎂鹽)。等滲劑包括氯化鈉、氯化鉀、糖和甘油等。螯合劑包括乙二胺四乙酸鈉和檸檬酸等。
本發明的藥物制劑可采用溶液的形式,或從其衍生的凍干形式,以便儲存。這種凍干制劑可臨時溶解于例如緩沖液中至適當的施用濃度,包括水、生理鹽水等。
包含在藥物制劑及其劑量中的活性成分的量不受特別限制,依據所期望的治療效果、給藥方法、治療期限、患者背景如年齡和性別以及其他因素,可選自寬的范圍。一般而言,活性成分所推薦的常用劑量是每kg體重約0.01μg-約10mg/天,優選約0.1μg-約1mg/天。制劑的施用可每天一次或劑量分開兩次-若干次。用于基因治療的反義寡核苷酸和載體本發明進一步提供能產生具有與細胞內mRNA互補的序列的RNA的反義藥物,從而抑制能夠表達GASC1基因的細胞中GASC1基因的翻譯和表達,以及提供使用該反義藥物對癌癥進行基因治療的方法。
治療的基本原理在于抑制靶GASC1基因的表達。這種表達抑制例如通過下列步驟來實現產生與對應于靶基因的mRNA互補的反義核苷酸,并將同樣的反義核苷酸供給具有靶GASC1基因的癌細胞。該反義核苷酸結合到與擁有核苷酸的靶細胞中的GASC1基因相對應的mRNA上,或插入到靶細胞的DNA雙螺旋中從而形成三鏈。由此,GASC1基因的轉錄或翻譯受到抑制。通過抑制GASC1基因的表達功能,受體細胞/靶細胞中的腫瘤或贅生物的增殖可被抑制。
通過將染色體外地含有核苷酸的載體或質粒引入靶細胞中并在其中保持不變,反義核苷酸可被供給靶細胞。更具體而言,將反義核苷酸插入到從反轉錄病毒、腺病毒或AAV中衍生的載體中,并用所得的載體感染靶癌細胞,由此把反義核苷酸供給靶細胞。在被感染的細胞中,反義核苷酸過量表達從而產生所需的抗腫瘤效應。
在包含將反義核苷酸引入具有GASC1基因的細胞中以抑制GASC1蛋白的表達的基因治療中,對于反義核苷酸來說,沒必要具有與全長的GASC1基因相對應的序列。其可具有對應于編碼上述某些或其他修飾的基因的序列或具有包含部分GASC1基因的序列,條件是保留與GASC1基因表達抑制相同的功用。
既為了將目的基因導入靶細胞又為了染色體外維持該目的基因,可用向其中引入目的基因的起始載體或起源載體對本領域是已知的。任何這些已知的起始載體可用于本發明的操作中。合適的起始載體是例如在USP 5,252,479和PCT國際公開說明書WO 93/07282中公開的載體(pWP-7A、pWP-19、pWU-1、pWP-8A、pWP-21、pRSVL等)或市售的載體pRC/CMV(Invitrogen)。在下文描述的各種病毒載體也是優選的載體。
將目的基因引入這些起始載體中可以常規方式進行。用于給靶細胞提供目的基因的載體或質粒(導入載體)可由如此引入獲得。這些是含有GASC1基因的反義核苷酸拷貝如連接到表達調節元件上的病毒載體或質粒載體,并能在靶細胞中生成反義核苷酸產物。如在上文所述的含有本發明基因的表達載體也可用作導入載體。
作為用于基因治療的導入載體的啟動子序列,那些啟動子對各種疾病中待處理的受侵襲組織是固有的,可優選采用。
例如對于肝臟,其特定的例子是白蛋白、α-胎蛋白、α1-抗胰蛋白酶、運鐵蛋白和運甲狀腺素蛋白的啟動子序列。
對于結腸,碳酸酐酶和癌胚抗原的啟動子序列可如實施例所敘述。
對于子宮和胎盤,雌激素、芳化酶(aromatase)、細胞色素P450、膽固醇側鏈切割酶P450以及17α-羥化酶P450的啟動子序列可如實施例所敘述。
對于前列腺,前列腺抗原、gp91-fox基因以及前列腺特異的激肽釋放酶的啟動子序列可如實施例所敘述。
對于乳腺,erb-B2、erb-B3、β-酪蛋白、β-乳球蛋白以及乳清蛋白的啟動子序列可如實施例所敘述。
對于肺,表面活性物質蛋白C以及尿球蛋白(uroglobulin)的啟動子序列可如實施例所敘述。
對于皮膚,K-14-角蛋白、人角蛋白1或6以及leucline的啟動子序列可如實施例所敘述。
對于大腦,膠質細胞原纖維酸性蛋白、成熟星細胞特異蛋白、髓磷脂堿性蛋白以及酪氨酸羥化酶的啟動子序列可如實施例所敘述。
對于胰腺,絨毛蛋白、胰高血糖素以及朗格漢斯小島淀粉狀蛋白多肽的啟動子序列可如實施例所敘述。
對于甲狀腺,甲狀腺球蛋白和降鈣素的啟動子序列可如實施例所敘述。
對于骨骼,α1膠原蛋白、骨鈣蛋白以及骨唾液酸糖蛋白的啟動子序列可如實施例所敘述。
對于腎臟,腎素、肝臟/骨骼/腎臟堿性磷酸酶以及促紅細胞生成素的啟動子序列可如實施例所敘述。
對于胰腺,淀粉酶和PAP1的啟動子序列可如實施例所敘述。
此外,依據如上文所述的本發明GASC1基因的核苷酸序列的信息,通過標準的遺傳工程技術,可容易地產生和獲得準備用于引入載體生產的反義核苷酸(對應于GASC1基因序列的全部或部分互補序列)。
通過本領域已知的把DNA導入細胞的各種技術,可將這種導入載體轉移到細胞中。其例子是電穿孔、磷酸鈣共沉淀、病毒轉導等。
作為導入載體轉移的結果,用GASC1基因的反義核苷酸轉導或轉染的細胞,如同在分離狀態,也可用作藥物研發的模型系統和抑制癌癥或預防癌癥轉移的治療研究模型。
在基因治療中,通過將該載體局部或全身注射到患者的一個或多個腫瘤部位,上述導入載體可被導入患者的腫瘤細胞中。當全身施用的情況下,其可到達所有腫瘤細胞,包括可能出現在另一部位或其他部位的轉移性腫瘤細胞。一般而言,在以上述方式給藥后,轉導的基因將永久吸收在各個靶腫瘤細胞的染色體中。在不足的情形下,通過周期性地重復給藥可保證目的基因的吸收。基因治療根據本發明,基因治療的方法既包括體內技術也包括離體技術,體內技術包括將用于引入上述反義核苷酸(反義核苷酸導入載體)的物質直接施用給身體,離體技術包括從患者身體中切除一些靶細胞,身體外將基因轉移其中,然后再將細胞返回到身體中。
根據本發明,基因治療的方法也包括基因療法,其包括將GASC1基因的反義核苷酸直接導入細胞中,并利用核酶,這些核酶是剪切RNA鏈的活性分子。
根據本發明,基因治療的藥劑包括含有全部或部分對應于本發明基因的反義核苷酸的基因導入載體或者如通過所述載體的手段而導入的攜帶本發明基因的反義核苷酸的細胞作為活性成分。
根據本發明,用于基因治療的藥劑主要指明在癌癥情況下,雖然其也可用于治療(處理)其他遺傳性疾病中,例如病毒性疾病如AIDS。根據本發明所述的基因治療劑可進一步用于標記基因目的。
在根據本發明所述的基因治療中,反義核苷酸必定要被導入的靶細胞可依據基因治療(處理)的目的明智地選擇。靶細胞不僅包括癌細胞或腫瘤組織,而且包括淋巴細胞、成纖維細胞、肝細胞以及造血細胞等。
在上述基因治療中引入反義核苷酸的方法包括病毒導入技術和非病毒導入技術。
至于病毒導入技術,考慮到GASC1基因的反義核苷酸是正常細胞中表達的外源物質的事實,可提及例如使用反轉錄病毒載體的方法。其他病毒載體也可使用,并包括腺病毒載體、HIV(人免疫缺陷病毒)載體、腺伴隨病毒(AAV)載體、皰疹病毒載體、單純皰疹病毒(HSV)載體以及EB病毒(EBV)載體等。
非病毒導入方法包括下列方法。
·磷酸鈣共沉淀方法;·膜融合脂質體方法;該方法包括通過使含DNA的脂質體與滅活仙臺病毒融合來制備膜融合脂質體,該滅活仙臺病毒通過用紫外線破壞基因制備,直接將該脂質體與細胞膜融合,以及將融合產物導入細胞中[Kato,K.等,J.Biol.Chem.,266,22071-22074(1991)];·包含用金包被質粒DNA并將該DNA通過高壓放電手段物理地導入到細胞中的方法[Yang,N.S.等,Proc.Natl.Acad.Sci.,87,9568-9572(1990)];·裸DNA方法;該方法包括將質粒DNA直接注射到體內器官或腫瘤中[Wolff,J.A.等,Science,247,1465-1467(1990)];·陽離子脂質體方法;該方法包括將包埋在正電荷多層脂質體中的基因導入到細胞中[Yagi,Kunio,Igaku no Ayumi(Advances inMedicine),Vol.175,No.9,635-637(1995)];
·配體-DNA復合體方法;該方法包括將DNA與配體結合,所述配體結合到在靶細胞中表達的受體上,以及施用該結合產物,由此該基因僅被導入到特異的細胞中而不可能被導入到其他細胞中[Frindeis等,Trends Biotechnol.,11,202(1993);Miller等,FASEB J.,9,190(1995)]。
上述的配體-DNA復合體方法包括以唾液酸糖蛋白作為配體和例如以肝細胞中表達的唾液酸糖蛋白受體作為靶子的方法[Wu等,J.Biol.Chem.,266,14338(1991);Ferkol等,FASEB J.,7,1081-1091(1993)],以及包括以運鐵蛋白作為配體和以由腫瘤細胞強表達的運鐵蛋白受體作為靶子的方法[Wagner等,Proc.Natl.Acad.Sci.,USA,87,3410(1990)]等。
基因導入或轉移方法可存在于一種或多種生物的和/或如上述的一種或多種物理的基因轉移方法適當的組合。在這種組合的例子中,具有一定大小的質粒DNA與特異于腺病毒六鄰體蛋白的聚賴氨酸-結合的抗體相組合。根據此方法,抗體復合體偶聯到腺病毒載體上,因此,通過用如此獲得的三分子復合體感染細胞來實施反義核苷酸導入成為可能。在偶聯到腺病毒載體上的DNA受到損傷之前,該方法使得有效結合、整合和核內體分解。病毒載體構建和基因轉移方法構建用于反義核苷酸轉移的病毒載體的方法以及用于將反義核苷酸轉移至靶細胞或靶組織上的方法現在具體描述。
反轉錄病毒載體系統由病毒載體和輔助細胞(包裝細胞)組成。輔助細胞指一種細胞已預先表達了編碼反轉錄病毒的結構蛋白gag(病毒顆粒內的結構蛋白)、pol(反轉錄酶)、env(外殼蛋白)等的基因,但還未形成病毒顆粒。另一方面,病毒載體具有包裝信號和LTR(長末端重復序列),但缺乏病毒復制必需的結構基因,如gag、pol、env等。包裝信號是病毒顆粒的組裝中作為尾起作用的序列。將連接在克隆位點中的選擇性基因(neo、hyg)和目的反義核苷酸(GASC1基因的反義核苷酸的全部或片段)插入以代替病毒基因。為了能獲得高效價的病毒顆粒,重要的是使用盡可能短的插入,提供廣的包裝信號,所述包裝信號包括部分gag基因,并小心使用不遺留gag基因的ATG。
當內含目的GASC1基因的反義核苷酸的載體DNA被轉移給輔助細胞時,載體基因組RNA被輔助細胞所形成的病毒結構蛋白包裝,由此病毒顆粒形成并分泌。病毒顆粒作為重組病毒感染靶細胞,結果使從病毒基因組RNA中反轉錄的DNA序列整合到細胞核中,因而插入到載體中的反義基因表達。
還有可能采用含有細胞粘著結構域、肝素結合位點和結合區段的纖連蛋白片段的技術[Hanenberg,H.等,Exp.Hemat.,23,747(1995)],為增強目的基因轉移的效率。
用于上述反轉錄病毒載體系統中的反轉錄病毒載體的例子是衍生自小鼠白血病病毒的反轉錄病毒[McLachlin,J.R.等,Proc.Natl.Acad.Res.Molec.Biol.,38,91-135(1990)]。
利用腺病毒載體的方法現在詳細描述。根據由Berkner[Berkner,K.L.,Curr.Topics Microbiol.Immunol.,158,39-66(1992)]、YasuhiroSetoguchi等[Setoguchi,Y.等,Blood,84,2946-2953(1994)]、HiromiKanegae等[Kanegae,H.等,Jikken Igaku(Experimental Medicine),12,28-34(1994)]和Ketner等[Ketner,G.等,Proc.Natl.Acad.Sci.,USA.,91,6186-6190(1994)]描述的方法,可構建腺病毒載體。
非增殖性腺病毒載體的構建可按下列方式進行。因此,腺病毒的早期基因區域E1和/或E3首先被切除。然后,將含有所需外源基因表達單位(表達單位由下列成員組成待轉移的反義核苷酸,即GASC1基因的反義核苷酸;轉錄所述反義核苷酸的啟動子;確保被轉錄基因穩定性的聚腺苷酸(Poly A))和部分腺病毒基因組DNA的質粒載體和含有腺病毒基因組的質粒用于共轉染例如293細胞。當它們之間導致發生同源性重組以取代E1的基因表達單位時,非增殖性腺病毒載體作為內含目的GASC1基因的反義核苷酸的載體得到并適合用于根據本發明的基因治療。加有末端蛋白的3’-端腺病毒載體也可通過連接粘粒載體中的腺病毒基因組DNA而構建。此外,YAC載體也可用于重組腺病毒載體的構建。
現在簡述腺伴隨病毒(AAV)載體的產生。據發現AAV是污染了腺病毒培養系統的小病毒。關于該病毒,細小病毒屬(Parvovirus)和依賴病毒屬(Dependovirus)的存在已得到鑒定,對于病毒復制,細小病毒屬能在宿主細胞內自主增殖而無需要求輔助病毒,而依賴病毒屬需要輔助病毒。該AAV具有廣泛的宿主范圍,是感染各種細胞的普通病毒之一。該病毒基因組是線性單鏈DNA,由4680個核苷酸組成,在其兩端帶有145個核苷酸,具有已知為ITR(末端反向重復序列)的特征序列。該ITR區域起著復制起點的作用并具有引物的作用。該ITR對包裝病毒顆粒和將AAV整合到宿主細胞的染色體DNA中也是必需的。關于病毒蛋白,基因組的左半部分編碼非結構蛋白,這是調節蛋白Rep,控制復制和轉錄。
利用AAV整合到染色體DNA中的特性可進行重組AAV的構建,由此能制備目的基因轉移載體。更具體而言,該方法包括首先構建在野生型AVV的5′-和3′-端保留ITR并內含待轉移如介入其中的反義核苷酸(GASC1反義核苷酸)的質粒(AAV載體質粒)。另一方面,對病毒復制和病毒顆粒形成必需的病毒蛋白從分開的輔助質粒中提供。必須保證沒有共有的核苷酸存在于兩個質粒之間,因此野生型病毒將不出現在DNA重組上。所以,通過轉染將兩個質粒轉移到例如293細胞中,而且進一步用腺病毒作為輔助病毒感染細胞(當采用293細胞時,該腺病毒可以是非增殖性病毒),從而生產所需的非增殖性重組AAV。由于該重組AAV存在于細胞核中,然后將細胞進行凍融和回收,并在56℃加熱使摻雜的腺病毒滅活。另外,如果需要,通過使用氯化銫超速離心分離和濃縮重組AAV。以此方式,可獲得用于基因轉移的所需重組AAV。
EBV載體的生產可例如通過Shimidzu等的方法[Shimidzu,N.等,Saibo Kogaku(Cell Technology),14(3),280-287(1995)]進行。
用于轉移反義核苷酸的EBV載體的生產現在簡要描述。
EB病毒(埃巴二氏病毒EBV)是單純皰疹病毒屬家族的病毒,其首先由Epstein和其同事從衍生自非洲淋巴瘤的培養細胞中分離[Kieff,E.和Liebowitz,D.Virology,2nded.Raven Press,New York,1990,pp.1889-1920]。該EBV具有細胞轉化活性,為了將其用作基因轉移載體,有必要制備缺少這種轉化活性的病毒。可如下完成此項行為。
因此,首先將鄰近靶DNA的EBV基因組克隆,在所述靶DNA中所需外源基因將要插入。然后,將外源基因的DNA片段和藥物抗性基因插入其中,從而構建用于制備重組病毒的載體。接著,將用于重組病毒構建的載體用適當的限制酶切除后轉染到EBV陽性的Akata細胞中。通過抗表面免疫球蛋白處理刺激病毒生產,把由同源重組形成的重組病毒與野生型Akata EBV一起回收。重組病毒感染到EBV陰性Akata細胞,在藥物存在下選擇抗藥物的克隆子,由此可獲得僅有重組病毒感染而不含野生型EBV的Akata細胞。進一步,通過在重組病毒感染的Akata細胞中誘導病毒活性,目的重組病毒載體可大量生產。
無需使用任何重組病毒載體就能將所需反義核苷酸導入靶細胞中的非病毒載體可通過基因轉移方法例如使用膜融合脂質體來生產。該方法是將脂質體內容物通過與細胞膜的融合活性直接導入細胞,如同給定的是膜脂質體(具有脂雙層的小細胞器)。
例如通過Nakanishi等的方法[Nakanishi,M.等,Exp.Cell.Res.,159,399-499(1985);Nakanishi,M.等,Gene introduction into animal tissues.InTrends and Future Perspectives in Peptide and Protein Drug Delivery(ed.by Lee,V.H.等).Harwood Academic Publishers GmbH,Amsterdam,1995,pp.337-349],利用上述膜融合脂質體可進行反義核苷酸的導入。
通過利用上述膜融合脂質體導入反義核苷酸的方法下文簡要描述。
將其基因用紫外線滅活后的仙臺病毒和包括所需反義核苷酸和高分子物質如表達蛋白的脂質體在37℃下融合在一起。膜融合脂質體具有一種結構,其也稱為假病毒,其內部有脂質體衍生的腔,其外部有同樣的刺突作為病毒被膜。通過蔗糖密度梯度離心進一步純化膜融合脂質體,然后允許37℃下吸附在靶培養細胞或組織細胞上。然后,將溫度提升到37℃,當脂質體內容物導入細胞后,所需的反義核苷酸就可導入到靶細胞中。在此制備脂質體所用的脂成分由50%(摩爾比率)膽固醇、卵磷脂和帶負電荷的合成磷脂組成,并且優選制備和使用具有直徑為300nm的單層脂質體。
使用脂質體將反義核苷酸導入靶細胞中的另一方法是使用陽離子脂質體的反義核苷酸導入方法。該方法按照Yagi等的方法[Yagi,K.等,B.B.R.C.,196,1042-1048(1993)]進行。留意質粒和細胞是負電荷的事實,該方法包括脂質體膜的內外兩面均帶正電荷,由此憑借靜電引力增加質粒的吸收并增強其與細胞的相互作用。作為在此待用的脂質體有用的是陽性電荷的多層大泡(MLV)。然而利用大的單層小泡(LUV)或小的單層小泡(SUV)并用質粒制備其合成物也是可能實現目的反義核苷酸的導入。
制備含質粒的陽離子的MLV的方法現在簡要描述。首先制備以1∶2∶2摩爾比率含有脂TMAG(N-(α-三甲基銨基乙酰基)雙十二烷基D-谷氨酸氯化物)、DLPC(二月桂酰磷脂酰膽堿)和DOPE(二油酰磷脂酰膽堿乙醇胺)的氯仿溶液(脂濃度1mM)。然后,將總量1μmol的脂放置到Spitz測試試管中,并在旋轉蒸發器中通過減壓去除氯仿來制備薄的脂膜。進一步在減壓下充分去除氯仿干燥膜。再將0.5ml含有Mg和Ca的Dulbecco磷酸緩沖的鹽水與20μg的基因轉移質粒一起加入,并且在氮氣替換后,內容物用旋渦混合器攪拌2分鐘,由此可獲得陽離子MLV的懸浮液以及包括其中的含有目的反義核苷酸的質粒。
在用于基因治療以上述方式獲得的包括質粒的陽離子MLV的實施例中,將0.6μg(以DNA計算)含有待表達的反義核苷酸插入其中的表達質粒包埋在上述的陽離子MLV中,從而使脂質體的脂總量達到30nmol。將所得的脂質體懸浮在2μl的磷酸緩沖的鹽水中,并把該懸浮液每隔一天施用給從患者中抽提的靶細胞或患者的一種或多種組織。
根據日本健康和福利部有關指導方針中的定義,基因治療是“給人施用基因或其中體內導入基因的細胞來治療疾病”。除了上述指導方針的定義以外,如本發明所用的術語“基因治療”包括通過把GASC1基因的反義核苷酸導入到上述靶細胞中來治療各種疾病包括癌癥,另還包括通過將靶基因或其中轉入了靶基因的細胞導入人體中來治療各種疾病。將本發明基因導入靶細胞或靶組織的方法在本發明的基因治療中把目的基因導入靶細胞或靶組織的方法包括下列兩個代表性的方法。
第一種方法包括從待治療的患者中收集靶細胞,例如在添加白介素-2(IL-2)等的條件下離體生長細胞以轉移如反轉錄病毒中內含的目的GASC1基因的反義核苷酸,并重移植所得的細胞(離體方法)。該方法適合于治療例如ADA缺乏、由缺陷基因導致的遺傳疾病、癌癥和AIDS。
第二種方法是直接基因轉移法,其包括將目的反義核苷酸(GASC1基因的反義核苷酸)直接注射到患者體內或靶部位如腫瘤組織(直接方法)中。
更具體而言,例如可按下列方式實施第一種方法。因此,將從患者中收集的單核細胞利用血液分選儀從單核細胞中分部分離,并將分離細胞在有IL-2存在下培養在適當的培養基如AIM-V培養基中約72小時,然后加入待導入的內含反義核苷酸(GASC1基因的反義核苷酸)的載體。為提高反義核苷酸的轉移效率,可將細胞在有魚精蛋白存在下32℃生長1小時,2500rpm離心,然后在10%的二氧化碳氣體下37℃培養24小時。此程序重復幾次后,將細胞進一步在有IL-2存在下培養在例如AIM-V培養基中48小時,然后用生理鹽水洗滌。存活細胞計數,并通過上述的原位PCR對目的反義核苷酸的導入效率進行評價,或者例如當對象是酶活性時,則通過測定這種活性的程度來評價。
為證實安全性,實施了安全檢查如在培養的細胞中培養細菌和真菌、對是否存在支原體感染進行檢查、搜查內毒素等。其后,將用預測的有效劑量的反義核苷酸(GASC1基因的反義核苷酸)轉化的培養細胞通過靜脈內滴注返還給患者。間隔數周或幾個月重復上述程序直至完成基因治療。
根據靶細胞明智地選擇病毒載體的劑量。通常優選的劑量根據病毒效價可以是例如每1×108個靶細胞1×103cfu-1×108cfu。
可采用上述第一種方法的選擇性版本,其包括共培養具有反轉錄病毒載體的產病毒的細胞和患者的細胞,所述載體內含目的反義核苷酸,由此將反義核苷酸(GASC1基因的反義核苷酸)導入到靶細胞中。
在實施第二種基因治療方法(直接方法)中,特別優選的是進行離體預備實驗通過操作載體基因cDNA的PCR或原位PCR以檢查目的反義核苷酸(GASC1基因的反義核苷酸)是否能由基因轉移方法真正導入,或者檢查所需的治療效果例如特異活性的升高或靶細胞的生長或生長抑制是否能通過導入目的反義核苷酸(GASC1基因的反義核苷酸)真正實現。此外,當采用病毒載體時,通過執行PCR搜索增殖性反轉錄病毒等,測定反轉錄酶的活性,或采用PCR技術監控外殼蛋白(env)基因,對基因治療中導入反義核苷酸的安全性進行確認當然具有重要意義。
尤其當癌癥或惡性腫瘤是靶子時,本發明基因治療的例子是癌癥治療,其包括從患者中收集癌細胞,通過酶處理等建立培養的細胞系,例如利用反轉錄病毒將目的反義核苷酸導入到靶癌癥細胞中,用G418細胞實施篩選,然后測定IL-12等的表達量(體內),給予輻射處理,以及將細胞接種至患者的腫瘤或癌旁的(腫瘤相伴的)一個或多個部位。基因治療劑本發明進一步提供藥物組合物或制劑(基因治療劑),其包括本發明的反義核苷酸轉移載體或用反義核苷酸(GASC1基因的反義核苷酸)轉化/轉染的細胞系作為活性成分以藥物有效量與合適的藥物載體或稀釋劑組合。
可用于本發明基因治療劑的藥物載體包括那些稀釋劑或賦形劑,例如填充劑、容積構件、粘合劑、濕潤劑、崩解劑、表面活性劑、潤滑劑等,通常它們的用處取決于制劑所用的形式,并且根據制劑預計的單位劑量形式可選擇性地使用這些載體。
本發明基因治療劑的單位劑量形式可與本發明的藥物組合物所述的相同,并根據治療目的可選擇一種合適形式。
本發明的基因治療劑例如當其含有反義核苷酸轉移載體時,是以所述載體包埋其中的脂質體的形式制備或以用內含反轉錄病毒載體的病毒感染的培養細胞形式制備,所述反轉錄病毒載體含有所需的反義核苷酸。
藥劑例如可制成磷酸緩沖的鹽水(pH7.4)、林格溶液或胞內組合物注射液,或者制成可與有益于基因轉移效率提高的物質如魚精蛋白組合施用的這種劑量形式。
施用上述藥物制劑的方法不受特別限制,根據特定的劑量形式、患者的年齡、性別和其他因素、疾病的嚴重性等可建立適當的方案。
摻入上述藥物制劑的活性成分的量和劑量不受特別限制,根據期待的治療益處、施用方法、治療期限、患者背景包括年齡和性別以及其他變量,各量可自由選自寬的范圍。
一般而言,內含目的反義核苷酸的反轉錄病毒載體作為藥物制劑的劑量可以是例如根據反轉錄病毒效價每kg體重每天約1×103pfu-約1×1015pfu。
在攜帶導入反義核苷酸的細胞的情況下,劑量可合適地選自約1×104細胞/個體-1×1015細胞/個體的范圍。
上述制劑的施用可每天一次或一天分幾次劑量或甚至間隔一周或若干周。優選可組合施用有益于基因轉移效率提高的物質如魚精蛋白或含有同樣物質的制劑。
當根據本發明的基因治療適用于癌癥的治療時,其可以與如上所述的各種基因療法適當的組合(結合基因治療)施行和/或以與常規癌癥化療、放療、免疫治療等組合施行。本發明的基因治療可參照NIH指導方針包括其安全性方面[Recombinant DNA Advisory Committee,Human Gene Therapy,4,365-389(1993)]進行。
本發明基因的檢測和癌癥診斷根據本發明,為了檢測GASC1基因是否存在的目的,所述GASC1基因促進細胞的腫瘤發生,有可能制備生物樣品如血液或血清,任選地抽提核酸并分析其是否存在GASC1敏感的基因。根據本發明,還有可能制備具有某種或其他失調的生物樣品,并分析其是否存在GASC1相關的贅生物基因,用于檢測細胞或組織中的贅生物,惡性前兆的失調的進展和/或其出現作為前兆指數。利用該方法,對細胞或組織中的贅生物、惡性前兆的失調的發展或其出現作為前兆指數進行檢測變為可能,因此,這些前兆的診斷例如癌癥診斷和癌癥治療效果的判斷及其預后變為可能。
例如,上述檢測方法可包括根據有關獲自腫瘤患者樣品的GASC1基因的信息制備GASC1基因的DNA片段,并對其進行設計,從而其可用于對GASC1基因和/或其擴增的篩選。更具體而言,有可能構建具有探針特性的DNA片段,所述探針用于噬菌斑雜交、菌落雜交、DNA印跡、RNA印跡等,或用于如由聚合酶鏈式反應(PCR)擴增而制備GASC1基因的全長或部分DNA,所述PCR用聚合酶擴增核苷酸序列。為此目的,首先制備與至少部分的GASC1基因具有相同序列的引物。然后,將引物作為篩選探針與生物樣品(核酸樣品)反應,由此可檢查樣品中是否存在GASC1基因序列。核酸樣品的制備可采用有助于檢測靶序列的任何各種技術,如變性、限制消化、電泳或斑點印跡。
作為上述的篩選方法,從靈敏度的觀點出發尤其優選PCR技術,并且該技術不受特別限制,這是因為GASC1基因的片段用作引物。因此,可采用任何迄今已知的技術(Science,2301350-1354(1985))和最近已經開發或以后將被開發的PCR的修飾版本(Sakaki,Yoshiyuki等編,Jikken Igaku(Experimental Medicine),Supplement8(9)(1990),Yodosha;Protein,Nucleic Acid,EnzymeSpecialSupplement,Kyoritsu Shuppan,35(17)(1990))。
用作引物的DNA片段是化學合成的寡DNA,這種寡DNA的合成可利用全自動DNA分析儀等,例如Pharmacia LKB Gene Assemblerplus(Pharmacia)。優選的準備合成的引物(有義引物或反義引物)長度可以是例如約10-30個核苷酸。用于上述篩選的探針通常是標記探針,但可以是未標記探針,或者根據與直接或間接標記的配體特異的結合可進行檢測。合適的標記和標記探針或配體的方法是本發明所屬領域公知的。因此,現有技術標記包括放射性同位素、生物素、熒光基團、化學發光基團、酶和抗體等,這些標記可通過已知程序如缺口平移、隨機引發和激酶處理來進行。
用于檢測的PCR技術可以是例如RT-PCR,但可采用本領域常用的該技術的各種修飾。
此外,利用試劑盒檢測樣品中的GASC1基因,本發明的測定方法可快速施行。
因此,本發明提供包括GASC1基因的DNA片段的GASC1基因檢測試劑盒。
該試劑盒至少包括作為必要組分的DNA片段,所述DNA片段雜交于部分或全部SEQ ID NO2所示的核苷酸序列或其互補核苷酸序列。其可任選地含有其他組分如標記介質和PCR試劑(例如,Taq DNA聚合酶、三磷酸脫氧核苷酸、引物等)。
標記介質可以是放射性同位素或化學修飾物如熒光物質。在DNA片段與這種標記介質預先已經結合的情況下,試劑盒不需單獨含有這種標記介質。
試劑盒可進一步含有適當的反應稀釋劑、標準抗體、緩沖液、洗滌溶液、反應終止溶液等,這些物質使得測定更容易操作。
本發明還提供用于癌癥診斷的方法,其包括利用上述測定方法和診斷藥劑或診斷試劑盒用于操作所述方法。
利用本發明的測定方法,通過直接或間接對獲自測試樣品的GASC1基因測序,有可能發現新的GASC1基因相關的基因,這些相關的基因與野生型GASC1基因具有高度同源性。所以,本發明進一步提供篩選測試樣品中人GASC1基因相關的基因的方法,其包括進行測定并對測試樣品中所含的GASC1 DNA進行測序。
利用具有SEQ ID NO1所示氨基酸序列的蛋白質,即由人GASC1基因所編碼的蛋白質,具有從SEQ ID NO1所示序列中通過缺失、替換或添加一種至若干種或多種氨基酸而衍生的氨基酸序列的蛋白,它們每一種的片段,或抗任何這些蛋白的抗體,可確定野生型GASC1和/或突變的GASC1。因此,本發明提供抗體方法和抗原方法用于確定抗野生型GASC1和/或突變的GASC1。
通過這些方法,根據野生型GASC1多肽中的變化,可檢測贅生性態失調或惡性腫瘤的惡性的程度。這類變化的檢測可由GASC1序列分析通過上文所述的明確的技術進行,更優選的是利用抗體(多克隆或單克隆抗體)。由此,可檢測GASC1蛋白中的差異或者是否存在GASC1蛋白。
更具體而言,在實施本發明的野生型GASC1和/或突變的GASC1測定方法時,利用抗GASC1抗體,將GASC1蛋白從含有生物樣品的溶液中免疫沉淀出來,所述生物樣品獲自人體,如血液或血清。然后,對與聚丙烯酰胺凝膠上的GASC1蛋白反應進行蛋白質印跡或免疫印跡。當利用抗GASC1抗體時,通過免疫組織化學技術可檢測在石蠟包埋或冷凍的組織切片中的GASC1蛋白。用于上述測定和檢測的技術可適當地選自本領域中眾所周知的抗體生產和純化技術。
在優選的實施例中,用于檢測野生型和/或突變的GASC1的方法利用單克隆抗體和/或多克隆抗體,包括酶聯免疫吸附測定(ELISA)、放射免疫測定(RIA)、免疫放射分析(IRMA)、免疫酶分析(IEMA),包括三明治技術。本發明的蛋白受體和藥物篩選本發明可進一步提供存在于細胞膜部分或細胞表面上并具有與GASC1蛋白親和性結合的GASC1受體。
通過結合生物樣品中標記的GASC1蛋白,所述生物樣品含有細胞膜部分,抽提和分離GASC1結合產物,并鑒定被分離產物的氨基酸序列,可得到GASC1受體。獲得和測序GASC1受體的程序可以本領域中常規的方式進行。
GASC1受體或其片段優選GASC1受體可用于對任何各種藥物進行篩選的技術中。由此,有可能對化合物進行篩選(與GASC1受體反應的化合物,包括低分子的化合物、高分子的化合物、蛋白、部分蛋白質片段、抗原、抗體等)。用于這些篩選測試中的GASC1受體(多肽或其片段;下文將同樣適用)可固定在固相基質上。
上述藥物篩選的例子是一種篩選方法,其包括以競爭性結合分析將測試物質和GASC1蛋白或其片段與GASC1受體部分地反應,然后檢測在測試條件下該物質對GASC1受體和GASC1蛋白或其片段之間形成復合體的抑制程度。因此,本發明提供藥物篩選方法,其包括將測試物質與GASC1受體接觸以使它們之間形成復合體,然后測定由GASC1受體和GASC1蛋白或其片段之間復合體形成而產生的復合體所導致的抑制程度。如由該篩選方法所得到的具有抑制活性的物質可通過抑制GASC1受體的活性來調節GASC1自身的活性。
通過標記GASC1受體和測定在上述競爭性結合分析中游離(非復合體形成)GASC1受體上的標記量,可將測定值作為測試物質與GASC1受體結合的標準,或者可作為GASC1受體和GASC1蛋白之間復合體形成的抑制的測定。
藥物篩選也可用于不僅對物質而且對化合物(肽)的篩選,所述物質能夠抑制GASC1受體活性,所述化合物(肽)對所述受體具有足夠水平的結合親和性。
該程序包括在固相支持物如塑料針狀物的表面上合成大量不同的測試化合物,然后將化合物與GASC1受體反應,并且洗滌后通過已知方法[例如PCT專利申請號WO 84-03564]檢測結合的反應產物。在該程序中,純化的GASC1受體可通過在適當的板上直接包被該物而使用,或者也可以被抗此多肽的非中和抗體捕獲的形式使用,并因此固定在固相上。
此外,上述篩選方法也可用于競爭性藥物篩選分析中。在這種情況下,中和抗體能夠特異地結合到GASC1受體上,引起與測試化合物的競爭性反應。這種競爭性反應能檢測是否存在任何具有一個或多個GASC1受體的抗原決定簇的肽。
作為藥物篩選的進一步方法,所述方法利用可提及的內含非功能性GASC1基因的真核宿主細胞系。該方法包括在測試化合物存在下真核宿主細胞生長一定的周期時間,然后測定宿主細胞的生長速率,由此可能證實測試化合物能否與調節宿主細胞生長和分化的蛋白結合,從而控制例如血液和組織中結合蛋白的濃度及其遷移程度,或者控制這種蛋白自身的活性。測定宿主細胞生長速率的一種方法是測定GASC1受體的生物活性。
根據本發明,也有可能設計和生產另一生物活性蛋白或結構類似物,所述結構類似物與GASC1蛋白例如GASC1激動劑、GASC1拮抗劑或GASC1抑制劑相互作用。這些物質可用于開發更具活性或更穩定的GASC1蛋白的衍生物,或者例如能體內增強或抑制GASC1蛋白的功能的藥物。
例如通過X射線晶體學、計算機模型方法或這些方法的組合來鑒定和分析GASC1蛋白和另一蛋白的復合體的三維結構,可設計出這種結構類似物的序列。有關結構類似物的結構信息也可由蛋白模型根據同源蛋白的結構而獲得。
至于更具活性或更穩定的GASC1蛋白的衍生物,對GASC1蛋白的活性或穩定性施加重要影響的區域例如可通過丙氨酸掃描(丙氨酸替換)組成GASC1蛋白的至少一種氨基酸殘基,并在丙氨酸替換后測定肽的GASC1活性來實現。另外,更具活性或更穩定的GASC1蛋白的衍生物可通過用丙氨酸替換在那個區域中的至少一種氨基酸殘基來獲得。
為獲得能與GASC1蛋白相互作用并具有生物活性的其他蛋白或其結構類似物,通過功能性分析預先分離靶特異的抗體并分析其晶體結構也是有用的。該方法使得獲得用作設計所需藥物的基礎的藥核(pharmacore)成為可能。通過利用針對藥物活性抗體的功能性抗獨特型的抗體,從由化學或生物合成并積累而構建的肽庫中篩選所需的肽成為可能。以此方式篩選的肽也可期待用作藥核。
根據本發明,如果GASC1蛋白可大量獲得,這將使在分析研究如X射線晶體學中利用該蛋白成為可能。進一步,由本發明提供的GASC1蛋白可用于計算機模擬技術來代替X射線晶體學,或與X射線晶體學一起使用。
此外,根據本發明,通過構建的攜帶GASC1基因的剔除小鼠(轉基因小鼠),有可能查明GASC1基因序列的哪一個或哪些位點對體內所述多種GASC1活性具有影響,也就是說GASC1基因表達產物和修飾的GASC1基因產物在體內具有什么樣的功用。
該方法是通過利用同源性重組基因而有意修飾生命體遺傳信息的技術,其包括使用小鼠胚胎干細胞(ES細胞)作為例子的方法[Capecchi,M.R.,Science,244,1288-1292(1989)]。
構建這種突變小鼠的方法是迄今為止相關領域中的常規技術[例如Noda,Testuo(編)Jikken Igaku(Experimental Medicine),Supplement,14(20)(1996),Yodosha]。通過將該技術適用于野生型GASC1基因和突變的GASC1基因,可容易地生產突變小鼠。
在突變小鼠得到的突變基因序列和其功用之間關系的建立,為設計和開發如上所述的更具活性或更穩定形式的GASC1蛋白衍生物,尤其是作為GASC1激動劑、GASC1拮抗劑或GASC1抑制劑功能的藥物提供了有用的信息。本發明的效果本發明提供能夠調節各種細胞生長和分化、腫瘤發生和轉錄活化等的新基因。該基因用于例如闡明疾病的病理、診斷和/或治療疾病,其中都涉及這些活性,例如下述的惡性腫瘤。
如同已知的致癌基因,本發明基因編碼相關氨基酸序列C末端上的兩個PHD指狀結構基元和一個PX結構域。進一步,本發明基因所在的染色體9p23-24區域的擴增已在許多癌癥中被觀察到。分析本發明基因用于解釋該基因的功用和各種疾病之間的關系。所以,當利用這種分析時,本發明基因通過檢查該基因在各種組織中的表達狀態或其體內功能分析實現了各種疾病的基因診斷。
根據本發明,有可能以遺傳工程方式大量生產由本發明基因編碼的蛋白,也有可能生產針對該蛋白的抗體。該蛋白用于測定GASC1活性、與GASC1受體的結合活性以及其他功能。該蛋白及其抗體尤其用于疾病的病理說明、診斷和治療,GASC1基因及其產物參與其中,例如癌癥。
此外,本發明提供本發明基因的反義鏈、用于基因治療含有相同反義鏈的基因轉移載體、內含所述載體的細胞、包含所述載體或細胞作為活性成分的基因治療劑,以及利用相同物質的基因治療方法。具體而言,通過抑制生長活性抗各種癌細胞,上述基因療法可用于治療各種癌癥。
圖2表示如實施例1-1中所述對食道鱗狀細胞癌細胞系KYSE150進行FISH分析的典型結果。
圖3表示實施例1-2中所述的測試結果。在該圖中,A表示GASC1在各種食道鱗狀細胞癌細胞系中擴增的程度,以及B表示利用來自各種食道鱗狀細胞癌細胞系的RNA進行RNA印跡分析的結果,這表明GASC1的過量表達。
圖4表示實施例1-2中所述的測試結果,這顯示本發明基因在各種正常人組織中的表達模式的檢查結果。
2)采用YAC和PAC作為探針的FISH測試對指定區域中YAC的定位的信息收集來自Whitehead研究所/MIT基因組中心(MIT Genome Center)(http//www-genome.Wi.Mit.Edu/)以及人類分子細胞遺傳學資源(Resources for Human MolecularCytogenetics)(http//bioserver.uniba.it/FISH/rocchi/welcom.html)。
覆蓋人9p23-24區域的多種YAC克隆分離自Center d′Etude duPolymorphisme Humain(CEPH)的YAC文庫,以及FISH探針的準備根據上述Shinomiya等的方法通過PCR利用Alu序列進行。
PCR按照下列方式進行。將YAC DNA 1μg(1μl)、具有SEQ IDNO4所示核苷酸序列的引物2484(30μM)1μl、具有SEQ ID NO5所示核苷酸序列的引物PDJ34(10μM)1μl、10×PCR緩沖液(ExTaq緩沖液,Takara Shuzo)10μl、2.5mM dNTP(Takara Shuzo)5μl、ExTaq聚合酶0.5μl以及水81.5μl(總100μl)混合,然后在95℃處理4分鐘(首先一次變性處理),反應共進行30次循環(各個循環包括95℃-4分鐘、55℃-1分鐘和72℃-4分鐘),接著在72℃進行終處理(一次)7分鐘。上述全部反應都采用Perkin-Elmer GeneAmp PCR system9700進行。
一種PAC克隆子(由Peter Marynen博士贈送)用作探針,其含有janua激酶2(JAK2,GenBank保藏編號為NM-004972),是9p24圖中的已知基因。
采用生物素16-dUTP或地高辛11-dUTP(Boehringr Mannheim)通過缺口平移標記上述探針。根據上述Shinomiya等的方法進行染色體雜交信號的熒光檢測。
沖洗后,將載玻片上染色的影象和熒光信號利用CCD(冷電荷偶聯裝置)照相機(KAF 1400,Photometrics產品)同時進行成像分析。
利用IP實驗室光譜軟件(Signal Analytics Corp.產品)對DNA序列拷貝數的相對變化進行分析。根據染色體在分裂中期和休眠期所觀察到的雜交模式來評估必要區域的拷貝數。當熒光強度比率超過1.5時,可判斷此染色體區域表現出高水平的擴增。
結果,通過前述的CGH分析,在本發明人所研究的29種食道鱗狀細胞癌細胞系中檢測到5種有9p上拷貝數的增加(17.2%)。發現在它們中間有一個存在更高水平的擴增。在此CGH結果的基礎上,采用8種YAC和一種PAC作為探針在KYSE150中進行FISH分析。
3)結果結果顯示在
圖1中(圖1A和圖1B)。
在圖1中,A是9p23-24區域包括本發明基因的基因圖,在該圖中,“STSs(基因/ESTs)”代表序列-標記的位點(基因/表達序列標記),“Tel”代表端粒邊,“Cen”代表著絲粒邊,以及“YACs/PAC”代表在FISH中所用的各個探針。
在圖1A中,由括號中所示的各自表達序列標記(EST)所鑒定的已知基因和轉錄物表示在代表染色體的線上。這些基因和轉錄物用作DNA印跡中的探針。
FISH中所用的多種YAC(953A7、807B4、799D2、871F1、853F4、933F6、830E1和845G2)和一種PAC(PJ2B)由分別在染色體-標志線以下被一個或多個白色小圓中斷的水平黑線來表示。這些水平線中的小圓分別顯示在YAC或PAC上標記的固定點。此圖是示意圖,因此,其不反映YAC和PAC的真正大小和實際的標記-標記距離。
圖1B是在5種各自食道鱗狀細胞癌細胞系(在圖中顯示為KYSE70、KYSE450、KYSE890、KYSE1170和KYSE150)中的9p23擴增子的示意圖,所述這些細胞系經DNA印跡分析后指定(大約對應于圖1A中的染色體-標志線所示)。在該圖中,最小的重疊區域(SRO)由FISH與DNA印跡分析的結果一起指定。
圖2表示在KYSE150中FISH分析的典型結果,所述KYSE150是一種上述的食道鱗狀細胞癌細胞系。
在該圖中,采用PACPJ2B、YAC799D2和YAC830E1克隆子進行FISH的結果分別被從上到下顯示。在各圖象中,熒光點的數目表示DNA拷貝數。在各圖象中,縮寫PJ2B、799D2和830E1與圖1A中所示的相同。
如圖2所示,YAC799D2產生了強烈的信號,如同在兩個標記染色體上的均勻染色區域(HSR)。這說明高水平的擴增出現在該區域,其中包括YAC799D2。在807B4的情況下,以同樣方式進行的FISH給出了相同的結果(未顯示)。
出現在YAC799D2(參見圖1A)兩邊的YAC953A7、871F1、853F4和933F6中FISH信號的數目范圍從4到9。然而,這些信號數目與YAC799D2和807B4比較要少得多。而采用PACPJ2B和YAC830E1,拷貝數僅為2到3。
為了對在9p23-24區域內顯示最低水平擴增的公共區域進行鑒定,其他4種細胞系(KYSE70、450、890和1170)在前述的CGH分析中顯示了9p上拷貝數的增加,對這些細胞系也進行了FISH分析。
結果在KYSE890和1170中,YAC799D2和807B4的雜交信號被檢測為小HSR模式。另一方面,在KYSE70和450中信號數為約6到9。然而在這些細胞系中,比在KYSE150中所檢測的擴增區域更大的區域得到擴增,因此在KYSE150中所測定的擴增子大小不可能狹小。
因此,預測在9p23-24區域擴增子中的目的基因應出現在被YAC799D2和807B4所覆蓋的相對狹小的區域中。
2.DNA印跡分析和RNA印跡分析如同選自Whitehead研究所的基因組研究數據庫,在9p23-24區域中的8種EST克隆子((1)GYG2、(2)GLDC、(3)IMAGE克隆子131865(GenBank保藏編號R24542)、(4)SLC1A1、(5)CSNK1G2、(6)JAK2、(7)IMAGE克隆子650495(GenBank保藏編號AA219360)和(8)IMAGE克隆子30354(GenBank保藏編號R18567);上述克隆(1)、(2)和(4)-(6)各是已知基因的部分以及(3)、(7)和(8)各是轉錄物的部分)都購自Research Genetics公司,并用作DNA印跡和RNA印跡分析的探針。
將腫瘤DNA從通過標準方法(參考Sambrook,J.等,MolucularCloning,A Laboratory Manual,2ndEd.,Cold Spring Harbor LaboratoryPress,1989)培養的各個食道鱗狀細胞癌細胞系中抽提出來。
對于DNA印跡分析,10μg的DNA從各細胞系或正常淋巴細胞中抽提出來,并用EcoRI消化,然后在0.8%的瓊脂糖凝膠上進行電泳,接著轉移到聚酰胺膜(BIODYNE B,Nihon Pall產品)上。對于RNA印跡分析,20μg的總RNA從各細胞系中抽提出來,在1.0%瓊脂糖/0.67M甲醛凝膠上進行電泳,接著轉移到聚酰胺膜(Hybond-N+,Amersham Pharmacia Biotech產品)上。
轉移后,在適當條件下各膜與標記有[α32P]dCTP的各個EST探針雜交,洗滌后,根據上述Shinomiya的方法雜交膜用于科達X-OMAT膠片的曝光。
為了比較不同人正常組織中的表達模式,將通過使用從12種不同組織(MTN-human 12泳道,Clontech產品)中抽提的RNA而制備的RNA印跡與標記有[α32P]dCTP的IMAGE克隆131865(GenBank保藏編號R24542)雜交。
按照下列條件進行DNA印跡分析1)預雜交和雜交緩沖液含有變性鮭魚精子DNA(200mg/ml)和人胎盤DNA(200mg/ml)的PEG/SDS溶液(7%PEG8000,10%SDS);2)預雜交條件在65℃下連續攪拌12-16小時;3)雜交條件在65℃下連續攪拌12-16小時;4)洗滌用洗滌溶液1(2×SSC,0.1%SDS)在55℃下連續攪拌15分鐘,然后用洗滌溶液2(0.1×SSC,0.1%SDS)在55℃下連續攪拌15分鐘,接著用2×SSC漂洗。
按照下列條件進行RNA印跡分析1)預雜交和雜交緩沖液采用ExpressHyb(Clontech);2)預雜交條件在68℃下連續攪拌30分鐘;3)雜交條件在68℃下連續攪拌1小時;4)洗滌用洗滌溶液1(2×SSC,0.1%SDS)在55℃下連續攪拌30分鐘,然后用洗滌溶液2(0.1×SSC,0.1%SDS)在55℃下連續攪拌15分鐘,接著用2×SSC漂洗。
結果,在CGH和FISH測試中,利用三種EST探針即糖原素2(glycogenin 2)(GYG2)和位于YAC799D2上的甘氨酸脫氫酶(GLDC)以及IMAGE克隆131865(GenBank保藏編號R24542),對食道鱗狀細胞癌細胞系進行DNA印跡分析,在5種已顯示9p上拷貝數增加的細胞系中表現了擴增模式。
與之相反的是,在KYSE150中用于區域外基因或未知轉錄物的探針即SLC1A1、一種溶質載體家族、JAK2、酪蛋白激酶1γ2(CSNK1G2)、IMAGE克隆650495(GenBank保藏編號AA219360)和IMAGE克隆350354(GenBank保藏編號R18567)并未顯示擴增(對于這些探針,參照圖1B)。
根據食道鱗狀細胞癌細胞系DNA和正常DNA之間的雜交信號的比較,在粗略估計擴增的程度后表明,首先的三種探針(GYG2、GLDC和IMAGE克隆131865)在KYSE150中顯示了至少12倍的擴增,以及在其他四種細胞系中3-6倍的擴增得到證實(參見圖3A)。
圖3A表示GASC1在食道鱗狀細胞癌細胞系中的擴增。利用IMAGE克隆131865作為探針以上述方式通過DNA印跡獲得該圖。
從該圖可看出,在8種食道鱗狀細胞癌細胞系中,正常人外周血淋巴細胞-衍生的DNA(N)上的信號要比KYSE70、150、450、890和1170弱,但強于1250和1260,并與110相當。這說明IMAGE克隆131865在KYSE70、150、450、890和1170中得到擴增。
圖3B顯示RNA印跡分析的結果,利用IMAGE克隆131865(GASC1)或對照(GAPDH)作為探針,將如圖3A中所用的同樣8種食道鱗狀細胞癌細胞系各個的總RNA進行雜交,以獲得圖3B中的結果。
從該圖中,顯然GASC1基因在5種食道鱗狀細胞癌細胞系中過量表達,所述5種細胞系在圖3A中表現擴增(KYSE70、KYSE150、KYSE450、KYSE890和KYSE1170)。
進一步,圖4顯示本發明基因在正常人組織中表達的檢查結果。
該圖顯示利用從12種不同的組織中抽提出來的RNA樣品與標記有[α32P]dCTP的IMAGE克隆131865進行RNA印跡雜交所產生的結果。所用的此雜交程序與圖3B中的情形相同。
依據上述發現,進行如下討論。
對三種未知轉錄物(IMAGE克隆131865、650495和30354)的表達水平進行分析的RNA印跡的結果揭示,僅IMAGE克隆131865在9p23-24上顯示擴增的細胞系中顯示過量表達(參見圖3B)。
該結果說明IMAGE克隆131865是出現在這種擴增子內的部分候選擴增靶基因。所以,利用此克隆對全長基因進行克隆,并且對序列進行了測定。
利用來自多種與IMAGE克隆131865雜交的人正常組織的RNA而產生的RNA印跡揭示出了在所有組織中的一種信號轉錄物4.5kb的表達(參見圖4)。
3.cDNA文庫篩選和DNA序列測定利用寡帽(oligo cap)方法(Maruyama,K.等,Gene,138,171-174(1994))和ZAP-cDNA GigaPACK III Gold克隆試劑盒(stratagene)從胃癌細胞系(HSC39)中構建兩個cDNA文庫。
利用IMAGE克隆131865(其部分序列是已知的,該序列具有GenBank保藏編號R24542)作為探針對各個文庫進行篩選。
作為篩選結果,分離到6個重疊的cDNA克隆,采用型號377 ABI的全自動測序儀(PE Biosystems)測定它們的DNA序列。以這種方式,找到了由4235個核苷酸組成的轉錄物。
該轉錄物在大小上與通過RNA印跡分析所顯示的轉錄物符合一致,因此,該cDNA估計是全長cDNA。
在核酸序列分析后發現,用于轉錄起始的共有序列(Kozak規則)是高度保守的,因此,推測轉錄應在第147位核苷酸開始。在由聚腺苷酸延伸而持續的3′端發現了兩個AATAA聚腺苷酸化信號。因此,推導蛋白的氨基酸序列被鑒定為包含如SEQ ID NO1所示的1056個氨基酸殘基的序列。
來自GASC1的DNA序列(SEQ ID NO2所示)的第10到第3140位核苷酸的區域顯示顯著同源于KIAA0780的cDNA部分(GenBank保藏編號AB018323)。
此外,為了確認分離的克隆的序列,利用來自已顯示過量表達的5種食道鱗狀細胞癌細胞系(KYSE-70、KYSE-150、KYSE-450、KYSE-890和KYSE-1170)每一種的RNA作為模板,與兩對引物一起,進行反轉錄PCR(RT-PCR),所述引物如下所示,根據從由篩選克隆131865而被分離的克隆中所測定的序列來制備。
用于這種RT-PCR中的引物的序列顯示在SEQ ID NO6-SEQ IDNO9中。
引物W1fSEQ ID NO6引物W1rSEQ ID NO7引物W2fSEQ ID NO8引物W2rSEQ ID NO9RT(反轉錄)反應操作如下將1μg的RNA與0.5μg的寡脫氧胸苷酸引物混合(總量10μl),在70℃變性處理10分鐘后,加入4μl的5×反轉錄緩沖液(GIBCO)、1μl的核糖核酸酶抑制劑(TOYOBO)以及4μl的2.5mM dNTP(TAKARA)(總量為19μl)、再加入1μl的Superscript II(GIBCO),并在42℃下溫育45分鐘。
利用GeneAmp PCR系統9700(Perkin-Elmer)進行PCR。反應操作如下將2μl的10×ExTaq緩沖液(TAKARA)、1.0μl的2.5mMdNTP(TAKARA)、0.5μl的10μM各個引物以及0.5單位的ExTaq(TAKARA)加入到1μl的RT產物中,并使總量達到20μl。至于反應條件,起始在94℃下變性2分鐘,接著進行25次循環,各循環包括94℃下30秒、58℃下30秒以及72℃下30秒,并進一步在72℃延伸7分鐘。
結果發現已產生單一條帶產物,其具有預測的大小,通過測定序列確認是正確的。此外,包含DNA序列第238位到第638位的核苷酸的DNA片段利用W2f和W2r作為探針通過PCR生產,用[α32P]dCTP標記,并與被含有IMAGE克隆(R24542)的YAC799D2點綴的聚酰胺膜(BIODYNE B,Nihon Pall產品)雜交,于是檢測信號,此外,擴增信號顯示在5種腫瘤細胞系(KYSE70、KYSE150、KYSE450、KYSE890和KYSE1170)的所有DNA印跡上,所述5種細胞系在9p23-24區域中顯示擴增。
對估計的氨基酸序列的分析暗示該基因產物含有兩個PHD指狀結構和一個PX結構域(SEQ ID NO1所示氨基酸序列中從第687位到第749位以及從第806位到第867位的序列是指狀結構序列,而從第980位到第1047位的氨基酸序列是PX結構域序列)。
利用PSORT II程序(參見http//psort.nibb.ac.jp/form2.html),在對其胞內定位進行計算機預測中,一種典型的雙聯體核定位信號在GASC1蛋白第979位到第996位氨基酸上被檢測到,這暗示了胞核中的定位。
根據上述結果,含有PHD指狀結構基元的GASC1基因,這些基元暗示其是候選的“致癌基因”,以及PX結構域被認為在各種腫瘤的發生和發展等中發揮重要作用,以及強烈暗示的是在染色體9p23-24區域中GASC1轉錄物的增加的表達后,所述基因應是與各種類型腫瘤的發生和/或發展相關的腫瘤伴隨基因(包括候選致癌基因),也包括食道鱗狀細胞癌細胞系。
工業實用性本發明提供新基因,即GASC1基因,其具有調節各種細胞的生長和分化、腫瘤發生和轉錄活化等的活性。利用該基因,闡明與所述活性相關的疾病例如惡性腫瘤的病理學和/或實施其診斷和治療等變為可能。
序列表<110>大塚制藥株式會社(Otsuka Pharmaceutical Co.,Ltd.)<120>GASC1基因(GASC1 gene)<130>SCT022782-09<150>JP 2000-174946<151>2000-6-12<160>9<170>PatentIn Ver.2.0<210>1<211>1056<212>PRT<213><400>1Met Glu Val Ala Glu Val Glu Ser Pro Leu Asn Pro Ser Cys Lys Ile1 5 10 15Met Thr Phe Arg Pro Ser Met Glu Glu Phe Arg Glu Phe Asn Lys Tyr20 25 30Leu Ala Tyr Met Glu Ser Lys Gly Ala His Arg Ala Gly Leu Ala Lys35 40 45Val Ile Pro Pro Lys Glu Trp Lys Pro Arg Gln Cys Tyr Asp Asp Ile50 55 60Asp Asn Leu Leu Ile Pro Ala Pro Ile Gln Gln Met Val Thr Gly Gln65 70 75 80Ser Gly Leu Phe Thr Gln Tyr Ash Ile Gln Lys Lys Ala Met Thr Val85 90 95Lys Glu Phe Arg Gln Leu Ala Asn Ser Gly Lys Tyr Cys Thr Pro Arg100 105 110Tyr Leu Asp Tyr Glu Asp Leu Glu Arg Lys Tyr Trp Lys Asn Leu Thr115 120 125Phe Val Ala Pro Ile Tyr Gly Ala Asp Ile Asn Gly Ser Ile Tyr Asp130 135 140Glu Gly Val Asp Glu Trp Asn Ile Ala Arg Ile Asn Thr Val Leu Asp145 150 155 160Val Val Glu Glu Glu Cys Gly Ile Ser Ile Glu Gly Val Asn Thr Pro165 170 175Tyr Leu Tyr Phe Gly Met Trp Lys Thr Thr Phe Ala Trp His Thr Glu180 185 190Asp Met Asp Leu Tyr Ser Ile Asn Tyr Leu His Phe Gly Glu Pro Lys195 200 205Ser Trp Tyr Ala Ile Pro Pro Glu His Gly Lys Arg Leu Glu Arg Leu210 215 220Ala Gln Gly Phe Phe Pro Ser Ser Ser Gln Gly Cys Asp Ala Phe Leu225 230 235 240Arg His Lys Met Thr Leu Ile Ser Pro Ser Val Leu Lys Lys Tyr Gly245 250 255Ile Pro Phe Asp Lys Ile Thr Gln Glu Ala Gly Glu Phe Met Ile Thr260 265 270Phe Pro Tyr Gly Tyr His Ala Gly Phe Asn His Gly Phe Asn Cys Ala275 280 285Glu Ser Thr Asn Phe Ala Thr Val Arg Trp Ile Asp Tyr Gly Lys Val290 295 300Ala Lys Leu Cys Thr Cys Arg Lys Asp Met Val Lys Ile Ser Met Asp305 310 315 320Ile Phe Val Arg Lys Phe Gln Pro Asp Arg Tyr Gln Leu Trp Lys Gln325 330 335Gly Lys Asp Ile Tyr Thr Ile Asp His Thr Lys Pro Thr Pro Ala Ser340 345 350Thr Pro Glu Val Lys Ala Trp Leu Gln Arg Arg Arg Lys Val Arg Lys355 360 365Ala Ser Arg Ser Phe Gln Cys Ala Arg Ser Thr Ser Lys Arg Pro Lys370 375 380Ala Asp Glu Glu Glu Glu Val Ser Asp Glu Val Asp Gly Ala Glu Val385 390 395 400Pro Asn Pro Asp Ser Val Thr Asp Asp Leu Lys Val Ser Glu Lys Ser405 410 415Glu Ala Ala Val Lys Leu Arg Asn Thr Glu Ala Ser Ser Glu Glu Glu420 425 430Ser Ser Ala Ser Arg Met Gln Val Glu Gln Asn Leu Ser Asp His Ile435 440 445Lys Leu Ser Gly Asn Ser Cys Leu Ser Thr Ser Val Thr Glu Asp Ile450 455 460Lys Thr Glu Asp Asp Lys Ala Tyr Ala Tyr Arg Ser Val Pro Ser Ile465 470 475 480Ser Ser Glu Ala Asp Asp Ser Ile Pro Leu Ser Thr Gly Tyr Glu Lys485 490 495Pro Glu Lys Ser Asp Pro Ser Glu Leu Ser Trp Pro Lys Ser Pro Glu500 505 510Ser Cys Ser Ser Val Ala Glu Ser Asn Gly Val Leu Thr Glu Gly Glu515 520 525Glu Ser Asp Val Glu Ser His Gly Asn Gly Leu Glu Pro Gly Glu Ile530 535 540Pro Ala Val Pro Ser Gly Glu Arg Asn Ser Phe Lys Val Pro Ser Ile545 550 555 560Ala Glu Gly Glu Asn Lys Thr Ser Lys Ser Trp Arg His Pro Leu Ser565 570 575Arg Pro Pro Ala Arg Ser Pro Met Thr Leu Val Lys Gln Gln Ala Pro
580 585 590Ser Asp Glu Glu Leu Pro Glu Val Leu Ser Ile Glu Glu Glu Val Glu595 600 605Glu Thr Glu Ser Trp Ala Lys Pro Leu Ile His Leu Trp Gln Thr Lys610 615 620Ser Pro Asn Phe Ala Ala Glu Gln Glu Tyr Asn Ala Thr Val Ala Arg625 630 635 640Met Lys Pro His Cys Ala Ile Cys Thr Leu Leu Met Pro Tyr His Lys645 650 655Pro Asp Ser Ser Asn Glu Glu Asn Asp Ala Arg Trp Glu Thr Lys Leu660 665 670Asp Glu Val Val Thr Ser Glu Gly Lys Thr Lys Pro Leu Ile Pro Glu675 680 685Met Cys Phe Ile Tyr Ser Glu Glu Asn Ile Glu Tyr Ser Pro Pro Asn690 695 700Ala Phe Leu Glu Glu Asp Gly Thr Ser Leu Leu Ile Ser Cys Ala Lys705 710 715 720Cys Cys Val Arg Val His Ala Ser Cys Tyr Gly Ile Pro Ser His Glu725 730 735Ile Cys Asp Gly Trp Leu Cys Ala Arg Cys Lys Arg Asn Ala Trp Thr740 745 750Ala Glu Cys Cys Leu Cys Asn Leu Arg Gly Gly Ala Leu Lys Gln Thr755 760 765Lys Asn Asn Arg Trp Ala His Val Met Cys Ala Val Ala Val Pro Glu770 775 780Val Arg Phe Thr Asn Val Pro Glu Arg Thr Gln Ile Asp Val Gly Arg785 790 795 800Ile Pro Leu Gln Arg Leu Lys Leu Lys Cys Ile Phe Cys Arg His Arg805 810 815Val Lys Arg Val Ser Gly Ala Cys Ile Gln Cys Ser Tyr Gly Arg Cys820 825 830Pro Ala Ser Phe His Val Thr Cys Ala His Ala Ala Gly Val Leu Met835 840 845Glu Pro Asp Asp Trp Pro Tyr Val Val Asn Ile Thr Cys Phe Arg His850 855 860Lys Val Asn Pro Asn Val Lys Ser Lys Ala Cys Glu Lys Val Ile Ser865 870 875 880Val Gly Gln Thr Val Ile Thr Lys His Arg Asn Thr Arg Tyr Tyr Ser885 890 895Cys Arg Val Met Ala Val Thr Ser Gln Thr Phe Tyr Glu Val Met Phe900 905 910Asp Asp Gly Ser Phe Ser Arg Asp Thr Phe Pro Glu Asp Ile Val Ser915 920 925Arg Asp Cys Leu Lys Leu Gly Pro Pro Ala Glu Gly Glu Val Val Gln
930 935 940Val Lys Trp Pro Asp Gly Lys Leu Tyr Gly Ala Lys Tyr Phe Gly Ser945 950 955 960Asn Ile Ala His Met Tyr Gln Val Glu Phe Glu Asp Gly Ser Gln Ile965 970 975Ala Met Lys Arg Glu Asp Ile Tyr Thr Leu Asp Glu Glu Leu Pro Lys980 985 990Arg Val Lys Ala Arg Phe Ser Thr Ala Ser Asp Met Arg Phe Glu Asp99510001005Thr Phe Tyr Gly Ala Asp Ile Ile Gln Gly Glu Arg Lys Arg Gln Arg101010151020Val Leu Ser Ser Arg Phe Lys Asn Glu Tyr Val Ala Asp Pro Val Tyr1025 103010351040Arg Thr Phe Leu Lys Ser Ser Phe Gln Lys Lys Cys Gln Lys Arg Gln104510501055<210>2<211>3168<212>DNA<213>人鱗狀細胞癌細胞(KYSE)<400>2atggaggtgg ccgaggtgga aagtcctctg aaccccagct gtaagataat gaccttcaga 60ccctccatgg aggagttccg ggagttcaac aaataccttg catacatgga gtctaaagga 120gcccatcgtg cgggtcttgc aaaggtgatt cctcctaagg agtggaagcc aagacagtgc 180tatgatgaca ttgataattt gctcattcca gcaccaattc agcagatggt cacagggcag 240tcaggactgt tcactcagta caacatccag aaaaaagcga tgactgtgaa ggagttcagg 300cagctggcca acagtggcaa atattgtact ccaagatact tggattacga agatttggag 360cgcaagtact ggaagaactt aacttttgtg gcacctatct atggtgcaga tattaatggg 420agcatatatg atgagggtgt ggatgaatgg aacatagctc gcatcaatac agtcttggat 480gtggttgaag aagagtgtgg catttctatt gagggtgtaa ataccccata tctctatttt 540ggcatgtgga agaccacgtt tgcatggcac accgaagaca tggacctcta tagcattaat 600tatctccact ttggagagcc caagtcttgg tatgctatac ctccggagca tggaaaacga 660cttgaaagac tagctcaagg ttttttccca agcagctccc aagggtgtga tgcatttctt 720cgccacaaga tgacattgat ttctccatca gtattgaaga aatatggtat tccctttgac 780aagataaccc aggaggctgg agaattcatg atcactttcc catatggcta ccatgctggt 840tttaatcatg gtttcaactg tgcagaatct acaaattttg ctactgtcag atggattgac 900tatggaaaag ttgccaaatt gtgcacttgc aggaaagaca tggtgaagat ttcaatggat 960atctttgtga ggaaatttca gccagacaga tatcagcttt ggaaacaagg aaaggatata 1020tacaccattg atcacacgaa gcctactcca gcatccaccc ctgaagtaaa agcatggctg 1080cagaggagga ggaaagtaag aaaagcatcc cgaagcttcc agtgtgctag gtctacctct 1140aaaaggccta aggctgatga ggaagaggaa gtgtcagatg aagtcgatgg ggcagaggtc 1200cctaaccccg actcagtcac agatgacctc aaggtcagtg aaaagtcaga agcagcagtg 1260aagctgagga acacagaagc atcttcagaa gaagagtcat ctgctagcag gatgcaggtg 1320gagcagaatt tatcagatca tatcaaactc tcaggaaaca gctgcttaag tacatctgta 1380acagaagaca taaaaactga ggatgacaaa gcttatgcat atagaagtgt accttctata 1440tccagtgagg ctgatgattc cattccattg tctactggct atgagaagcc cgagaaatca 1500gacccatccg agctttcatg gccaaagtca cctgagtcat gctcatcagt ggcagagagt 1560aatggtgtgt taacagaggg agaagagagt gatgtggaga gccatgggaa tggccttgaa 1620cctggggaaa tcccagcggt ccccagtgga gagagaaata gcttcaaagt ccccagtata 1680gcagagggag agaacaaaac ctctaagagt tggcgccatc cacttagcag gcctccagca 1740agatctccga tgactcttgt gaagcagcag gcgccaagtg atgaagaatt gcctgaggtt 1800ctgtccattg aggaggaagt ggaagaaaca gagtcttggg cgaaacctct catccacctt 1860tggcagacga agtcccctaa cttcgcagct gagcaagagt ataatgcaac agtggccagg 1920atgaagccac actgtgccat ctgcactctg ctcatgccgt accacaagcc agatagcagc 1980aatgaagaaa atgatgctag atgggagaca aaattagatg aagtcgttac atcggaggga 2040aagactaagc ccctcatacc agagatgtgt tttatttata gtgaagaaaa tatagaatat 2100tctccaccca atgccttcct tgaagaggat ggaacaagtc tccttatttc ctgtgcaaag 2160tgctgcgtac gggttcatgc aagttgttat ggtattcctt ctcatgagat ctgtgatgga 2220tggctgtgtg cccggtgcaa aagaaatgcg tggacagcag aatgctgtct ctgcaatttg 2280agaggaggtg ctcttaagca aacgaagaac aataggtggg cccatgtcat gtgcgccgtt 2340gcggtcccag aagttcgatt cactaatgtc ccagaaagga cacaaataga tgtaggcaga 2400atacctttac agaggttaaa attgaaatgc atcttctgca gacaccgggt taagagggtc 2460tctggagcct gcatccagtg ttcctacggt cgctgcccgg cctccttcca tgtcacttgt 2520gcccatgctg ctggggtact gatggagcct gatgattggc cttatgtggt gaacattaca 2580tgctttcgac ataaggtcaa ccccaacgtg aagtccaagg cttgcgagaa ggtcatttcc 2640gtgggtcaaa cggtcatcac gaagcatcgg aacacccggt attacagttg cagagtgatg 2700gctgtgacat cgcagacctt ctatgaggtc atgtttgatg atggctcctt tagcagagac 2760acatttcctg aggatatcgt gagccgagac tgtctgaagc tgggcccacc tgctgaggga 2820gaagtcgtcc aagtcaagtg gcccgatggc aaactctatg gagcaaaata ttttggatca 2880aatattgccc acatgtacca ggttgagttt gaagatggat cccagatagc aatgaagaga 2940gaggacatct acactttaga tgaagagtta cccaagagag tgaaagctcg attttccaca 3000gcctctgaca tgcgatttga agacacgttt tatggagcag acattatcca aggggagaga 3060aagagacaaa gagtgctgag ctccaggttt aagaatgaat atgtggccga ccctgtatac 3120cgcacttttt tgaagagctc tttccagaag aagtgccaga agagacag 3168<210>3<211>4235<212>DNA<213>人鱗狀細胞癌細胞(KYSE)<220><221>CDS<222>(147)..(3314)<400>3cggcacgaga acagctgtca cctagtgcgg aacaagtctc ccaaatttcc caaatctccc 60tgggccggag gccactgtct tctcttcctc ctccaccgag tcgtgctctc gccccaaccc 120gcgcgccaga cactgcccta accatc atg gag gtg gcc gag gtg gaa agt cct 173Met Glu Val Ala Glu Val Glu Ser Pro1 5ctg aac ccc agc tgt aag ata atg acc ttc aga ccc tcc atg gag gag221Leu Asn Pro Ser Cys Lys Ile Met Thr Phe Arg Pro Ser Met Glu Glu10 15 20 25ttc cgg gag ttc aac aaa tac ctt gca tac atg gag tct aaa gga gcc269Phe Arg Glu Phe Asn Lys Tyr Leu Ala Tyr Met Glu Ser Lys Gly Ala30 35 40cat cgt gcg ggt ctt gca aag gtg att cct cct aag gag tgg aag cca317His Arg Ala Gly Leu Ala Lys Val Ile Pro Pro Lys Glu Trp Lys Pro45 50 55aga cag tgc tat gat gac att gat aat ttg ctc att cca gca cca att365Arg Gln Cys Tyr Asp Asp Ile Asp Asn Leu Leu Ile Pro Ala Pro Ile60 65 70cag cag atg gtc aca ggg cag tca gga ctg ttc act cag tac aac atc413Gln Gln Met Val Thr Gly Gln Ser Gly Leu Phe Thr Gln Tyr Asn Ile75 80 85cag aaa aaa gcg atg act gtg aag gag ttc agg cag ctg gcc aac agt461Gln Lys Lys Ala Met Thr Val Lys Glu Phe Arg Gln Leu Ala Asn Ser90 95 100 105ggc aaa tat tgt act cca aga tac ttg gat tac gaa gat ttg gag cgc509Gly Lys Tyr Cys Thr Pro Arg Tyr Leu Asp Tyr Glu Asp Leu Glu Arg110 115 120aag tac tgg aag aac tta act ttt gtg gca cct atc tat ggt gca gat557Lys Tyr Trp Lys Asn Leu Thr Phe Val Ala Pro Ile Tyr Gly Ala Asp125 130 135att aat ggg agc ata tat gat gag ggt gtg gat gaa tgg aac ata gct605Ile Asn Gly Ser Ile Tyr Asp Glu Gly Val Asp Glu Trp Asn Ile Ala140 145 150cgc atc aat aca gtc ttg gat gtg gtt gaa gaa gag tgt ggc att tct653Arg Ile Asn Thr Val Leu Asp Val Val Glu Glu Glu Cys Gly Ile Ser155 160 165att gag ggt gta aat acc cca tat ctc tat ttt ggc atg tgg aag acc701Ile Glu Gly Val Asn Thr Pro Tyr Leu Tyr Phe Gly Met Trp Lys Thr170 175 180 185acg ttt gca tgg cac acc gaa gac atg gac ctc tat agc att aat tat749Thr Phe Ala Trp His Thr Glu Asp Met Asp Leu Tyr Ser Ile Asn Tyr190 195 200ctc cac ttt gga gag ccc aag tct tgg tat gct ata cct ccg gag cat797Leu His Phe Gly Glu Pro Lys Ser Trp Tyr Ala Ile Pro Pro Glu His205 210 215gga aaa cga ctt gaa aga cta gct caa ggt ttt ttc cca agc agc tcc845Gly Lys Arg Leu Glu Arg Leu Ala Gln Gly Phe Phe Pro Ser Ser Ser220 225 230caa ggg tgt gat gca ttt ctt cgc cac aag atg aca ttg att tct cca893Gln Gly Cys Asp Ala Phe Leu Arg His Lys Met Thr Leu Ile Ser Pro
235 240 245tca gta ttg aag aaa tat ggt att ccc ttt gac aag ata acc cag gag941Ser Val Leu Lys Lys Tyr Gly Ile Pro Phe Asp Lys Ile Thr Gln Glu250 255 260 265gct gga gaa ttc atg atc act ttc cca tat ggc tac cat gct ggt ttt989Ala Gly Glu Phe Met Ile Thr Phe Pro Tyr Gly Tyr His Ala Gly Phe270 275 280aat cat ggt ttc aac tgt gca gaa tct aca aat ttt gct act gtc aga1037Asn His Gly Phe Asn Cys Ala Glu Ser Thr Asn Phe Ala Thr Val Arg285 290 295tgg att gac tat gga aaa gtt gcc aaa ttg tgc act tgc agg aaa gac1085Trp Ile Asp Tyr Gly Lys Val Ala Lys Leu Cys Thr Cys Arg Lys Asp300 305 310atg gtg aag att tca atg gat atc ttt gtg agg aaa ttt cag cca gac1133Met Val Lys Ile Ser Met Asp Ile Phe Val Arg Lys Phe Gln Pro Asp315 320 325aga tat cag ctt tgg aaa caa gga aag gat ata tac acc att gat cac1181Arg Tyr Gln Leu Trp Lys Gln Gly Lys Asp Ile Tyr Thr Ile Asp His330 335 340 345acg aag cct act cca gca tcc acc cct gaa gta aaa gca tgg ctg cag1229Thr Lys Pro Thr Pro Ala Ser Thr Pro Glu Val Lys Ala Trp Leu Gln350 355 360agg agg agg aaa gta aga aaa gca tcc cga agc ttc cag tgt gct agg1277Arg Arg Arg Lys Val Arg Lys Ala Ser Arg Ser Phe Gln Cys Ala Arg365 370 375tct acc tct aaa agg cct aag gct gat gag gaa gag gaa gtg tca gat1325Ser Thr Ser Lys Arg Pro Lys Ala Asp Glu Glu Glu Glu Val Ser Asp380 385 390gaa gtc gat ggg gca gag gtc cct aac ccc gac tca gtc aca gat gac1373Glu Val Asp Gly Ala Glu Val Pro Asn Pro Asp Ser Val Thr Asp Asp395 400 405ctc aag gtc agt gaa aag tca gaa gca gca gtg aag ctg agg aac aca1421Leu Lys Val Ser Glu Lys Ser Glu Ala Ala Val Lys Leu Arg Asn Thr410 415 420 425gaa gca tct tca gaa gaa gag tca tct gct agc agg atg cag gtg gag1469Glu Ala Ser Ser Glu Glu Glu Ser Ser Ala Ser Arg Met Gln Val Glu430 435 440cag aat tta tca gat cat atc aaa ctc tca gga aac agc tgc tta agt1517Gln Asn Leu Ser Asp His Ile Lys Leu Ser Gly Asn Ser Cys Leu Ser445 450 455aca tct gta aca gaa gac ata aaa act gag gat gac aaa gct tat gca1565Thr Ser Val Thr Glu Asp Ile Lys Thr Glu Asp Asp Lys Ala Tyr Ala460 465 470tat aga agt gta cct tct ata tcc agt gag gct gat gat tcc att cca1613Tyr Arg Ser Val Pro Ser Ile Ser Ser Glu Ala Asp Asp Ser Ile Pro475 480 485ttg tct act ggc tat gag aag ccc gag aaa tca gac cca tcc gag ctt1661Leu Ser Thr Gly Tyr Glu Lys Pro Glu Lys Ser Asp Pro Ser Glu Leu490 495 500 505tca tgg cca aag tca cct gag tca tgc tca tca gtg gca gag agt aat1709Ser Trp Pro Lys Ser Pro Glu Ser Cys Ser Ser Val Ala Glu Ser Asn510 515 520ggt gtg tta aca gag gga gaa gag agt gat gtg gag agc cat ggg aat1757Gly Val Leu Thr Glu Gly Glu Glu Ser Asp Val Glu Ser His Gly Asn525 530 535ggc ctt gaa cct ggg gaa atc cca gcg gtc ccc agt gga gag aga aat1805Gly Leu Glu Pro Gly Glu Ile Pro Ala Val Pro Ser Gly Glu Arg Asn540 545 550agc ttc aaa gtc ccc agt ata gca gag gga gag aac aaa acc tct aag1853Ser Phe Lys Val Pro Ser Ile Ala Glu Gly Glu Asn Lys Thr Ser Lys555 560 565agt tgg cgc cat cca ctt agc agg cct cca gca aga tct ccg atg act190lSer Trp Arg His Pro Leu Ser Arg Pro Pro Ala Arg Ser Pro Met Thr570 575 580 585ctt gtg aag cag cag gcg cca agt gat gaa gaa ttg cct gag gtt ctg1949Leu Val Lys Gln Gln Ala Pro Ser Asp Glu Glu Leu Pro Glu Val Leu590 595 600tcc att gag gag gaa gtg gaa gaa aca gag tct tgg gcg aaa cct ctc1997Ser Ile Glu Glu Glu Val Glu Glu Thr Glu Ser Trp Ala Lys Pro Leu605 610 615atc cac ctt tgg cag acg aag tcc cct aac ttc gca gct gag caa gag2045Ile His Leu Trp Gln Thr Lys Ser Pro Asn Phe Ala Ala Glu Gln Glu620 625 630tat aat gca aca gtg gcc agg atg aag cca cac tgt gcc atc tgc act2093Tyr Asn Ala Thr Val Ala Arg Met Lys Pro His Cys Ala Ile Cys Thr635 640 645ctg ctc atg ccg tac cac aag cca gat agc agc aat gaa gaa aat gat2141Leu Leu Met Pro Tyr His Lys Pro Asp Ser Ser Asn Glu Glu Asn Asp650 655 660 665gct aga tgg gag aca aaa tta gat gaa gtc gtt aca tcg gag gga aag2189Ala Arg Trp Glu Thr Lys Leu Asp Glu Val Val Thr Ser Glu Gly Lys670 675 680act aag ccc ctc ata cca gag atg tgt ttt att tat agt gaa gaa aat2237Thr Lys Pro Leu Ile Pro Glu Met Cys Phe Ile Tyr Ser Glu Glu Asn685 690 695ata gaa tat tct cca ccc aat gcc ttc ctt gaa gag gat gga aca agt2285Ile Glu Tyr Ser Pro Pro Asn Ala Phe Leu Glu Glu Asp Gly Thr Ser700 705 710ctc ctt att tcc tgt gca aag tgc tgc gta cgg gtt cat gca agt tgt2333Leu Leu Ile Ser Cys Ala Lys Cys Cys Val Arg Val His Ala Ser Cys715 720 725tat ggt att cct tct cat gag atc tgt gat gga tgg ctg tgt gcc cgg2381Tyr Gly Ile Pro Ser His Glu Ile Cys Asp Gly Trp Leu Cys Ala Arg730 735 740 745tgc aaa aga aat gcg tgg aca gca gaa tgc tgt ctc tgc aat ttg aga2429Cys Lys Arg Asn Ala Trp Thr Ala Glu Cys Cys Leu Cys Asn Leu Arg750 755 760gga ggt gct ctt aag caa acg aag aac aat agg tgg gcc cat gtc atg2477Gly Gly Ala Leu Lys Gln Thr Lys Asn Asn Arg Trp Ala His Val Met765 770 775tgc gcc gtt gcg gtc cca gaa gtt cga ttc act aat gtc cca gaa agg2525Cys Ala Val Ala Val Pro Glu Val Arg Phe Thr Asn Val Pro Glu Arg780 785 790aca caa ata gat gta ggc aga ata cct tta cag agg tta aaa ttg aaa2573Thr Gln Ile Asp Val Gly Arg Ile Pro Leu Gln Arg Leu Lys Leu Lys795 800 805tgc atc ttc tgc aga cac cgg gtt aag agg gtc tct gga gcc tgc atc262lCys Ile Phe Cys Arg His Arg Val Lys Arg Val Ser Gly Ala Cys Ile810 815 820 825cag tgt tcc tac ggt cgc tgc ccg gcc tcc ttc cat gtc act tgt gcc2669Gln Cys Ser Tyr Gly Arg Cys Pro Ala Ser Phe His Val Thr Cys Ala830 835 840cat gct gct ggg gta ctg atg gag cct gat gat tgg cct tat gtg gtg2717His Ala Ala Gly Val Leu Met Glu Pro Asp Asp Trp Pro Tyr Val Val845 850 855aac att aca tgc ttt cga cat aag gtc aac ccc aac gtg aag tcc aag2765Asn Ile Thr Cys Phe Arg His Lys Val Asn Pro Asn Val Lys Ser Lys860 865 870gct tgc gag aag gtc att tcc gtg ggt caa acg gtc atc acg aag cat2813Ala Cys Glu Lys Val Ile Ser Val Gly Gln Thr Val Ile Thr Lys His875 880 885cgg aac acc cgg tat tac agt tgc aga gtg atg gct gtg aca tcg cag2861Arg Asn Thr Arg Tyr Tyr Ser Cys Arg Val Met Ala Val Thr Ser Gln890 895 900 905acc ttc tat gag gtc atg ttt gat gat ggc tcc ttt agc aga gac aca2909Thr Phe Tyr Glu Val Met Phe Asp Asp Gly Ser Phe Ser Arg Asp Thr910 915 920ttt cct gag gat atc gtg agc cga gac tgt ctg aag ctg ggc cca cct2957Phe Pro Glu Asp Ile Val Ser Arg Asp Cys Leu Lys Leu Gly Pro Pro925 930 935gct gag gga gaa gtc gtc caa gtc aag tgg ccc gat ggc aaa ctc tat3005Ala Glu Gly Glu Val Val Gln Val Lys Trp Pro Asp Gly Lys Leu Tyr
940 945 950gga gca aaa tat ttt gga tca aat att gcc cac atg tac cag gtt gag 3053Gly Ala Lys Tyr Phe Gly Ser Asn Ile Ala His Met Tyr Gln Val Glu955 960 965ttt gaa gat gga tcc cag ata gca atg aag aga gag gac atc tac act 3101Phe Glu Asp Gly Ser Gln Ile Ala Met Lys Arg Glu Asp Ile Tyr Thr970 975 980 985tta gat gaa gag tta ccc aag aga gtg aaa gct cga ttt tcc aca gcc 3149Leu Asp Glu Glu Leu Pro Lys Arg Val Lys Ala Arg Phe Ser Thr Ala990 9951000tct gac atg cga ttt gaa gac acg ttt tat gga gca gac att atc caa 3197Ser Asp Met Arg Phe Glu Asp Thr Phe Tyr Gly Ala Asp Ile Ile Gln100510101015ggg gag aga aag aga caa aga gtg ctg agc tcc agg ttt aag aat gaa 3245Gly Glu Arg Lys Arg Gln Arg Val Leu Ser Ser Arg Phe Lys Asn Glu102010251030tat gtg gcc gac cct gta tac cgc act ttt ttg aag agc tct ttc cag 3293Tyr Val Ala Asp Pro Val Tyr Arg Thr Phe Leu Lys Ser Ser Phe Gln103510401045aag aag tgc cag aag aga cag tagtctgcat acatcgctgc aggccacaga 3344Lys Lys Cys Gln Lys Arg Gln1050 1055gcagcttggg ttggaaaaga gaagatgaag ggacatcctt ggggctgtgc cgtgagattt 3404gctggcatag gtgacagggt gtgtctctga cagtggtaaa tcgggtttcc agagtttggt 3464caccaaaaat acaaaataca cacaatgaat tggacgcagc aatctgaaat catctctagt 3524cttgctttca cttgtgagca gttgtcttct atgatcccaa agaagttttc taagtgaaag 3584gaaatactag tgaatcaccc acaaggaaaa gccactgcca cagaggaggc gggtcccctt 3644gtgcggctta gggccctgtc aggaaacaca cggggacctc tctctctagc tccagcaggt 3704ggcacctcgg tacccagcgg gtagggcgat aatttatata ttttccacag tcagggaagg 3764actctcactt atttgtttca aattgcagtt tttataaaac atttttaaaa cacaaatggc 3824atgtatgcta atgagattta cccgtgtgct atctgtattt cccttgtaca gaacttttac 3884atttttgaat attcctatta cttttgattg tgtctgatgg gaactgagtt gttggccttt 3944gtgaaatgaa atttttggct cttgagaaag aattcttatg aattgttatg cgaattttat 4004atatttaaag agggagatct ggggctgtta tttttaaaca ctttttttca taatacatat 4064tccgagtaga tatttataaa atatatgttt ctttcattat gtgtttgtaa aattagagtt 4124taaataaata tgctttgatg catagttttg aactaatgta acatgatttt tcttttttaa 4184aacagcctga aaatgtacta gtgtttaaaa ataaagattt ccattttctc caaaaaaaaa 4244aaaaaaaaa 4253<210>4<211>24<212>DNA<213>人工序列<223>引物2484<400>4aggagtgagc caccgcaccc agcc 24<210>5<211>35<212>DNA<213>人工序列<223>引物PDJ34<400>5tgagcyrwga tyryrccayt gcactccagc ctggg 35<210>6<211>19<212>DNA<213>人工序列<223>引物W1f<400>6cgggttaaga gggtctctg 19<210>7<211>20<212>DNA<213>人工序列<223>引物W1r<400>7ggatgtccct tcatcttctc 20<210>8<211>22<212>DNA<213>人工序列<223>引物W2f<400>8aataccttgc atacatggag tc 22<210>9<211>22<212>DNA<213>人工序列<223>引物W2r<400>9cttcttcaac cacatccaag ac 2權利要求
1.一種被分離的DNA分子,其包括下列多核苷酸(a)-(d)中的一種(a)編碼多肽的多核苷酸,所述多肽由SEQ ID NO1所示的氨基酸序列組成;(b)與SEQ ID NO2所示核苷酸序列比較具有至少95%同源性的多核苷酸;(c)在嚴格條件下,能與SEQ ID NO2所示的核苷酸序列雜交的多核苷酸;(d)與上述多核苷酸(a)或(b)互補的多核苷酸。
2.根據權利要求1所述的被分離的DNA分子,其是編碼由SEQ IDNO1所示氨基酸序列組成的多肽的多核苷酸。
3.根據權利要求2所述的被分離的DNA分子,其具有SEQ IDNO2所示的核苷酸序列。
4.一種表達產物,其包括SEQ ID NO1所示的氨基酸序列。
5.一種重組表達載體,其包括根據權利要求1或3所述的被分離的DNA分子。
6.一種重組表達載體,其包括根據權利要求3所述的被分離的DNA分子。
7.一種宿主細胞,其內含根據權利要求5所述的重組表達載體。
8.一種宿主細胞,其內含根據權利要求6所述的重組表達載體。
9.一種GASC1檢測用探針,其具有包括SEQ ID NO2所示核苷酸序列中的至少15個連續核苷酸的序列。
10.根據權利要求9所述的GASC1檢測用探針,其具有包括SEQID NO2所示核苷酸序列中的至少30個連續核苷酸的序列。
11.一種癌癥診斷劑,其包括根據權利要求9所述的探針作為活性成分。
12.一種癌癥診斷劑,其包括根據權利要求10所述的探針作為活性成分。
13.一種癌癥診斷試劑盒,其包括根據權利要求9所述的探針作為活性成分。
14.一種癌癥診斷試劑盒,其包括根據權利要求10所述的探針作為活性成分。
15.一種抗體或抗體片段,其能夠與根據權利要求1所述的被分離的DNA分子的表達產物結合。
16.一種診斷癌癥的方法,其包括下列步驟制備生物樣品,制備根據權利要求15所述的抗體或抗體片段,以及將所述樣品與所述抗體或抗體片段免疫反應并且檢測樣品中的免疫反應產物。
全文摘要
本發明提供例如基因,其包括編碼具有SEQ ID NO1所示氨基酸序列的多肽的多核苷酸。該基因顯示在9p23-24區域中的擴增,具有PX結構域和PHD指狀結構基元,在細胞生長和分化以及腫瘤發生中發揮了重要作用,以及用于闡明各種由蛋白導致的疾病的病理學,所述蛋白參與惡性腫瘤等中的細胞分化,并用于這些疾病的診斷和治療。
文檔編號C12N15/12GK1436236SQ01811036
公開日2003年8月13日 申請日期2001年6月12日 優先權日2000年6月12日
發明者稻澤讓治, 井本逸勢 申請人:大塚制藥株式會社