麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

癌癥中的復現性基因融合體的制作方法

文檔序號:391878閱讀:967來源:國知局
專利名稱:癌癥中的復現性基因融合體的制作方法
技術領域
本發明涉及用于癌癥診斷、研究和治療的組合物和方法,包括但不限于癌癥標志物。具體來說,本發明涉及作為癌癥(例如前列腺癌)的診斷標志物和臨床靶點的復現性基因融合體(recurrent gene fusion)。
背景技術
癌癥研究的中心目標是鑒定與腫瘤發生具有因果關聯的改變的基因。已經鑒定到幾種類型的體細胞突變,包括堿基取代、插入、缺失、易位以及染色體增多和丟失,它們都引起癌基因或腫瘤抑制基因活性的改變。染色體重排是癌癥的病因這一假說,在1900年代早期首次提出,現在得到了令人信服的證據(Rowley, Nat Rev Cancer 1:245(2001))。復現性染色體畸變被認為是白血病、淋巴瘤和肉瘤的主要特征。上皮腫瘤(癌)常見得多并造成相對高比例的與人類癌癥相關的發病和死亡,其包含不到I %的已知的、疾病特異性的染色體重排(MiteIman,Mutat Res 462:247(2000))。盡管血液癌經常具有平衡的、疾病特異性染色體重排的特征,但大多數實體腫瘤具有過多的非特異性染色體畸變。據認為,實體腫瘤的核型復雜性是由于通過癌癥演化或發展而獲得的繼發改變。已經描述了染色體重排的兩種主要機制。在一種機制中,一個基因的啟動子/增強子元件被重排到原癌基因附近,從而引起致癌蛋白表達的改變。這種易位類型的實例是免疫球蛋白(IG)和T-細胞受體(TCR)基因與MYC的并置,其分別在B-和T-細胞癌中引起該癌基因的活化(Rabbitts,Nature 372:143(1994))。在第二種機制中,重排導致兩個基因的融合,由此產生了可能具有新功能或改變的活性的融合蛋白。這種易位的范例是慢性粒細胞白血病(CML)中的 BCR-ABL 基因融合體(Rowley, Nature 243 :290(1973) ;de Klein等,Nature 300:765(1982))。重要的是,該發現導致了甲磺酸伊馬替尼(Gleevec)的合理開發,其成功地靶向BCR-ABL激酶(Deininger等,Blood 105 :2640 (2005))。因此,在常見上皮腫瘤中鑒定復現性基因重排,對于癌癥藥物發現工作以及患者治療可能具有深遠意義。發明概述本發明涉及用于癌癥診斷、研究和治療的組合物和方法,包括但不限于癌癥標志物。具體來說,本發明涉及作為癌癥(例如前列腺癌)的診斷標志物和臨床靶點的復現性基因融合體。例如,在某些實施方案中,本發明提供了用于在患者中鑒定前列腺癌的方法,所述方法包含提供來自患者的樣本;以及檢測樣本中具有來自SLC45A3基因轉錄調控區的5’部分和來自ELK4基因的3’部分的基因融合體的存在或不存在,其中在樣本中檢測到基因融合體的存在鑒定了患者中的前列腺癌。在某些實施方案中,SLC45A3基因的轉錄調控區包含SLC45A3基因的啟動子區。在某些實施方案中,檢測包含檢測具有從SLC45A3基因的轉錄調控區轉錄的5’ RNA部分和從ELK4基因轉錄的3’ RNA部分的嵌合mRNA轉錄物。在某些實施方案中,基因融合體是通讀轉錄物。在某些實施方案中,樣本是組織、血液、血漿、血清、尿液、尿液上清液、尿液細胞沉淀、精液、前列腺分泌物和前列腺細胞。在某些實施方案中,方法還包含檢測具有來自雄激素調控基因或持家基因的轉錄調控區5’部分和來自ETS家族成員基因的3’部分的基因融合體的存在或不存在的步驟。在其他實施方案中,本發明提供了用于鑒定患者前列腺癌的方法,所述方法包含提供來自患者的樣本;以及檢測樣本中選自下列的基因融合體的存在或不存在USP10:ZDHHC7、EIF4E2:HJURP, HJURP: INPP4A、STRN4:GPSN2、RC3H2:RGS3、LMAN2:AP3S1、ZNF649-ZNF577或MIPOLl: DGKB,其中在樣本中檢測到基因融合體的存在鑒定了患者的前列腺癌。在某些實施方案中,檢測包含檢測基因組DNA的染色體重排。在某些實施方案中, 檢測包含檢測嵌合mRNA轉錄物或通讀轉錄物。在某些實施方案中,樣本是組織、血液、血漿、血清、尿液、尿液上清液、尿液細胞沉淀、精液、前列腺分泌物或前列腺細胞。在其他實施方案中,本發明提供了用于在患者中鑒定前列腺癌的方法,所述方法包含提供來自患者的樣本;以及檢測樣本中具有來自HERPmn基因的轉錄調控區5’部分和來自ERG基因的3’部分的基因融合體的存在或不存在,其中在樣本中檢測到基因融合體的存在鑒定了患者的前列腺癌。在其他實施方案中,本發明提供了用于鑒定患者前列腺癌的方法,所述方法包含提供來自患者的樣本;以及檢測樣本中具有來自AX747630基因的轉錄調控區5’部分和來自ETVl基因的3’部分的基因融合體的存在或不存在,其中在樣本中檢測到基因融合體的存在鑒定了患者的前列腺癌。在其他實施方案中,本發明提供了用于在患者中鑒定前列腺癌的方法,所述方法包含提供來自患者的樣本;以及檢測樣本中選自下列的基因融合體的存在或不存在HERPUDI:ERG、TIAI:DIRC2、NUP214:XKR3、DLEU2:PSPCI、PIK3C2A:TEADI、SPOCKI:TBC1D9B 或RERE: PIK3CD,其中在樣本中檢測到基因融合體的存在鑒定了患者的前列腺癌。本發明的其他實施方案提供了用于鑒定患者乳腺癌的方法,所述方法包含提供來自患者的樣本;以及檢測樣本中選自下列的基因融合體的存在或不存在AHCYLl: RAD51C、ARHGAP19: DRGl、BC017255: TMEM49、FCHOl :MY09B 或 PAPOLA:AK7,其中在樣本中檢測到基因融合體的存在鑒定了患者的前列腺癌。本發明的其他實施方案提供了用于鑒定患者前列腺癌的方法,所述方法包含提供來自患者的樣本;以及檢測樣本中選自下列的基因融合體的存在或不存在SLC45A3-ELK4、ZNF649-ZNF577、CARMl:YIPF2、MGCl1102:BANFl、SLC4A1AP:SUPT7L、ERCC2:KLC3、PMFl:BGLAP, TH0C6:HCFC1R1、NDUFB8:SEC31L2、ANKRD39:ANKRD23、C14orfl24:KIAA0323、C14orf21:CIDEB 或 ZNF511:TUBGCP2,其中在樣本中檢測到基因融合體的存在鑒定了患者的前列腺癌。在其他實施方案中,本發明提供了組合物,其包含下列的至少一種(a)寡核苷酸探針,其包含與嵌合基因組DNA或嵌合mRNA的連接處雜交的序列,其中嵌合基因組DNA或嵌合mRNA的5’部分來自于SLC45A3基因的轉錄調控區,并且嵌合基因組DNA或嵌合mRNA的3’部分來自于ELK4基因; (b)第一寡核苷酸探針,其包含與來自于SLC45A3基因轉錄調控區的嵌合基因組DNA或嵌合mRNA的5’部分雜交的序列,以及第二寡核苷酸探針,其包含與來自ELK4基因的嵌合基因組DNA或嵌合mRNA的3’部分雜交的序列;或(c)第一擴增寡核苷酸,其包含與來自于SLC45A3基因轉錄調控區的嵌合基因組DNA或嵌合mRNA的5’部分雜交的序列,以及第二擴增寡核苷酸,其包含與來自ERG基因的嵌合基因組DNA或嵌合mRNA的3’部分雜交的序列。在其他實施方案中,本發明提供了組合物,其包含下列的至少一種(a)寡核苷酸探針,其包含與基因融合體的嵌合基因組DNA或嵌合mRNA的連接處雜交的序列,所述基因融合體選自USP10:ZDHHC7、EIF4E2:HJURP, HJURP: INPP4A、STRN4:GPSN2、RC3H2:RGS3、LMAN2:AP3S1、ZNF649-ZNF577 和 MIPOLl :DGKB ;(b)第一寡核苷酸探針,其包含與來自基因融合體的嵌合基因組DNA或嵌合mRNA的5’部分雜交的序列,所述基因融合體選自USP10:ZDHHC7、EIF4E2:HJURP、HJURP:INPP4A, STRN4:GPSN2、RC3H2:RGS3、LMAN2:AP3S1、ZNF649-ZNF577 和 MIPOLl :DGKB,以及第二寡核苷酸探針,其包含與來自基因融合體的嵌合基因組DNA或嵌合mRNA的3’部分雜交的序列,所述基因融合體選自USP10:ZDHHC7、EIF4E2:HJURP, HJURP: INPP4A,STRN4:GPSN2、RC3H2:RGS3、LMAN2:AP3SI、ZNF649-ZNF577、MIPOLl:DGKB ;或(c)第一擴增寡核苷酸,其包含與來自基因融合體轉錄調控區的嵌合基因組DNA或嵌合mRNA的5’部分雜交的序列,所述基因融合體選自USP10:ZDHHC7、EIF4E2:HJURP,HJURP:INPP4A, STRN4:GPSN2、RC3H2:RGS3、LMAN2:AP3S1、ZNF649-ZNF577 和 MIPOLl :DGKB,以及第二擴增寡核苷酸,其包含與來自基因融合體的3’部分雜交的序列,所述基因融合體選自USPlO :ZDHHC7、EIF4E2:HJURP、HJURP:INPP4A、STRN4:GPSN2、RC3H2:RGS3、LMAN2:AP3S1、ZNF649-ZNF577 和 MIPOLl:DGKB。在某些實施方案中,本發明提供了組合物,其包含下列的至少一種(a)寡核苷酸探針,其包含與基因融合體的嵌合基因組DNA或嵌合mRNA的連接處雜交的序列,所述基因融合體選自HERPUD1:ERG、AX747630:ETVl、TIA1:DIRC2、NUP214:XKR3、DLEU2:PSPC1、PIK3C2A:TEADl、SPOCKl:TBC1D9B、RERE:PIK3CD、AHCYLl:RAD51C、ARHGAP19:DRGl、BCO17255:TMEM49、FCHOl:MY09B、PAPOLA:AK7、CARM1:YIPF2、 MGC11102:BANF1、 SLC4A1AP:SUPT7L、 ERCC2:KLC3、 PMFl:BGLAP,TH0C6:HCFC1R1、 NDUFB8:SEC3IL2、 ANKRD39:ANKRD23、 C14orf124:KIAA0323,C14orf21:CIDEB 或 ZNF511:TUBGCP2 ;(b)第一寡核苷酸探針,其包含與來自基因融合體的嵌合基因組DNA或嵌合mRNA的5’部分雜交的序列,所述基因融合體選自HERPUD1: ERG、AX747630: ETVl、TIA1:DIRC2、NUP214:XKR3、DLEU2:PSPC1、PIK3C2A:TEADI、SPOCKl:TBC1D9B、RERE:PIK3CD、AHCYLl: RAD51C、ARHGAP19 : DRGl、BC017255 : TMEM49、FCHOl :MY09B、PAP0LA:AK7、CARM1:YIPF2、MGCl 1102:BANFl、SLC4A1AP:SUPT7L、ERCC2:KLC3、PMFl:BGLAP, TH0C6:HCFC1R1、NDUFB8: SEC31L2、ANKRD39:ANKRD23、C14orf 124:KIAA0323、C14orf21:CIDEB或ZNF511 :TUBGCP2,以及第二寡核苷酸探針,其包含與來自基因融合體的嵌合基因組DNA或嵌合mRNA的3’部分雜交的序列,所述基因融合體選自HERPUD1:ERG、AX747630:ETV1、TIA1:DIRC2、NUP214:XKR3、DLEU2:PSPCU PIK3C2A:TEADl、SPOCKl :TBC1D9B、RERE:PIK3CD、AHCYLl: RAD51C、ARHGAP19:DRGl、BC017255: TMEM49、FCHOl:MY09B、PAPOLA:AK7、CARMl:YIPF2、MGCl1102:BANFl、SLC4A1AP:SUPT7L、ERCC2:KLC3、PMFI:BGLAP, TH0C6:HCFC1R1 、NDUFB8:SEC31L2、ANKRD39:ANKRD23、C14orfl24:KIAA0323、C14orf21:CIDEB 或 ZNF511:TUBGCP2 ;(c)第一擴增寡核苷酸,其包含與來自基因融合體轉錄調控區的嵌合基因組DNA或嵌合mRNA的5’部分雜交的序列,所述基因融合體選自HERPUD1 :ERG、AX747630:ETV1、TIA1:DIRC2、NUP214:XKR3、DLEU2:PSPC1、PIK3C2A:TEADI、SPOCKl :TBC1D9B、RERE:PIK3CD、AHCYLl:RAD51C、ARHGAP19 :DRGl、BC017255 : TMEM49、FCH01:MY09B、PAP0LA:AK7、CARM1:YIPF2、MGCl 1102:BANFl、SLC4A1AP:SUPT7L、ERCC2:KLC3、PMF1:BGLAP、TH0C6:HCFC1R1、NDUFB8:SEC31L2、ANKRD39:ANKRD23、C14orfl24:KIAA0323、C14orf21:CIDEB 或 ZNF511 :TUBGCP2,以及第二擴增寡核苷酸,其包含與來自基因融合體的3’部分雜交的序列,所述基因融合體選自HERPUD1:ERG、AX747630:ETV1、TIA1:DIRC2、NUP214:XKR3、DLEU2:PSPC1、PIK3C2A:TEADl、SPOCKl :TBC1D9B、RERE:PIK3CD、AHCYLl: RAD51C、ARHGAP19:DRGl、BC017255 :TMEM49、FCHOl:MY09B、PAPOLA:AK7、CARMl:YIPF2、MGCl1102:BANFl、SLC4A1AP:SUPT7L、ERCC2:KLC3、PMFl:BGLAP, TH0C6:HCFC1R1、NDUFB8: SEC31L2、ANKRD39:ANKRD23、C14orfl24:KIAA0323、C14orf21:CIDEB 或 ZNF511:TUBGCP2。本發明的其他實施方案在本文中描述。


圖I顯示了在慢性髓性白血病細胞系K652中使用轉錄組大規模平行測序“重新發現”的BCR-ABLl基因融合體。插圖顯示了 K562細胞中BCR-ABLl融合基因表達的qRT-PCR驗證。圖2顯示了使用轉錄組測序鑒定嵌合轉錄物的示意圖。與參比數據庫相比的“長讀段”序列被分類為“定位(mapping) ”、“部分配準”和“未定位(nonmapping) ”讀段。圖3顯示了預測的VCaP驗證的嵌合體與基于長讀技術、短讀技術和一體化方法通過計算預測的嵌合體總數相比的直方圖。圖4顯示了由長讀段指名的未能通過qRT-PCR驗證的融合嵌合體。TMPRSS2-ERG和USP10-ZDHHC7是該18個候選物的組在VCaP細胞中得到驗證的僅有的兩個嵌合體。圖5顯示了在前列腺癌細胞系VCaP中鑒定的代表性基因融合體。上圖,16號染色體上USP10-ZDHHC7融合體的示意圖。USPlO的外顯子I與位于相同染色體上相反方向的ZDHHC7的外顯子3融合。插圖顯示了 USP10-ZDHHC7轉錄物的qRT-PCR驗證的直方圖。下圖,導致2號染色體上涉及HJURP的兩個基因融合體的復雜的染色體內重排的示意圖。HJURP的外顯子8與EIF4E2的外顯子2融合,形成HJURP-EIF4E2。INPP4A的外顯子25與HJURP 的外顯子 9 融合,形成 INPP4A-HJURP。插圖顯示了 HJURP-EIF4E2 和 INPP4A-HJURP轉錄物的qRT-PCR驗證的直方圖。
圖6顯示了 2qll和2q37處涉及INPP4A、EIF4E2和HJURP基因的染色體重排的FISH分析。a,示意性顯示了 INPP4A、EIF4E2和HJURP基因的基因組組織。水平條表示BAC克隆的位置。b,使用BAC克隆2和3進行的FISH分析,顯示了 INPP4A和HJURP基因在標志染色體上的融合。箭頭分別指示2qll處的5’ INPP4A探針和2q37處的3’ HJURP探針在正常2號染色體的兩個拷貝上的雜交。c,HJURP探針與2號染色體的兩個正常拷貝和在標志染色體上的雜交指示了 EIF4E2與HJURP基因之間的斷點,導致2q染色體的3’末端易位到標志染色體上。山探針2和4雜交到兩個正常2號染色體、標志染色體上以及衍生的2號染色體上的分裂信號,證實了探針2和4內的斷點導致插入到標志染色體中。e,通過標志染色體上探針3的存在以及正常2號染色體的兩個拷貝上的共定位信號,證實了 INPP4A基因的重排。
圖7顯示了前列腺癌細胞系LNCaP中MIP0L1-DGKB基因融合體的示意圖。MIP0L1-DGKB是染色體間基因融合體,伴有7號染色體上的ETVl基因座隱蔽插入到14號染色體上的MIPOLl內含子中。顯示了以前在DGKB和MIPOLl中確定的基因組斷點(星號)。插入事件導致DGKB和ETVl的3’末端倒置到MIPOLl在外顯子10和11之間的內含子中。插圖顯示了 MIP0L1-DGKB轉錄物的qRT-PCR驗證的直方圖。圖8顯示了涉及MIPOLl、DGKB和ETVl的染色體重排的FISH分析,a,染色體7ρ21· 2上ETVl和DGKB基因座的基因組組織示意圖。基因取向由箭號指示。以前在DGKB中鑒定到的基因組斷點用星號標出。FISH分析使用BAC克隆在VCaP和LNCaP細胞上進行。包含ETVl和DGKB兩者的探針位置用水平條指示。基因組坐標標出了跨越兩個BAC克隆的區域。b,共定位信號(正常)用箭號標出,箭頭指示分裂信號。C,顯示了染色體14ql3.3-q21. I上MIPOLl基因座的基因組組織的示意圖。d,FISH分析沒有在LNCaP或VCaP細胞中揭示分裂信號。e,MIPOLl、ETV1和DGKB基因座分別在染色體7ρ21· 2和14ql3. 3_q21. I上的基因組組織。f,FISH分析顯示了 LNCaP細胞中的共定位,但是在VCaP細胞中沒有。圖9顯示了嵌合的V類通讀融合體。通讀融合體的示意圖伴有在前列腺癌細胞系VCaP和LNCaP、轉移性前列腺組織VCaP_met和Met 2以及良性前列腺細胞系RWPE和PREC中融合轉錄物的 qRT-PCR 驗證,a, C19orf 25-APC2 (內含子),b,WDR55-DNDI,c,MBTPS2-YY2,以及 d,ZNF649-ZNF577。圖10顯示了前列腺組織中的嵌合候選物。a,TMPRSS2-ERG融合邊界的示意圖,存在有在VCaP-Met和Met 3組織中測序到的短讀段。b,轉移性前列腺癌組織Met 3中19號染色體上的STRN4-GPSN2融合體的示意圖。STRN4的5’部分與以相反取向位于同一染色體上的GPSN2的外顯子2融合。C,轉移性前列腺癌組織VCaP-Met中9號染色體上的RC3H2-RGS3融合體的示意圖。RC3H2的5’部分與以相反取向位于同一染色體上的RGS3的外顯子20融合。d,凝集素——甘露糖結合蛋白2(LMAN2)的外顯子I與銜接相關蛋白復合體3亞基I (AP3S1)的外顯子2之間的復合的染色體內基因融合體的示意圖。在前列腺癌細胞系VCaP和轉移性前列腺組織VCaP-Met中LMAN2-AP3S1融合轉錄物表達的qRT-PCR驗證。圖11顯示了前列腺癌中復現性SLC45A3-ELK4嵌合體的發現和癌癥中嵌合轉錄物的通用分類系統。左上圖,位于I號染色體上的SLC45A3-ELK4嵌合體的示意圖。左中圖,在一組細胞系中SLC45A3-ELK4轉錄物的qRTPCR驗證。插圖,用R1881處理的LNCaP細胞中SLC45A3-ELK4轉錄物的qRT-PCR驗證的直方圖。左下圖,在一組前列腺旁良性前列腺組織、局限性前列腺癌(PCA)和轉移性前列腺癌(Mets)中qRT-PCR驗證的直方圖。右圖,嵌合體分類示意圖(在下文描述)。
圖12顯示了在表達SLC45A3-ELK4 mRNA嵌合體的前列腺癌中,SLC45A3-ELK4基因座缺乏重排。ELK4基因針對重排的熒光原位雜交分析。示意圖(上圖)顯示了 SLC45A3和ELK4基因在染色體lq32. I上的基因組組織。BAC克隆分別源自于ELK4和SLC45A3基因的3’和5’區域的緊鄰側翼。探針雜交到SLC45A3-ELK4嵌合體陽性細胞系LNCaP(a,中期涂片;b,間期)以及表達mRNA嵌合體的5種指標前列腺腫瘤(a、e、f、g&h)上。c,DU145是SLC45A3-ELK4嵌合體陰性前列腺癌細胞系。圖13顯示了使用基因分型控制臺軟件(Genotyping Console software),使用Affymetrix SNP 6. O對15個樣本進行的基因組水平分析。將拷貝數狀態分成下列類別O-純合缺失;1_雜合缺失;2_正常二倍體;3_增加單個拷貝;和4-增加多個拷貝。基因組組織顯示了相對于(a) SLC45A3-ELK4和(b) PTEN的基因組畸變。圖14顯示了對一組前列腺癌細胞系和良性組織、局限性前列腺癌和轉移組織針對復現性進行的基于qRT-PCR的的調查。USP10-ZDHHC7 (a)、INPP4A-HJURP (c)和HJURP-EIF4E2 (d)都在VCaP和VCaP-Met中顯示出表達,并且沒有在來自該組的任何其他樣本中得到驗證。(b) STRN4-GPSN2表達在Met 3中得到驗證。圖15顯示了局限于前列腺癌樣本并且在來自相同患者的體細胞組織中不存在的融合體轉錄物表達的基于qRT-PCR的驗證。在兩位患者中測試了 5種融合基因TMPRSS2-ERG (a)、GPSN2-STRN4 (b)、USP10-ZDHHC7 (c)、RC3H2-RGS3 (d)、HJURP-EIF4E2 (e)、INPP4A-HJURP(f)、LMAN2-AP3S1(g)、MBTPS2-YY2(h)和 ZNF649-ZNF577(i)。圖16顯示在腫瘤樣本MET3中涉及STRN4-GPSN2基因融合體的染色體重排的FISH分析。上圖顯示了位于19號染色體上的GSPN2和STRN4基因的基因組組織。在良性樣本中觀察到了正常信號圖樣(a),而共定位信號只在腫瘤樣本中指示了基因融合體(b)。圖17顯示了在來自VCaP-Met的腫瘤和配對的正常組織中涉及EIF4E2-HJURP、USP10-ZDHHC7和INPP4A-HJURP基因融合體的染色體重排的FISH分析。左圖上的示意圖顯示了基因在其相應染色體上的基因組組織。圖18顯示了涉及MRPSlO和HPR的染色體重排的FISH分析。A,MRPS10_HPR融合體的示意圖。位于6號染色體上的MRPSlO的外顯子6-7與16號染色體上HPR的外顯子7融合。b,顯示HPR基因座的基因組組織的示意圖。水平條指示分別來自于基因的5’和3’末端的BAC克隆的近似位置。C,來自LNCaP細胞的FISH圖像顯示了正常16號染色體的兩個拷貝、衍生的16號染色體[der(16)]的兩個拷貝,以及在衍生的6號染色體[der(6)]上驗證了 HPR基因中重排的單個紅色信號。d,顯示MRPSlO和HPR基因座的基因組組織的示意圖。水平條指示了分別來自于MRPSlO和HPR基因的5’和3’末端的BAC克隆的大致位置。e,來自LNCaP細胞的FISH圖像顯示出MRPSlO探針與6號染色體的兩個拷貝的雜交,并且箭頭指示了 HPR探針與正常16號染色體的兩個拷貝的雜交。der(6)上的單個共定位信號證實了 MRPSlO與HPR的融合。圖19顯示了通過陣列CGH所觀察到的16號染色體上位于USP10-ZDHHC7融合體附近的基因組畸變的作圖。在VCaP和VCaP親代組織(VCaP-Met)中觀察到涉及兩個基因的缺失,但是在正常前列腺細胞系RWPE中沒有觀察到。圖20顯示了在尿液沉淀物中SLC45A3: ELMmRNA的鑒定。圖21顯示了配對末端轉錄組分析相對于單個讀段方法的動態范圍和靈敏度。(A)配對末端和單個轉錄組長讀段的比較支持了已知基因融合體TMPRSS2-ERG、BCR-ABLUBCAS4-BCAS3 和 ARFGEF2-SULF2。(B) VCaP 中 TMPRSS2-ERG 的示意表示圖,比較了配偶對與單個長轉錄組讀段。(上圖)以對數標度顯示的配偶對的頻率,根據它們是包含還是跨過融合邊界進行區分;(下圖)跨過TMPRSS2-ERG融合邊界的100聚體單個轉錄組讀段。(C)來自UHR和HBR的配對末端和單個長讀段策略兩者的嵌合體提名的文氏圖(Venn diagram)。圖22顯示了配對末端轉錄組分析的綜合。㈧突出了應用于VCaP(左側)和LNCaP(右側)的配對末端基因融合體發現與以前報道的整合方法之間的重疊的文氏圖。較大的圓圈包涵了所有經實驗驗證的由配對末端測序提出的嵌合體。內部的圓圈顯示了以前通過整合方法報告的所有以前驗證過的嵌合體是配對末端提名的子集。(B)在VCaP和K562中經實驗驗證的嵌合體的直方圖,強調了已知復現性基因融合體TMPRSS2-ERG和BCR-ABLl與它們相應細胞系中的次級基因融合體之間的差異。(C)在MCF-7中使用配對末端轉錄組測序對嵌合體的全面檢測。圖23顯示了基于RNA的嵌合體。(A)熱圖顯示了支持每個跨樣本通讀嵌合體的讀段的歸一化數量,其在O至30的范圍內。(上圖)熱圖突出了在UHR、HBR、VCaP和K562中廣泛表達的嵌合體。(下圖)熱圖突出了富含染色體間和染色體內重排的排序靠前的限制性基因融合體的表達。(B)將基于RNA的嵌合體分類成(i)通讀體、(ii)會聚轉錄物、
(iii)發散轉錄物和(iv)交疊轉錄物的說明性實例。(C上圖)配對末端方法將來自獨立基因的讀段關聯為屬于同一轉錄單位(右側),而單個讀段方法將這些指派給不相關的基因(左側)。(下圖)單個讀段方法要求嵌合體跨越融合體連接處(左側),而配對末端方法可以不依賴于基因指名而與配偶對關聯(右側)。圖24顯示了在局限性前列腺癌中發現以前未描述的ETS基因融合體。(A)位于16號染色體上的HERPmn的外顯子I與位于21號染色體上的ERG的外顯子4之間的染色體間基因融合體的示意圖。(B)顯示HERPUD1和ERG基因的基因組組織的示意圖。水平條指示了 BAC克隆的位置。(下圖)使用BAC克隆的FISH分析,顯示了正常組織中的HERPUD1和ERG (左側)、腫瘤中的ERG5區域缺失(中央)和腫瘤樣本中的HERPUD1-ERG融合體(右側)。(C)位于17號染色體上的AX747630與位于21號染色體上的ETVl的外顯子4(橙色)之間的染色體間基因融合體的示意圖。(D上圖)AX747630和ETVl基因的基因組組織的示意圖。(下圖)使用BAC克隆的FISH分析,顯示了腫瘤樣本中ETVl的分裂(左側)和腫瘤樣本中AX747630與ETVl的共定位(右側)。圖25顯示了配對末端方法與單個讀段方法相比的改進。(A)配對末端方法分辨不明確的定位。(上圖)單個讀段方法(左側)顯示單個讀段或“配偶1”,與基因X和基因Y同樣匹配,從而導致該讀段被分類為具有多個定位。配對末端方法(右側)顯示了與單個讀段方法相同的與基因X和基因Y配準的讀段。然而,相應的配偶對或“配偶2”以預期的插入片段大小與基因X配準,但是不與基因Y配準。(下圖)根據單個讀段方法,配偶I顯 示了對基因Y的最佳唯一命中(best unique hit),以及對基因X的次佳命中(左側)。但是,使用配對末端方法,第二個配偶(右側)顯示出對基因X的最佳唯一命中,表明了實際的最佳命中。(B)配對末端測序增加了跨越融合體連接處的覆蓋度。盡管單個讀段方法能夠僅僅通過跨越融合體連接處來檢測基因融合體(左側),但配對末端方法能夠在配偶對跨越融合體連接處或配偶對包涵融合體連接處的情況下檢測嵌合體(右側),從而提供了更多發現嵌合體的機會。(C)跨融合體連接處的單個讀段的限制。圖26顯示了用于發現嵌合體的配對末端轉錄組測序。(A)使用末端配對轉錄組測序鑒定嵌合轉錄物的生物信息學方法的示意圖。將配偶對分類成下列類別(i)配偶對與同一基因配準,(ii)配偶對與不同基因配準(嵌合體候選物),(iii)未定位,(iv)線粒體,(v)核糖體,以及(Vi)質量控制。未定位配偶對根據(i)它們是都不能定位于基因,還是(ii)只有單個配偶讀段不能與基因配準,來進一步分類。(B)UHR和HBR配對末端和長轉錄組讀段方法按道分布的覆蓋度統計量。
圖27顯示了新的配對末端圖表和實驗驗證。(A)染色體13q34上UHR臂內倒位的示意圖,其在GAS6的外顯子5與RASA3的外顯子4之間產生基因融合體。(B)新的造血基因融合體NUP214-XKR3。9號和22號染色體之間BCR-ABLl和NUP214-XKR3染色體間基因融合體的示意圖。對于UHR和K562兩者來說,配偶對和長的單個讀段以對數標度顯示的代表性分布。(C)在慢性骨髓性白血病細胞系間NUP214-XKR3轉錄物的qRT-PCR驗證的直方圖。(D)新的復雜的染色體間重排ZDHHC7-ABCB9。USP10-ZDHHC7的染色體內重排和ZDHHC7-ABCB9染色體間基因融合體的示意圖。(E) ZDHHC7-ABCB9轉錄物的qRT-PCR驗證的直方圖。圖28顯示了新的VCaP染色體間基因融合體TIA1-DIRC2的驗證。(A)位于2號染色體上的TIAl與位于3號染色體上的DIRC2之間的VCaP染色體間基因融合體的示意圖。插圖顯示了 TIA1-DIRC2轉錄物的qRT-PCR驗證的直方圖。(B)顯示TIAl和DIRC2基因的基因組組織的示意圖。水平條指示了 BAC克隆的位置(上圖)。使用BAC克隆的FISH分析顯示了標志染色體上TIAl與DIRC2基因的融合(下圖)。圖29顯示了新的嵌合體的實驗驗證。MCF-7中新的配對末端提名的定量RT-PCR驗證(A)ARHGAP19-DRG1,(B) BC017255-TMEM49,(C) AHCYL1-RAD51C, (D)MY09B_FCH01 和(E)PAP0LA-AK7。前列腺腫瘤嵌合體的驗證包括(F) aT64中的HERPUDI-ERG,以及(G)aT52中的AX747630-ETV1。(H)新的驗證嵌合體的總歸納。圖30顯示了在LNCaP和VCaP雄激素時程中HERPUDI和AX747630的RNA-Seq基因表達和雄激素調控。直方圖表示在饑餓和用R1881在6、24和48h時處理的LNCaP和VCaP細胞系中(A)HERPUDl和(B)AX747630的歸一化的基因表達值。(C)ChIP-Seq結合揭示出前列腺細胞系中HERPUD1和AX747630的AR調控。ChIP-Seq峰的示意圖表示在LNCaP和VCaP中,雄激素在HERPUD1 (左側)和AX747630 (右側)的上游附近結合。定義為了便于理解本發明,下面對許多術語和詞組進行定義當在本文中使用時,術語“基因融合體”是指嵌合的基因組DNA、嵌合的信使RNA、由第一個基因的至少一部分與第二個基因的至少一部分融合產生的截短蛋白或嵌合蛋白。基因融合體不必包括全部基因或基因的外顯子。當在本文中使用時,術語“在癌癥中上調的基因”是指與其他組織中的水平相比,在癌癥(例如前列腺癌)中以更高水平表達(例如mRNA或蛋白表達)的基因。在某些實施方案中,在癌癥中上調的基因的表達水平比在其他組織中的表達水平高至少10 %、優選至少25 %、更優選至少50 %、更加優選至少100 %、更加優選至少200 %、最優選至少300 %。在某些實施方案中,在前列腺癌中上調的基因是“雄激素調控基因”。當在本文中使用時,術語“在前列腺組織中上調的基因”是指與其他組織中的水平相比,在前列腺組織中以更高水平表達(例如mRNA或蛋白表達)的基因。在某些實施方案中,在前列腺組織中上調的基因的表達水平比在其他組織中的表達水平高至少10%、優選至少25 %、更優選至少50 %、更加優選至少100 %、更加優選至少200 %、最優選至少300 %。在某些實施方案中,在前列腺組織中上調的基因只在前列腺組織中表達。當在本文中使用時,術語“高表達啟動子”是指一種啟動子,當其與基因融合時,弓丨起基因在特定組織(例如前列腺)中的表達水平與該基因不與所述高表達啟動子融合時的表達水平相比更高(例如高至少10%、優選至少25%、更優選至少50%、更加優選至少100%,更加優選至少200%、最優選至少300%的水平)。在某些實施方案中,高表達啟動子是來自于雄激素調控基因或持家基因(例如HNRPA2B1)的啟動子。 當在本文中使用時,術語“轉錄調控區”是指含有調節(例如上調或下調)基因表達的序列的基因區域。在某些實施方案中,基因的轉錄調控區包含基因的非編碼上游序列,也稱為5’非翻譯區(5’UTR)。在其他實施方案中,轉錄調控區含有位于基因編碼區內或內含子內的序列(例如增強子)。當在本文中使用時,術語“雄激素調控基因”是指其表達受雄激素(例如睪酮)誘導或抑制的基因或基因部分。雄激素調控基因的啟動子區可以包含“雄激素響應元件”,其與雄激素或雄激素信號傳導分子(例如下游信號傳導分子)相互作用。當在本文中使用時,術語“檢測”可以描述發現或分辨的一般性行動或可檢測標記組合物的特定觀察。當在本文中使用時,術語“抑制基因融合體的至少一種生物活性”是指任何藥劑,其通過直接接觸基因融合體蛋白、接觸基因融合體mRNA或基因組DNA、引起基因融合體多肽的構象變化、降低基因融合體蛋白水平或干擾基因融合體與信號傳導配偶體的相互作用、以及影響基因融合體靶基因的表達,降低了本發明的基因融合體的任何活性(例如包括但不限于本文描述的活性)。抑制劑還包括通過攔截上游信號傳導分子來間接調控基因融合體生物活性的分子。當在本文中使用時,術語“siRNA”是指小干擾RNA。在某些實施方案中,siRNA包含約18-25個核苷酸長的雙鏈體或雙鏈區;siRNA經常在每條鏈的3’末端包含約2到4個未配對的核苷酸。siRNA的雙鏈體或雙鏈區的至少一條鏈與靶RNA分子基本上同源或基本上互補。與靶RNA分子互補的鏈是“反義鏈”;與靶RNA分子同源的鏈是“有義鏈”,其也與siRNA反義鏈互補。siRNA還可以包含其他序列;這些序列的非限制性實例包括連接序列或環,以及莖和其他折疊結構。siRNA表現出在引發無脊椎動物和脊椎動物中的RNA干擾以及引發植物轉錄后基因沉默期間的序列特異性RNA降解中,起到關鍵中介的作用。術語“RNA干擾”或“RNAi”是指通過siRNA沉默或降低基因表達。它是動物和植物中序列特異性的轉錄后基因沉默過程,由在其雙鏈區中與被沉默基因的序列同源的siRNA啟動。基因對于生物體來說可以是內源或外源的,整合于染色體中存在或存在于不整合到基因組中的轉染載體中。基因的表達被完全或部分抑制。也可以考慮利用RNAi抑制靶RNA的功能;靶RNA的功能可以是完全的或部分的。當在本文中使用時,術語“癌癥階段”是指癌癥發展水平的定性或定量評估。用于確定癌癥階段的標準包括但不限于腫瘤的大小和轉移程度(例如局限或遠處)。當在本文中使用時,術語“基因 轉移系統”是指將包含核酸序列的組合物遞送到細胞或組織的任何手段。例如,基因轉移系統包括但不限于載體(例如反轉錄病毒、腺病毒、腺相關病毒和其他基于核酸的遞送系統)、裸核酸的微注射、基于聚合物的遞送系統(例如基于脂質體和基于金屬粒子的系統)、基因槍注射等。當在本文中使用時,術語“病毒基因轉移系統”是指包含病毒元件(例如完整病毒、修飾病毒和病毒組分例如核酸或蛋白)以便于將樣本遞送到所需細胞或組織的基因轉移系統。當在本文中使用時,術語“腺病毒基因轉移系統”是指包含屬于腺病毒科的完整或修改病毒的基因轉移系統。當在本文中使用時,術語“位點特異性重組靶序列”是指提供重組因子識別序列和重組發生位置的核酸序列。當在本文中使用時,術語“核酸分子”是指任何含核酸的分子,包括但不限于DNA或RNA。該術語涵蓋了包含任何DNA和RNA的已知堿基類似物的序列,所述堿基類似物包括但不限于4-乙酰胞嘧啶、8-羥基-N6-甲基腺嘌呤、氮丙啶基胞嘧啶、假異胞嘧啶、5-(羧基羥甲基)尿嘧啶、5-氟尿嘧啶、5-溴尿嘧啶、5-羧甲基氨基甲基-2-硫尿嘧啶、5-羧甲基氨基甲基尿嘧啶、二氫尿嘧啶、次黃嘌呤、N6-異戊烯基腺嘌呤、I-甲基腺嘌呤、I-甲基假尿嘧啶、I-甲基鳥嘌呤、I-甲基次黃嘌呤、2,2-二甲基鳥嘌呤、2-甲基腺嘌呤、2-甲基鳥嘌呤、3-甲基胞嘧啶、5-甲基胞嘧啶、N6-甲基腺嘌呤、7-甲基鳥嘌呤、5-甲基氨基甲基尿嘧啶、5-甲氧基-氨基甲基-2-硫尿嘧啶、β-D-甘露糖基辮苷、5’ -甲氧基羰甲基尿嘧啶、5-甲氧基尿嘧啶、2-甲基硫代-Ν6-異戊烯基腺嘌呤、尿嘧啶-5-氧乙酸甲基酯、尿嘧啶-5-氧乙酸、oxybutoxos ine、假尿喃唳、辮苷、2-硫胞喃唳、5-甲基-2-硫尿喃唳、2_硫尿喃唳、4_硫尿嘧啶、5-甲基尿嘧啶、N-尿嘧啶-5-氧乙酸甲基酯、尿嘧啶-5-氧乙酸、假尿嘧啶、辮苷、2-硫胞嘧啶和2,6- 二氨基嘌呤。術語“基因”是指包含產生多肽、前體或RNA(例如rRNA、tRNA)所需的編碼序列的核酸(例如DNA)序列。多肽可以由全長編碼序列或由編碼序列的任一部分編碼,只要全長或片段的所需活性或功能性質(例如酶活性、配體結合、信號轉導、免疫原性等)得以保留即可。該術語還涵蓋了結構基因的編碼區和位于編碼區5’和3’兩個末端附近距任一端約Ikb以上的序列,以便基因對應于全長mRNA的長度。位于編碼區的5’方向并存在于mRNA上的序列被稱為5’非翻譯序列。位于編碼區3’方向或下游并存在于mRNA上的序列被稱為3’非翻譯序列。術語“基因”涵蓋了基因的cDNA和基因組兩種形式。基因的基因組形式或克隆含有被非編碼序列打斷的編碼區,所述非編碼序列被稱為“內含子”或“居間區”或“居間序列”。內含子是被轉錄成核RNA(hnRNA)的基因區段;內含子可含有調控元件例如增強子。內含子從核或一級轉錄物中被移除或“剪接掉”;因此在信使RNA(mRNA)轉錄物中不存在內含子。在翻譯過程中,mRNA起到指定新生多肽的氨基酸序列或次序的功能。當在本文中使用時,術語“異源基因”是指不在其天然環境中的基因。例如,異源基因包括來自于一個物種而被導入另一物種的基因。異源基因還包括對生物體來說是固有的但已通過某些方式進行改變(例如突變、添加了多個拷貝、與非固有調控序列相連等)的基因。異源基因與內源基因的區別在于異源基因序列典型地與自然情況下未被發現在染色體中與該基因序列相伴的DNA序列相連,或與不見于自然情況下的染色體部分相伴(例如基因在該基因正常不表達的基因座中表達)。
當在本文中使用時,術語“寡核苷酸”是指長度短的單鏈多核苷酸鏈。寡核苷酸的長度典型小于200個殘基(例如15至100之間),但是,當在本文中使用時,該術語也打算包涵較長的多核苷酸鏈。寡核苷酸常常按其長度稱呼。例如,24個殘基的寡核苷酸被稱為“24聚體”。寡核苷酸可以通過自身雜交或與其他多核苷酸雜交形成二級和三級結構。這樣的結構可以包括但不限于雙鏈體、發夾、十字形、彎曲和三鏈體。當在本文中使用時,術語“互補”或“互補性”被用于指稱通過堿基配對規則相關聯的多核苷酸(即核苷酸序列)。例如,序列“5’ -A-G-T-3’ ”與序列“3’ -T-C-A-5’ ”互補。互補性可以是“部分的”,其中只有某些核酸堿基按照堿基配對規則匹配。或者,在核酸之間可以存在“完全”或“全部”互補性。核酸鏈之間的互補程度對核酸鏈之間的雜交效率和強度有顯著影響。這在擴增反應以及依賴于核酸之間的結合的檢測方法中是特別重要的。術語“同源性”是指互補程度。可以存在部分同源性或完全同源性(即同一性)。部分互補的序列是至少部分抑制完全互補的核酸分子與“基本上同源的”靶核酸雜交的核酸分子。完全互補的序列與靶序列的雜交的抑制,可以在低嚴緊性條件下使用雜交測定方法(Southern或Northern印跡、溶液雜交等)來檢查。基本上同源的序列或探針將在低嚴緊性條件下競爭并抑制完全同源的核酸分子與靶的結合(即雜交)。這并不是說低嚴緊性條件是允許發生非特異性結合的條件;低嚴緊性條件要求兩個序列彼此的結合是特異性的(即選擇性的)相互作用。非特異性結合的不存在可以通過使用基本上不互補(例如同一性低于約30% )的第二個靶來測試;在不存在非特性結合的情況下,探針將不與第二個非互補靶雜交。當用于指稱雙鏈核酸序列例如cDNA或基因組克隆時,術語“基本上同源的”是指在上述的低嚴緊性條件下能夠與雙鏈核酸序列的任一條或兩條鏈雜交的任何探針。基因可以產生多種RNA,其由一級RNA轉錄物的差異剪接產生。作為同一基因的剪接變體的cDNA將含有序列同一或完全同源的區域(表示在兩個cDNA上存在相同外顯子或相同外顯子的部分)和完全不同一的區域(例如表現在cDNA I上存在外顯子“A”,而在cDNA 2中代之以含有外顯子“B”)。因為兩個cDNA含有序列同一的區域,它們將都與含有在兩個cDNA上發現的序列的完整基因或基因部分所衍生的探針雜交;因此兩個剪接變體與該探針基本上同源并彼此基本上同源。當用于指稱單鏈核酸序列時,術語“基本上同源的”是指能夠在如上所述的低嚴緊性條件下與單鏈核酸序列雜交(即與其互補的)任何探針。當在本文中使用時,術語“雜交”被用于指稱互補核酸的配對。雜交和雜交強度(即核酸之間結合的強度)受到諸如下列因素的影響核酸之間的互補性程度、所涉及條件的嚴緊性、形成的雜交體的Tm、核酸內的G C比。在其結構內含有互補核酸配對的單個分子,被稱為是“自身雜交的”。當在本文中使用時,術語“嚴緊性”被用于指稱用于執行核酸雜交的溫度、離子強度和存在其他化合物例如有機溶劑的條件。在“低嚴緊性條件”下,目標核酸序列將與其完全互補序列、具有單堿基錯配的序列、密切相關的序列(例如具有90%以上同源性的序列)以及只具有部分同源性的序列(例如具有50-90%同源性的序列)雜交。在“中嚴緊性條件”下,目標核酸序列將只與其完全互補序列、具有單堿基錯配的序列和密切相關的序列(例如具有90%以上同源性的序列)雜交。在“高嚴緊性條件”下,目標核酸序列將只與其完全互補序列以及(取決于條件例如溫度)具有單堿基錯配的序列雜交。換句話說,在高嚴緊性條件下,可以升高溫度以便排除與具有單堿基錯配的序列的雜交。當在核酸雜交的情形中使用時,“高嚴緊性條件”包含與下述條件等價的條件,SP當使用長度約為500個核苷酸的探針時,在42°C下、在由5X SSPE (43. 8g/l NaCl、6.9g/lNaH2PO4 H2O 和 I. 85g/l EDTA,用 NaOH 將 pH 調整到 7. 4)、0· 5% SDS、5X Denhardt 試劑和100 μ g/ml變性鮭魚精子DNA構成的溶液中結合或雜交,然后在包含O. IX SSPEU.0% SDS的溶液中在42°C下清洗。當在核酸雜交的情形中使用時,“中嚴緊性條件”包含與下述條件等價的條件,SP當使用長度約為500個核苷酸的探針時,在42°C下、在由5X SSPE (43. 8g/l NaCl、6.9g/lNaH2PO4 H2O 和 I. 85g/l EDTA,用 NaOH 將 pH 調整到 7. 4)、0· 5% SDS、5X Denhardt 試劑和100 μ g/ml變性鮭魚精子DNA構成的溶液中結合或雜交,然后在包含I. OX SSPEU. 0% SDS的溶液中在42°C下清洗。“低嚴緊性條件”包含與下述條件等價的條件,即當使用長度約為500個核苷酸的探針時,在 42°C下、在由 5X SSPE(43. 8g/l NaCl、6.9g/l NaH2PO4 H2O 和 I. 85g/l EDTA,用NaOH 將 pH 調整到 7. 4) ,0. I % SDS、5X Denhardt 試劑[50X Denhardt 試劑每 500ml 含有5g Ficoll (400 型,Pharamcia)、5g BSA (級分 V ;Sigma)]和 100 μ g/ml 變性鮭魚精子 DNA構成的溶液中結合或雜交,然后在包含5X SSPE、O. 1% SDS的溶液中在42 °C下清洗。本技術領域公知可以利用許多等價條件來構成低嚴緊性條件;考慮多種因素,例如探針的長度和性質(DNA、RNA、堿基組成)和靶的性質(DNA、RNA、堿基組成,存在于溶液中或固定化等)以及鹽和其他組分的濃度(例如甲酰胺、硫酸葡聚糖、聚乙二醇的存在或不存在),并且可以改變雜交溶液以產生與上面列出的條件不同但是等價的低嚴緊性雜交條件。此外,在高嚴緊性條件下促進雜交的條件是本技術領域已知的(例如升高雜交和/或清洗步驟的溫度,在雜交溶液中使用甲酰胺等)(參見上面對“嚴緊性”的定義)。當在本文中使用時,術語“擴增寡核苷酸”是指與靶核酸或其互補鏈雜交并參與核酸擴增反應的寡核苷酸。擴增寡核苷酸的實例是與模板核酸雜交并含有在擴增過程中被聚合酶延伸的3’ OH末端的“引物”。擴增寡核苷酸的另一個實例是不被聚合酶延伸(例如,因為它具有3’封閉末端)但是參與或促進擴增的寡核苷酸。擴增寡核苷酸可以任選包括修飾的核苷酸或類似物,或參與擴增反應但是不與靶核酸互補或不包含在靶核酸中的其他核苷酸。擴增寡核苷酸可以含有不與靶或模板序列互補的序列。例如,引物的5’區域可以包括不與靶核酸互補的啟動子序列(被稱為“啟動子-引物”)。本技術領域的專業人員將會理解,起引物作用的擴增寡核苷酸可以被修飾以包含5’啟動子序列,并因此起到啟動子-引物的作用。同樣,啟動子-引物可以通過除去啟動子序列或合成時不加啟動子序列進行修飾,并仍起到引物的作用。3’封閉的擴增寡核苷酸可以提供啟動子序列并用作聚合的模板(被稱為“啟動子提供者”)。
當在本文中使用時,術語“引物”是指在純化的限制性消化物中天然存在的或合成產生的寡核苷酸,當其被置于能夠誘導與核酸鏈互補的引物延伸產物的合成的條件下(即在核苷酸和誘導劑例如DNA聚合酶存在下并在適合溫度和pH下)時,能夠起到合成起始點的作用。引物優選為單鏈的,以使擴增效率最高,但是也可以是雙鏈的。如果是雙鏈的,弓丨物在用于制備延伸產物之前首先進行處理以將其鏈進行分離。優選,引物是寡脫氧核糖核苷酸。為了在誘導劑存在下引發延伸產物的合成,引物必須足夠長。引物的精確長度取決于許多因素,包括溫度、引物來源和使用的方法。
當在本文中使用時,術語“探針”是指在純化的限制性消化物中天然存在的或合成、重組或通過PCR擴增產生的寡核苷酸(即核苷酸序列),其能夠與另一個目標寡核苷酸的至少一部分雜交。探針可以是單鏈或雙鏈的。探針可用于特定基因序列的檢測、鑒定和分離。預想了在本發明中使用的任何探針可以用任何“報告分子”標記,以便可以在任何檢測系統中檢測,包括但不限于酶(例如ELISA以及基于酶的組織化學測定法)、熒光、放射活性和發光系統。不打算將本發明限于任何特定檢測系統或標記物。術語“分離的”當就核酸使用時,像“分離的寡核苷酸”或“分離的多核苷酸”,是指被鑒定并與其在天然來源中常規相伴的至少一種組分或污染物分離開的核酸序列。因此,分離的核酸存在的形式或環境與其在自然界中發現的形式或環境不同。相反,未分離的核酸是以其見于在自然界中存在的狀態的核酸例如DNA和RNA。例如,給定的DNA序列(例如基因),在宿主細胞染色體上在相鄰基因附近被發現;RNA序列,例如編碼特定蛋白的特定mRNA序列,在細胞中作為與編碼眾多蛋白的許多其他mRNA的混合物而被發現。但是,編碼給定蛋白的分離的核酸包括,例如,在通常表達給定蛋白的細胞中核酸處于與天然細胞中不同的染色體位置這樣的核酸,或側翼帶有與自然界中發現的不同的核酸序列。分離的核酸、寡核苷酸或多核苷酸可以單鏈或雙鏈形式存在。當分離的核酸、寡核苷酸或多核苷酸將要用于表達蛋白時,該寡核苷酸或多核苷酸將至少含有有義或編碼鏈(即寡核苷酸或多核苷酸可以是單鏈的),但也可以含有有義和反義鏈(即寡核苷酸或多核苷酸可以是雙鏈的)。當在本文中使用時,術語“純化的”或“純化”是指從樣本中移除組分(例如污染物)。例如,抗體通過移除污染性非免疫球蛋白蛋白進行純化;它們也可以通過移除不與靶分子結合的免疫球蛋白進行純化。移除非免疫球蛋白和/或移除不與靶分子結合的免疫球蛋白導致樣本中靶反應性免疫球蛋白的百分率增加。在另一個實例中,將重組多肽在細菌宿主細胞中表達,并通過移除宿主細胞的蛋白對多肽進行純化;從而增加了樣本中重組多肽的百分率。發明詳述本發明是基于在癌癥(例如前列腺癌)中發現的復現性基因融合體。本發明提供了直接或間接檢測或靶向所述基因融合體的診斷、研究和治療方法。本發明還提供了用于診斷、研究和治療目的的組合物。對癌癥中特異性基因組畸變的表征,導致鑒定到幾個成功的治療靶點,例如BCR-ABLl、PDGFR、ERBB2 和 EGFR 等(Lynch 等,New Engl. J. Med. 350 2129[2004] ;Slamon等,New Engl. J. Med. 344 :783 [2001] ;Demetri 等,New Engl. J. Med. 347 :472 [2002];Druker等,New Engl. J. Med. 355 :2408 [2006])。因此,癌癥研究中的主要目標是鑒定因果性遺傳畸變。癌癥中的突變通常通過細胞遺傳學和分子技術(Mitelman等,Cancer GenomeAnatomy Project[2008])、后來代之以使用特定癌癥類型的測序(Greenman等,Nature446 153[2007] ;ffeir 等,Nature450 893[2007] ;ffood 等,Science 318 1108[2007])或候選基因(Barber等,New Engl. J. Med. 351 :2883 [2004])來鑒定。據認為,在癌癥中由染色體重排產生的基因融合體定義了最普遍的“癌基因”類別(Futreal等,Nat. Revs. 4 177[2004])0典型地,兩個基因的異常并置可以編碼融合蛋白(例如BCR-ABL1),或者一個基因的調控元件可能驅動癌基因的異常表達(例如TMPRSS2-ERG)。盡管基因融合體已在罕見的血液癌和肉瘤中被廣泛描述(Mitelman等,《癌癥基因組解剖學計劃》(CancerGenome Anatomy Pro ject) [2008]),但最近在前列腺癌(Lynch 等,New Engl. J. Med. 350 2129[2004] ;Kumar-Sinha 等,Nat. Rev. 8 497[2008])和肺癌(Choi 等,Cancer Res. 68 4971 [2008] ;Koivunen 等,Clin. Cancer Res. 14 4275 [2008] ;Perner 等,Neoplasia (NewYork, NY) 10 298[2008] ;Rikova 等,Cell 131 14[2007] ;Soda 等,Nature 448 561 [2007])中發現的復現性基因融合體,指出了它們在常見實體腫瘤中也有作用。考慮到它們的普遍性和跨癌癥類型的共同特征,基因融合可以被當作在癌的發生中具有因果作用并嚴格局限于癌細胞的獨特類別的“突變”,它們代表了理想的診斷 標志物和合理的治療靶點。為了對癌癥中的基因組改變進行全面表征,多個國家的正在進行工作,包括癌癥基因組圖譜計劃(The Cancer Genome Atlas Project) (TCGA)。更近些時候,高通量的“下一代測序”方法已被用于查點癌癥中基因組范圍的畸變(Campbell等,Nature Gen. 40 722[2008] ;Parsons等,Science 321 :1807[2008])。盡管在發現癌癥中的堿基變化突變(和 SNP)中已投入相當多的努力(Weir 等,Nature 450 893 [2007] ;Wood 等,Science318 1108[2007] ;Cheung 等,Nature 409 953[2001] ;Strausberg 等,Trends Genet. 16 103[2003]),但到目前為止還沒有系統地調查“基因融合體”。其部分原因在于實體腫瘤在腫瘤演化過程中獲得許多非特異性畸變,使得難以分辨因果性/驅動性畸變與次要/無意義的突變。通過對轉錄組進行測序,減輕了非特異性遺傳畸變的問題,所述轉錄組測序將查詢限制在“表達序列”,因此富集了可能“具有功能的”突變的數據。最近在前列腺癌和肺癌中發現的基因融合體是通過轉錄組(Soda等,Nature 448 561 [2007] ;Tomlins等,Science310 644[2005])和蛋白質組(Rikova 等,Cell 131 14[2007])分析找到的。在本發明過程中進行的實驗期間,使用了大規模平行轉錄組測序來發現代表有功能基因融合體的嵌合轉錄物。在本發明開發過程中進行的其他實驗,證實了配對末端大規模平行轉錄組測序對發現融合基因的有效性。通過使用配對末端方法,重新發現了已知的基因融合體并發現了以前未描述過的基因融合體,并且有可能進一步查明因果性基因融合體。在4種常用細胞系中檢測到逃過任何以前工作的12個以前未描述過的基因融合體的能力,顯示出配對末端RNA-Seq策略與現有方法相比的優越靈敏性。此外,它證明了可能可以在以前表征過的據認為不含任何已知驅動性基因融合體的樣本中揭示出以前未描述過的嵌合事件。其實例是在兩個缺少已知驅動性基因融合體的臨床局限性前列腺腫瘤樣本中發現了以前未描述過的ETS基因融合體。通過以前所未有的深度分析轉錄組,揭示了許多基因融合體,證實了相對低估的突變類別的普遍性。主要目標是發現復現性基因融合體,并將它們與次要的非特異性嵌合體區分開。盡管對表達水平的定量不能證明基因融合體是驅動性的還是過客,因為低水平的基因融合體仍然可能是因果性的,但最重要的仍然是,配對末端策略將已知的高水平驅動性基因融合體例如BCR-ABLl和TMPRSS2-ERG與可能的較低水平的過客嵌合體明顯區分開。總的來說,這些融合體用作模型,以使用配對末端提名策略對可能是高水平驅動性基因融合體的靠前者進行排序,其隨后將經歷進一步功能性和實驗評估。使用轉錄組方法的一個主要優點是,它能鑒定到在DNA水平上不可檢測的重排。例如,常規細胞遺傳學方法將錯過由臂內倒位產生的基因融合體或亞微觀事件例如GAS6-RASA3。此外,轉錄組測序也能揭示缺少DNA畸變的RNA嵌合體,正如在前列腺癌中發現復現性的、前列腺特異的SLC45A3與ELK4的通讀產物所證實的。使用配對末端測序對基于RNA的事件的進一步分類,揭示了許多在相鄰基因之間廣泛表達的嵌合體。盡管它們不一定是通讀事件,因為它們典型地具有不同的取向,但它們代表了轉錄單位超出其注釋范圍的擴展。與要求嵌合體跨越獨立基因的外顯子邊界的基于單個讀段的方法不同,使用配對末端測序有可能檢測這些事件。配對末端策略對于基因融合體發現來說的全面性,歸因于通過測序來自片段兩端的讀段所提供的覆蓋度增加,分辨不明確定位從而將來自所產生的序列的信息最大化的能力,以及對必須跨越融合體連接處沒有依賴性。相比較而言,使用短讀段(36nt)的單個讀段方法不僅受限于需要它跨越融合體連接處,而且需要在每一側具有足夠的序列以有把握地鑒定融合配偶體。盡管長轉錄組讀段對于在與參比基因組配準時提供序列特異性非常理想,但基于454的方法受到覆蓋深度的限制。因此,許多新的配對末端基因融合體例如TIA1-DIRC2或ZDHHC7-ABCB9,逃過了一體化轉錄組測序方法。然而,為了避開這個問題,公開了由Illumina平臺產生的第一批長單個讀段(IOOnt)之一。盡管與以前的長單個讀段方法例如表達序列標簽(EST)或454長讀段相比提供了較深的轉錄組覆蓋度,但使用配對末端測序仍觀察到增加的動態范圍。此外,盡管產生2 X 50-nt的配對末端與100-nt的轉錄組讀段相比花費略長的時間,但配對末端數據產生了高3倍的核苷酸覆蓋度。總的來說,對于產生長單個讀段的可比資源來說,配對末端測序為給定樣本內的基因融合體提供了更詳盡的目錄。總的來說,論證了將配對末端轉錄組策略用于嵌合體發現的優點,允許建立起用于挖掘嵌合體的方法。此外,它能夠對前列腺和血液癌模型中的嵌合體進行廣泛分類。該方法的靈敏度對于在各種癌癥中揭示新的因果性基因融合體,同時揭示可能對腫瘤發生有貢獻或與驅動性基因融合體協作的其他個人基因融合體,具有廣泛影響和重要意義。I.基因融合體本發明鑒定了指示前列腺癌的復現性基因融合體。該基因融合是5’基因融合配偶體與5’基因融合配偶體的染色體重排的結果。在某些實施方案中,基因融合體是雄激素調控基因(ARG)或持家基因(HG)與ETS家族成員基因的融合體。盡管它們有復現性,但5’基因融合配偶體與3’融合配偶體融合的連接處可變。復現性基因融合體具有作為前列腺和其他(例如乳腺)癌的診斷標志物和臨床靶點的用途。A.雄激素調控基因受雄性激素調控的基因對于人類前列腺的正常生理功能是至關重要的。它們也 造成了前列腺惡性腫瘤的發生和發展。已識別的ARG包括但不限于TMPRSS2、SLC45A3、HERV-K_22qll. 23、C150RF21、FLJ35294、CANTU PSA、PSMA, KLK2、SNRK, Seladin-I 和FKBP51(Paoloni-Giacobino 等,Genomics 44:309(1997) ;Velasco 等,Endocrinology145 (8) 3913 (2004))。其他 ARG 包括但不限于 HERPUD1 和 GenBank 登記號 AX747630。已證實相對于其他正常人類組織,TMPRSS2 (NM_005656)在前列腺上皮中高表達(Lin 等,Cancer Research 59:4180(1999))。TMPRSS2 基因位于 21 號染色體上。該基因位于距 pter 41,750,797-41,801,948bp 處(總共 51,151bp ;負鏈走向)。人類 TMPRSS2 蛋白序列可見于GenBank登記號AAC51784 (Swiss蛋白登記號015393),相應的cDNA的GenBank登記號為 U75329 (也參見 Paoloni-Giacobino 等,Genomics 44 309 (1997))。SLC45A3,也稱為prostein或P501S,已經在轉錄物和蛋白兩種水平上顯示出專門在正常前列腺和前列腺癌中表達(Kalos等,Prostate 60, 246-56 (2004) ;Xu等,CancerRes 61,1563-8(2001))通過EST分析和大規模平行測序,發現HERV_K_22qll. 23是人類內源反轉錄病毒元件的HERV-K家族的表達第二強的成員,并且與其他正常組織相比,在前列腺中表達最高(Stauffer等,Cancer Immun 4,2(2004))。盡管還沒有描述HERV-K元件的雄激素調控,但已經顯示內源反轉錄病毒元件將小鼠的性連鎖蛋白基因C4A賦予雄激素響應性(Stavenhagen等,Cell 55,247-54 (1988))。其他HERV-K家族成員已顯示在乳腺癌和乳腺癌細胞系中高表達并且受雌激素調控(Ono等,J Virol 61,2059-62 (1987) ;Patience等,J Virol 70,2654-7(1996) ;Wang-Johanning 等,Oncogene 22,1528-35 (2003)),并且在具有t(8 ;19) (pl2 ;ql3. 3)的干細胞骨髓增殖性障礙病例中,來自19號染色體上的HERV-K3元件的序列與 FGFRl 融合(Guasch 等,Blood 101,286-8 (2003))。C150RF21,也稱為D-PCA-2,最初是基于其專門在正常前列腺和前列腺癌中過表達而被分離的(Weigle 等,Int J Cancer 109,882-92(2004))。FLJ35294被鑒定為經測序的人類cDNA的“全長長日本”(full-length longJapan, FLJ)文庫中的成員(Nat Genet. 2004 Jan ;36 (I) :40_5. Epub 2003 Dec 21)。CANTl,也稱為 sSCANl,是可溶性鈣激活核苷酸酶(Arch Biochem Biophys. 2002Oct I ;406(1) :105-15)。CANTl是371個氨基酸的蛋白。可切割的信號肽產生333個殘基的分泌蛋白,預測的核心分子量為37,193Da。Northern分析在多種人類組織中鑒定到轉錄物,包括睪丸、胎盤、前列腺和肺。在該人類的酶中沒有鑒定到傳統的腺苷三磷雙磷酸酶保守區域或核苷酸結合結構域,表明其屬于新的細胞外核苷酸酶家族。HERPUD1(高半胱氨酸和內質網脅迫誘導蛋白,含有遍在蛋白樣結構域的蛋白I)是內質網(ER)常駐蛋白,其表達對ER應激作出響應而上調。HERPUD1的GenBank登記號為ΝΜ_014685。本發明的基因融合體可以包含ARG的轉錄調控區。ARG的轉錄調控區可以包含ARG的編碼或非編碼區,包括啟動子區。ARG的啟動子區還可以包含ARG的雄激素響應元件(ARE)。具體來說,TMPRSS2的啟動子區以GenBank登記號AJ276404提供。B.持家基因持家基因是組成性表達的,并且一般在所有組織中遍在表達。這些基因編碼的蛋白提供了所有細胞存活所需的基本的、必需的功能。持家基因通常在所有細胞和組織中以相同水平表達,但是具有一些變動,特別是在細胞生長和生物體發育的過程中。還未確切了解人類細胞具有多少持家基因,但是大多數人估計在300-500個的范圍內。已經鑒定到數百個之多的持家基因。最常見的已知基因GAPDH(甘油醛-3-磷酸脫氫酶),編碼對糖酵解途徑至關重要的酶。另一個重要的持家基因是白蛋白,其協助在整個身體中運輸化合物。幾個持家基因編碼構成細胞骨架的結構蛋白,例如β-肌動蛋白和微管蛋白。其他持家基因編碼核糖體的18S或28S rRNA亞基。HNRPA2B1是遍在表達的異核核糖核蛋白的成員。其啟動子已被顯示是未甲基化的,并阻止轉基因中CMV啟動子的轉錄沉默(Williams等,BMC Biotechnol 5,17(2005))。持家基因的示例性名單可見于例如Trends in Genetics,19,362-365(2003)。C. ETS家族成員基因
轉錄因子的ETS家族調控控制基因表達的細胞內信號傳導途徑。作為下游效應子,它們活化或阻遏特定靶基因。作為上游效應子,它們負責眾多生長因子受體的時空表達。已經鑒定到該家族的接近30個成員,它們涉及廣泛的生理和病理過程。這些成員包括但不限于ERG、ETVl (ER81)、FLI1、ETS1、ETS2、ELK1、ETV6 (TELl)、ETV7 (TEL2)、GABP α、ELFl、ETV4(E1AF、PEA3)、ETV5 (ERM)、ERF、PEA3/E1AF、PU. I、ESE1/ESX、SAPl (ELK4)、ETV3 (METS)、EWS/FLIU ESEl、ESE2 (ELF5)、ESE3、PDEF、NET(ELK3、SAP2)、NERF (ELF2)和FEV0示例性的ETS家族成員序列提供在圖9中。ERG(NM_004449)已被證實在前列腺上皮中相對于其他正常人類組織中高表達。ERG基因位于21號染色體上。該基因位于距pter38, 675,671-38,955,488堿基對處。ERG基因總共279,817bp,為負鏈走向。相應的ERG cDNA和蛋白序列分別提供在GenBank登記號 M17254 和 NP04440 (Swiss 蛋白登記號 P11308)中。ETVl 基因位于 7 號染色體上(GenBank 登記號 NC_000007. 11、NC_086703. 11和 NT_007819. 15)。該基因位于距 pter 13,708330-13,803,555 堿基對處。ETVl 基因總計95,225bp,為負鏈走向。相應的ETVl cDNA和蛋白序列分別提供在GenBank登記號NM_004956 和 NP_004947 (Swiss 蛋白登記號 P50549)中。人類ETV4 基因位于 14 號染色體上(GenBank 登記號 NC_000017. 9、NT_010783. 14和 NT_086880. I)。該基因位于距 pter 38,960,740-38,979,228 堿基對處。ETV4 基因總計18,488bp,為負鏈走向。相應的ETV4 cDNA和蛋白序列分別提供在GenBank登記號NM_001986 和 ΝΡ_01977 (Swiss 蛋白登記號 P43268)中。人類ETV5 基因位于 3 號染色體上 3q28 處(NC_000003. 10 (187309570. . 187246803)) ο相應的ETV5 mRNA和蛋白序列分別提供在GenBank登記號NM_004454和CAG33048中。D. ETS基因融合體包括最初鑒定到的TMPRSS2:ETS基因融合體在內,在前列腺癌中已經鑒定到5類ETS重排。本發明不限于特定機制。事實上,對于實踐本發明來說不需要理解機制。然而,考慮到ETS家族成員在癌癥中通過與ARG或HG融合或插入到表達增加的基因座中而引起的表達上調,為前列腺癌提供了一種機制。特定個體中存在的重排類型的知識允許對癌癥療法進行定制。I.基因重排類別TMPRSS2:ETS基因融合體(I類)代表了前列腺癌中ETS重排的主要類別。涉及與來自其他前列腺特異性雄激素誘導基因的非翻譯區融合(IIa類)和內源反轉錄病毒元件融合(IIb類)的重排,分別例如SLC45A3和HERV_K_22qll. 23,在功能上與ETS重排中的TMRPSS2類似。與I類和II類重排中的5’配偶體相似,C150RF21在前列腺癌中顯著過表達。然而,與I類和II類重排中的融合配偶體不同,C150RF21被雄激素阻遏,代表了一類新的ETS重排(III類),涉及前列腺特異性雄激素阻遏的5’融合配偶體。相反,HNRPA2B1不顯示前列腺特異性表達或雄激素響應性。因此,HNRPA2B1:ETV1代表了一類新的ETS重排(IV類),其中涉及非組織特異性啟動子元件的融合驅動了 ETS表達。在V類重排中,整個ETS基因重排到前列腺特異性區域。患有晚期前列腺癌的男性通常用雄激素剝奪療法進行治療,常常引起腫瘤退縮。但是具有激素抗拒表型的癌癥幾乎總是發展。因為IV類重排(例如HNRPA2B1:ETV1)由雄激素不敏感的啟動子元件驅動,結果表明這些患者可能不對抗雄激素療法發生響應,因為這些基因融合體對雄激素剝奪沒有響應性。具有III類重排的患者的抗雄激素治療可能增加ETS融合體表達。例如,從患有激素抗拒性轉移前列腺癌的患者分離到C150RF21 :ETV1,在該患者中抗雄激素治療增加了 C150RF21:ETV1表達。支持這一假說的是,LNCaP的雄激素饑餓顯著降低了內源PSA和TMPRSS2的表達,對HNRPA2B1沒有影響,并增加了 C150RF21的表達(圖49)。這允許根據存在的融合體類型為患有前列腺癌的男性定制療法(例如選擇雄激素阻斷治療或其他備選療法)。 前列腺癌中的多種基因重排類別表明染色體重排在常見上皮癌中更普遍的作用。例如,在其他激素驅動型癌癥中組織特異性啟動子元件可能與癌基因融合,例如在乳腺癌中雌激素響應性元件與癌基因融合。此外,盡管前列腺特異性融合(I-III、V類)在其他上皮癌中不提供生長優勢并且不被選擇,但包含遍在表達的基因例如HNRPA2B1的強啟動子的融合體,導致癌基因跨腫瘤類型的異常表達。總而言之,該研究支持了染色體重排在常見上皮細胞腫瘤發育中通過類似于血液癌的各種機制起作用。2.ARG/ETS基因融合體正如上面描述的,本發明的實施方案提供了 ARG與ETS家族成員基因的融合體。在開發本發明的過程中進行的實驗表明,某些融合基因表達融合轉錄物,而其他則不表達有功能的轉錄物(Tomlins 等,Science, 310 :644_648 (2005) ;Tomlins 等,Cancer Research66 =3396-3400(2006)) οa. ERG基因融合體發現包含ERG的基因融合體是前列腺癌中最常見的基因融合體。在開發本發明的實施方案的過程中進行的實驗鑒定到與ERG融合的一種雄激素調控基因HERPUD1。b. ETVl基因融合體在開發本發明的實施方案的過程中進行的實驗鑒定到AX747630:ETV1融合體。已發現AC747630是雄激素調控基因。E.其他基因融合體本發明的實施方案提供了與前列腺癌相關的其他基因融合體,包括但不限于USP10:ZDHHC7、EIF4E2:HJURP、HJURP-INPP4A、STRN4:GPSN2、RC3H2:RGS3、LMAN2:AP3S1、MIP0L1:DGKB、HERPUDI:ERG, AX747630:ETVU TIA1:DIRC2、NUP214:XKR3、ZDHHC7:ABCB9、DLEU2: PSPCl、PIK3C2A: TEADl、SPOCKl: TBC1D9B 和 RERE: PIK3CD。本發明的實施方案還提供了在其他癌癥中發現的基因融合體,包括但不限于NUP214-XKR3(慢性髓性白血病)和 AHCYLl: RAD51C、ARHGAP19:DRG1、BC017255: TMEM49、FCHOl :MY09B 以及 PAPOLA :AK7 (乳腺癌)。
此外,在某些實施方案中,本發明提供了在mRNA水平上但不在DNA水平上存在或復現的基因融合體(例如通讀轉錄物嵌合體)。在某些實施方案中,通讀轉錄物是順式剪接的結果。在某些實施方案中,基于RNA的嵌合體被分類為(i)通讀體,相同取向的相鄰基因,( )發散基因,相反取向的相鄰基因,其5’位點緊密靠近,(iii)會聚基因,相反取向的相鄰基因,其3’末端緊密靠近,以及(iv)交疊基因,享有共同外顯子的相鄰基因。mRNA融合體的實例包括但不限于 SLC45A3-ELK4、ZNF649-ZNF577、CARMl: YIPF2, MGCl1102:BANFl,SLC4A1AP:SUPT7L、ERCC2:KLC3、PMFl:BGLAP, TH0C6:HCFC1R1、NDUFB8:SEC31L2、ANKRD39:ANKRD23、C14orfl24:KIAA0323、C14orf21:CIDEB 和 ZNF511:TUBGCP2。
F.多個融合體在某些實施方案中,樣本(例如癌癥樣本)包含超過一種融合體。例如,在本發明的開發過程中進行的實驗證明了 SLC45A3-ELK4出現在含有其他ETS融合體的腫瘤中。例如,LNCap細胞具有ETVl重排和SLC45A3-ELK4融合體。因此,在某些實施方案中,本發明提供了利用多個融合體組合檢測的診斷和/或預后方法。II.抗體本發明的基因融合體蛋白,包括其片段、衍生物和類似物,可以用作免疫原來產生可用于下面描述的診斷、研究和治療方法的抗體。所述抗體可以是多克隆或單克隆、嵌合、人源化、單鏈的或Fab片段。可以使用本技術領域的普通專業人員已知的各種程序來生產和標記這樣的抗體和片段。參見例如Burns主編的《免疫化學方案》(Immunochemical Protocols)第三版,Humana Press (2005) ;Harlow 和 Lane,《抗體實驗室指南》(Antibodies A Laboratory Manual), Cold Spring Harbor Laboratory (1988);Kozbor 等,Immunology Today 4:72(1983) ; Kdhler和 Milstein,Nature 256:495(1975)。利用截短的ETS家族成員蛋白或嵌合蛋白與其相應的天然蛋白之間的差異的抗體或片段,是特別優選的。III.診斷應用本文描述的一種或多種融合體可以作為DNA、RNA或蛋白質檢測。最初,基因融合體可以作為具有來自5’融合配偶體的5’部分和來自3’融合融合體的3’部分的基因組DNA的染色體重排被檢測。一旦轉錄后,基因融合體可以作為具有5’部分和3’部分的嵌合mRNA被檢測。一旦翻譯后,基因融合體可以作為氨基端截短的3’融合配偶體或5’配偶體3’配偶體融合蛋白被檢測。截短的蛋白和嵌合蛋白可能在氨基酸序列、翻譯后加工和/或二級、三級或四級結構方面與其相應天然蛋白不同。這樣的差別,如果存在的話,可用于鑒定基因融合體的存在。檢測的具體方法在下文更詳細描述。本發明提供了基于DNA、RNA和蛋白質的直接或間接檢測基因融合體的診斷方法。本發明還提供了用于診斷目的的組合物和試劑盒。本發明的診斷方法可以是定性或定量的。定量診斷方法可用于例如通過截止值或閾值水平區別進展緩慢和侵襲性癌癥。當適用時,定性或定量診斷方法也可以包括靶、信號或中介(例如通用引物)的放大。初始測定可以證實基因融合體的存在,但是不能鑒定具體的融合體。如果需要,然后進行二級測定,以確定具體融合體的身份。二級測定可以使用與初始測定不同的檢測技術。
本發明的基因融合體可以以多重或組的格式與其他標志物一起檢測。標志物根據它們單獨或與基因融合體相組合的預測價值進行選擇。示例性前列腺癌標志物包括但不限于AMACR/P504S(美國專利 No. 6,262,245) ;PCA3(美國專利 No. 7,008,765) ;PCGEMl (美國專利 No. 6,828,429) ;prostein/P501S、P503S、P504S、P509S、P510S、前列腺酶 /P703P、P710P(美國專利公布No. 20030185830);以及在美國專利No. 5,854,206和6,034,218和美國專利公布No. 20030175736中所公開的,上述每個文獻在此以其全文引為參考。用于其他癌癥、疾病、感染和代謝病癥的標志物也可考慮包含在多重的組格式中。也可以參考將特定基因融合體與疾病的階段、侵襲性或發展或轉移的存在或風險相關聯的數據,對本發明的診斷方法進行修改。最終,由本發明方法提供的信息將幫助醫生為特定患者選擇最佳治療過程。A.樣本任何懷疑含有基因融合體的患者樣本可以按照本發明的方法進行測試。作為非限制性的實例,樣本可以是組織(例如前列腺活檢樣本或通過前列腺切除術獲得的組織樣本)、血液、尿液、精液、前列腺分泌物或其級份(例如血漿、血清、尿液上清液、尿液細胞沉淀物或前列腺細胞)。尿液樣本優選在仔細的直腸指診(DRE)后立即收集,所述直腸指診導致前列腺細胞從前列腺脫落到尿道中。患者的樣本典型地需要初步加工,用于從樣本分離或富集基因融合體或含有基因融合體的細胞。本技術領域的普通專業人員已知的各種技術可用于該目的,包括但不限于離心、免疫捕獲、細胞裂解和核酸靶捕獲(參見例如歐洲專利No. I 409 727,在此以其全文引為參考)。B. DNA 和 RNA 檢測本發明的基因融合體可以作為基因組DNA的染色體重排或嵌合mRNA、使用本技術領域的普通專業人員已知的各種核酸技術來檢測,所述技術包括但不限于核酸測序、核酸雜交和核酸擴增。I.測序核酸測序技術的說明性而非限制性實例包括但不限于鏈終止(Sanger)測序和染料終止測序。本技術領域的普通專業人員將會認識到,因為RNA在細胞中較不穩定并且更易受核酸酶攻擊,因此在實驗上通常在測序前將RNA反轉錄成DNA。鏈終止測序使用修飾的核苷酸底物對DNA合成反應進行序列特異性終止。在模板DNA的特定位點處,通過使用與在該區域處模板互補的短的放射活性或其他標記的寡核苷酸來引發延伸。寡核苷酸引物使用DNA聚合酶、標準的四種脫氧核苷酸堿基以及低濃度的一種鏈終止核苷酸、最常用為雙脫氧核苷酸進行延伸。該反應在四個分開的試管中重復,每堿基輪流作為雙脫氧核苷酸。DNA聚合酶限制鏈終止核苷酸摻入,產生了一系列僅在使用特定雙脫氧核苷酸的位置處被終止的相關DNA片段。對于每個反應試管,將片段在厚塊聚丙烯酰胺凝膠或填充有粘粘滯聚合物的毛細管中通過電泳按大小進行分離。當從凝膠頂部向底部掃描時,通過讀取哪道產生來自于標記引物的可視化標志來確定序列。或者,染料終止測序對終止物進行標記。通過將每種雙脫氧核苷酸鏈終止物用在不同波長處發射熒光的不同熒光染料標記,可以在單個反應中執行完全測序。2.雜交、
核酸雜交技術的說明性而非限制性實例包括但不限于原位雜交(ISH)、微陣列和Southern 或 Northern 印跡。原位雜交(ISH)是一種雜交類型,其使用標記的互補DNA或RNA鏈作為探針定位組織的部分或切片中(原位)、或者如果組織足夠小就定位整個組織中(全標本包埋ISH)的特定DNA或RNA序列。DNA ISH可用于確定染色體的結構。RNA ISH被用于測量和定位組織切片或全標本包埋中的mRNA和其他轉錄物。通常對樣本細胞和組織進行處理以將靶轉錄物固定在位并增加探針的進入。將探針與靶序列在升高的溫度下雜交,然后洗掉過量的探針。分別使用放射自顯影、熒光顯微術或免疫組織化學,對組織中使用放射性、熒光或抗原標記的堿基所標記的探針進行定位和定量。ISH也可以使用兩種以上用放射活性或其他非放射性標記物標記的探針,以同時檢測兩種以上的轉錄物。a. FISH 在某些實施方案中,使用熒光原位雜交(FISH)檢測融合序列。用于本發明的優選FISH測定法利用了細菌人工染色體(BAC)。它們已被廣泛用于人類基因組測序計劃(參見Nature 409 :953_958 (2001)),并且可以通過經銷商獲得含有特定BAC的克隆,所述經銷商可以通過許多來源例如NCBI來定位。來自人類基因組的每個BAC克隆已經給予用于清楚地鑒別它的參考名稱。這些名稱可用于尋找相應的GenBank序列以及從經銷商訂購克隆的拷貝。本發明還提供了在人類前列腺細胞、人類前列腺組織上或所述人類前列腺細胞或人類前列腺組織周圍的流體上進行FISH測定的方法。將探針用適合的熒光或其他標志物標記,然后使用在雜交中。本文中提供的實施例部分提出了有效用于測量缺失的具體方案,但本技術領域的專業人員將會認識到,該測定方法的許多改變可以同樣好地使用。具體方案在本技術領域中是公知的,并可以容易地適應于本發明。關于方法的指導可以從許多參考文獻獲得,包括《原位雜交醫學應用》(Insitu Hybridization Medical Applications) (G. R. Coulton 和 J. de Belleroche 主編),Kluwer Academic Publishers, Boston (1992);《神經生物學中的原位雜交,方法學改進》(In situ Hybridization In NeurobioloRY Advances in MethodoloRy)(J. H. Eberwine、K. L. Valentino 和 J. D. Barchas 主編),Oxford University Press Inc. , England (1994);《原位雜交實用方法》(In situ Hybridization A Practical Approach) (D. G. Wilkinson主編),Oxford University Press Inc. , England (1992) ;Kuo 等,Am. J. Hum. Genet. 49 112-119 (1991) ;Klinger,等,Am. J. Hum. Genet. 51 55-65 (1992);以及 Ward 等,Am. J. Hum.Genet. 52 =854-865 (1993)。還存在可商購的并為執行FISH測定法提供方案的試劑盒(可以從例如Oncor, Inc. , Gaithersburg, MD獲得)。提供方法學指導的專利包括美國專利5,225,326,5, 545,524,6, 121,489和6,573,043。所有這些參考文獻在此以其全文引為參考,并可以與本技術領域中相似的參考文獻和本文實施例部分中提供的信息一起,用于建立具體實驗室方便的程序化步驟。b.微陣列被稱為微陣列的不同種類生物測定法包括但不限于DNA微陣列(例如cDNA微陣列和寡核苷酸微陣列)、蛋白質微陣列、組織微陣列、轉染或細胞微陣列、化學化合物微陣列和抗體微陣列。DNA微陣列通常被稱為基因芯片、DNA芯片或生物芯片,是附著于固相表面(例如玻璃、塑料或硅芯片)上形成陣列的微小DNA斑點的集合,用于同時對數千個基因進行表達譜分析或監測表達水平。固著的DNA區段被稱為探針,在單個DNA微陣列中可以使用數千個探針。通過比較疾病和正常細胞中的基因表達,微陣列可用于鑒定疾病基因。微陣列可以使用各種技術制造,包括但不限于使用尖頭針在玻璃載片上印刷;使用預制掩模進行光刻;使用動態微鏡器件進行光刻;噴墨印刷;或微電極陣列上的電化學。Southern和Northern印跡法分別用于檢測特定DNA或RNA序列。將從樣本提取的DNA或RNA片段化,在基質凝膠上電泳分離,并轉移到濾膜上。將結合有DNA或RNA的濾膜與目標序列的互補標記探針進行雜交。檢測與濾膜結合的雜交探針。該程序的變化形式是反向Northern印跡,其中固著到膜上的底物核酸是分離的DNA片段的集合,探針是從組織提取并標記的RNA。3.擴增基因組DNA的染色體重排和嵌合mRNA在檢測之前或同時可以進行擴增。核酸擴增技術的說明性而非限制性實例包括但不限于聚合酶鏈反應(PCR)、反轉錄聚合酶鏈反應 (RT-PCR)、轉錄介導的擴增(TMA)、連接酶鏈反應(LCR)、鏈置換擴增(SDA)和基于核酸序列的擴增(NASBA)。本技術領域的普通專業人員將會認識到某些擴增技術(例如PCR)需要在擴增前將RNA反轉錄成DNA (例如RT-PCR),而其他擴增技術直接擴增RNA (例如TMA和NASBA)。聚合酶鏈反應(美國專利No. 4,683,195,4, 683,202,4, 800,159 和 4,965,188,在本文中各以其全文引為參考),通常為稱為PCR,使用變性、引物對與相反鏈的退火以及引物延伸的多個循環來指數級增加靶核酸序列的拷貝數。在被稱為RT-PCR的變化形式中,使用反轉錄酶(RT)從mRNA制造互補DNA(cDNA),然后通過PCR擴增cDNA以產生DNA的多個拷貝。對于PCR的其他各種變換形式,參見例如美國專利No. 4,683,195,4, 683,202和 4,800,159 ;Mullis 等,Meth. Enzymol. 155 335 (1987);以及 Murakawa 等,DNA 7 287(1988),在本文中各以其全文引為參考。轉錄介導的擴增(美國專利No.5,480,784和5,399,491,在本文中各以其全文引為參考),通常被稱為TMA,在靶序列的多個RNA拷貝自催化產生更多拷貝的基本上恒定的溫度、離子強度和PH條件下,自催化地合成靶核酸序列的多個拷貝。參見例如美國專利No. 5, 399,491和5,824,518,在本文中各以其全文引為參考。在美國專利公布No. 20060046265 (在此以其全文引為參考)中描述的變化形式中,TMA任選包括使用阻斷部分、終止部分和其他修飾部分來改進TMA方法的靈敏度和準確性。連接酶鏈反應(Weiss,R.,Science 254 :1292 (1991),在此以其全文引為參考),通常稱為LCR,使用與靶核酸相鄰區域雜交的兩組互補DNA寡核苷酸。所述DNA寡核苷酸在重復的熱變性、雜交和連接的循環中被DNA連接酶共價連接,產生可檢測的雙鏈連接的寡核苷酸產物。鏈置換擴增(Walker,G.等,Proc. Natl. Acad. Sci. USA 89 :392_396 (1992);美國專利No. 5,270, 184和5,455,166,在本文中各以其全文引為參考),通常被稱為SDA’使用下面的循環引物序列對與靶序列的相反鏈退火,引物在存在dNTPa S的情況下延伸以產生雙鏈體半硫代磷酸酯化的引物延伸產物,對半修飾的限制性核酸內切酶識別位點進行核酸內切酶介導的切口、以及聚合酶介導的從切口 3’末端的引物延伸,來置換現有的鏈并為下一輪的引物退火、切口和鏈置換產生鏈,導致產物的幾何級擴增。嗜熱SDA(tSDA)以基本上相同的方法在較高溫度下使用嗜熱核酸內切酶和聚合酶(歐洲專利No. O 684 315)。其他擴增方法包括,例如通常被稱為NASBA的基于核酸序列的擴增(美國專利No. 5,130,238,在此以其全文引為參考);通常被稱為QP復制酶的使用RNA復制酶擴增探針分子自身的方法(Lizardi等,BioTechnol. 6 :1197(1988),在此以其全文引為參考);基于轉錄的擴增方法(Kwoh等,Proc. Natl. Acad. Sci. USA 86:1173(1989));以及自持續序列復制(Guatelli 等,Proc. Natl. Acad. Sci. USA 87 :1874 (1990),在本文中各以其全文引為參考)。對于已知擴增方法的進一步討論,參見Persing, David H.,《診斷醫學微生物學原理與應用》中的“體外核酸擴增技術”(“In Vitro Nucleic Acid AmplificationTechniques”,Diagnostic Medical Microbiology !Principles and Applications)(Persing 等主編),pp. 51-87 (美國微生物學會(American Society for Microbiology),Washington, DC(1993))。4.檢測方法 可以通過任何常規手段檢測未擴增或擴增的基因融合體核酸。例如,可以通過與可檢測標記的探針雜交并測量得到的雜交體來檢測基因融合體。檢測方法的說明性而非限制性實例描述如下。一種說明性檢測方法,雜交保護測定法(HPA)包括將化學發光寡核苷酸探針(例如吖啶酯標記(AE)探針)與靶序列雜交,選擇性水解未雜交探針上存在的化學發光標記物,并在照度計中測量從剩余探針產生的化學發光。參見例如美國專利No. 5,283,174和Norman C. Nelson 等,《非同位素探測、印跡和測序》(Nonisotopic Probing, Blotting, andSequencing)第17章(Larry J. Kricka主編,第二版),1995,在本文中各以其全文引為參考)。另一種說明性檢測方法為擴增過程提供實時定量評估。“實時”評估擴增過程包括在擴增反應過程中連續或定期測定反應混合物中擴增子的量,以及使用測定值計算樣本中最初存在的靶序列的量。用于測定樣本中最初存在的靶序列的量的各種基于實時擴增的方法在本技術領域中是公知的。它們包括在美國專利No. 6,303,305和6,541,205公開的方法,在本文中各以其全文引為參考。另一種用于測定樣本中最初存在的靶序列的量、但是不基于實時擴增的方法,公開在美國專利No. 5,710,029中,在此以其全文引為參考。擴增產物可以通過使用各種自雜交探針進行實時檢測,大部分自雜交探針具有莖-環結構。對這些自雜交探針進行標記,使得它們根據探針是處于自雜交狀態還是通過與靶序列雜交而處于改變的狀態而發射不同的可檢測信號。作為非限制性實例,“分子炬”是一類自雜交探針,其包括由連接區(例如非核苷酸連接物)相連的、在預定雜交測定條件下彼此雜交的不同自身互補區域(被稱為“靶結合結構域”和“靶封閉結構域”)。在優選實施方案中,分子炬在靶結合結構域中含有長度為I至約20個堿基的單鏈堿基區域,并允許在鏈置換條件下與擴增反應中存在的靶序列雜交。在鏈置換條件下,有利于分子炬的兩個可以完全或部分互補的互補區域的雜交,除了在存在靶序列的情況下,靶序列將與靶結合結構域中存在的單鏈區結合并置換所有或部分靶封閉結構域。分子炬的靶結合結構域和靶封閉結構域包括可檢測標記物或一對相互作用標記物(例如發光劑/淬滅劑),其位置使得當分子炬自雜交時產生的信號與分子炬同靶序列雜交時產生的信號不同,從而允許在存在未雜交的分子炬的情況下檢測被測樣本中的探針靶雙鏈體。分子炬和各種類型的相互作用標記物對公開在美國專利No. 6,534,274中,在此以其全文引為參考。
另一個具有自身互補性的檢測探針實例是“分子信標”。分子信標包括具有靶互補序列的核酸分子、在不存在擴增反應中存在的靶序列的情況下將探針保持在封閉構象的親和對(或核酸臂)、以及當探針處于封閉構象時相互作用的標記物對。靶序列與靶互補序列的雜交將親和對的成員分開,從而將探針轉變成開放構象。由于標記物對相互作用的降低,向開放構象的轉變是可檢測的,所述標記物對可以是例如熒光團和淬滅劑(例如DABCYL和EDANS)。分子信標公開在美國專利No. 5,925,517和6,150, 097中,在此以其全文引為參考。其他的自雜交探針對于本技術領域的普通專業人員來說是公知的。作為非限制性的實例,具有相互作用標記物的探針結合對,例如美國專利No. 5,928,862 (在此以其全文引為參考)中所公開的,可以適用于本發明。用于檢測單核苷酸多態性(SNP)的探針系統也可用于本發明。其他檢測系統包括“分子開關”,例如在美國專利公布No. 20050042638中所公開的,在此以其全文引為參考。其他探針,例如包含嵌入染料和/或熒光染料的探針,也可用于檢測本發明的擴增產物。參見例如美國專利No. 5,814,447 (在此以其全文引為參考)。C.蛋白質檢測本發明的基因融合體可以使用本技術領域的普通專業人員已知的各種蛋白質技術、作為截短的ETS家族成員蛋白或嵌合蛋白來檢測,所述技術包括但不限于蛋白質測序和免疫測定法。I.測序蛋白質測序技術的說明性而非限制性的實例包括但不限于質譜和Edman降解。原則上說,質譜能夠測序任何尺寸的蛋白,但是當尺寸增加時變得更難計算。將蛋白用內切蛋白酶消化,并將得到的溶液通過高壓液相色譜柱。在該柱末端,將溶液從充電至高正電位的狹小噴嘴噴出,進入質譜儀。液滴上的電荷使它們裂成片段,直到只剩單個離子。然后將肽裂成片段并測量片段的質荷比。質譜圖通過計算機分析,并通經常針對以前測序的蛋白質數據庫進行比較,以便確定片段的序列。然后使用不同的消化酶重復該過程,并使用序列重疊來構建蛋白質序列。在Edman降解反應中,將待測序的妝吸附在固相表面上(例如包被有聚凝胺的玻璃纖維)。向吸附的肽加入Edman試劑苯基異硫氰酸酯(PTC)和12%三甲胺的弱堿性緩沖溶液,并與N-端氨基酸的胺基反應。然后加入無水的酸選擇性脫開該末端氨基酸衍生物。衍生物異構以產生取代的苯基硫代乙內酰脲,其可以被洗掉并通過層析鑒定,然后重復該循環。每一步的效率約為98%,其允許可靠地測定約50個氨基酸。2.免疫測定法免疫測定法的說明性而非限制性實例包括但不限于免疫沉淀、Western印跡、ELISA、免疫組織化學、免疫細胞化學、流式細胞術和免疫PCR。使用本技術領域的普通專業人員已知的各種技術(例如比色、熒光、化學發光或放射活性)可檢測性標記的多克隆或單克隆抗體,適合用于免疫測定法。免疫沉淀是使用特異性針對抗原的抗體將該抗原從溶液中沉淀出來的技術。通過靶向據認為存在于復合物中的蛋白質,該方法可用于鑒定細胞提取液中存在的蛋白質復合物。通過先從細菌分離不溶性抗體結合蛋白例如蛋白A和蛋白G,從溶液中取得復合物。抗體也可以與瓊脂糖凝膠珠偶聯,該珠子可以容易地從溶液中分離出來。在洗滌后,可以使用質譜、Western印跡或任何數量的用于鑒定復合物組分的其他方法來分析沉淀物。 Western印跡或免疫印記是在給定的組織勻漿液或提取液樣本中檢測蛋白質的方法。它使用凝膠電泳根據質量分離變性蛋白。然后將蛋白從凝膠轉出,并轉移到典型為聚二氟乙烯或硝酸纖維素的膜上,使用特異性針對目標蛋白的抗體在膜上探測它們。結果,研究人員能夠考查給定樣本中的蛋白量并比較幾個組之間的水平。ELISA是酶聯免疫吸附測定法的簡稱,是檢測樣本中抗體或抗原的存在的生物化學技術。它利用至少兩種抗體,一種特異性針對抗原,另一種與酶偶聯。第二抗體引起產色或產熒光底物產生信號。ELISA的變化形式包括夾心ELISA、競爭性ELISA和ELISP0T。因為能夠執行ELISA以評估樣本中抗原的存在或抗體的存在,因此它對于測定血清抗體濃度并還確定抗原的存在兩者來說,都是有用的工具。免疫組織化學和免疫細胞化學是指通過組織或細胞中的抗原與其相應抗體結合的原理,分別定位組織切片或細胞中蛋白質的方法。通過用產色或熒光標簽標記抗體,能夠進行可視化。有色標簽的典型實例包括但不限于辣根過氧化物酶和堿性磷酸酶。熒光團標簽的典型實例包括但不限于熒光素異硫氰酸酯(FITC)或藻紅蛋白(PE)。流式細胞術是用于計數、檢測和分揀懸浮在流體流中的顯微型粒子的技術。它允許對流過光學/電子檢測儀器的單個細胞的物理和/或化學特性進行同時的多參數分析。將一束單一頻率或顏色的光(例如激光)導向流體力學集中的流體流上。多個檢測器瞄準液流通過光束的位點;一個檢測器與光束成一直線(正向散射或FSC),幾個檢測器與其垂直(側向散射(SSC)和一個或多個熒光檢測器)。每個通過光束的懸浮粒子以某種方式散射光,并且粒子中的熒光化學物質可以被激發以發射頻率比光源低的光。散射光和熒光的組合被檢測器獲取,通過分析各用于每個熒光發射峰的每個檢測器處亮度的波動,能夠推導出關于每個單個粒子的物理和化學結構的各種實際情況。FSC與細胞體積相關聯,SSC與粒子的密度或內部復雜程度(例如核的形狀、細胞質顆粒的量和類型或膜的粗糙度)相關聯。免疫-聚合酶鏈反應(IPCR)利用核酸擴增技術增加基于抗體的免疫測定中的信號產生。因為不存在等同的蛋白質PCR,也就是說,蛋白質不能以與PCR過程中核酸復制相同的方式進行復制,因此增加檢測靈敏度的唯一方式是通過信號放大。靶蛋白與直接或間接接合寡核苷酸的抗體結合。將未結合的抗體洗掉,并對剩余的結合抗體使其寡核苷酸擴增。通過使用標準的核酸檢測方法、包括實時方法檢測被擴增的寡核苷酸,來進行蛋白質檢測。D.數據分析在某些實施方案中,使用基于計算機的分析程序將檢測測定法產生的原始數據(例如給定基因融合體或其他標志物的存在、不存在或量)轉變成臨床醫生使用的預測值數據。臨床醫生可以使用任何適合的手段訪問預測數據。因此,在某些優選實施方案中,本發明提供了進一步的優點,即可能沒有在遺傳學或分子生物學方面受過訓練的臨床醫生,不需要理解原始數據。數據以其最有用的形式直接呈遞給臨床醫生。然后臨床醫生能夠立即使用信息以便優化對象的護理。
本發明預想了能夠從執行測定的實驗室、信息提供者、醫務人員和對象接收、處理和發送信息,或接收、處理和發送信息給執行測定的實驗室、信息提供者、醫務人員和對象的任何方法。例如,在本發明的某些實施方案中,從對象獲得樣本(例如活檢或血漿或尿液樣本),并將其送至位于世界任何位置(例如與對象居住或最終使用信息的國家不同的國家)的譜分析(profiling)服務機構(例如醫學機構的臨床實驗室、基因組譜分析企業等)以產生原始數據。當樣本包含組織或其他生物樣本時,對象可以拜訪醫學中心進行樣本獲取并將其送往譜分析中心,或對象可以自己收集樣本(例如尿液樣本)并將其直接送往譜分析中心。當樣本包含以前測定的生物信息時,信息可以由對象直接送往譜分析服務機構(例如可以通過計算機掃描含有信息的信息卡,并使用電子通訊系統將數據發送到譜分析中心的計算機)。在譜分析服務機構接收后,對樣本進行處理,并產生特異性針對對象所需的診斷或預后信息譜(即表達數據)。然后將譜數據制備成適合于由治療臨床醫生解釋的格式。例如,不是提供原始表達數據,所制備的格式可以呈現為對象的診斷或風險評估(例如癌癥出現的可能性)以及對具體治療選項的推薦意見。數據可以通過任何適合方法顯示給臨床醫生。例如,在某些實施方案中,譜分析服務機構產生報告,其可以為臨床醫生打印(例如在護理點)或在計算機監視器上顯示給臨床醫生。在某些實施方案中,信息首先在護理點或地區站進行分析。然后將原始數據送往中央處理站進行進一步分析,和/或將原始數據轉變成對臨床醫生或患者有用的信息。中央處理站提供私密性(所有數據以統一的安全協議儲存在中央站中)、速度和數據分析的一致性的優點。然后中央處理站可以跟隨對象的治療控制數據的命運。例如,使用電子通訊系統,中央站可以將數據提供給臨床醫生、對象或研究人員。在某些實施方案中,對象能夠使用電子通訊系統直接訪問數據。對象可以根據結果選擇進一步干預或咨詢。在某些實施方案中,數據被用于研究用途。例如,數據可用于進一步優化包含或消除標志物作為疾病具體狀況或階段的有用指示物。E.體內成像本發明的基因融合體也可以使用體內成像技術檢測,所述技術包括但不限于放射性核素成像、正電子發射斷層掃描(PET)、計算機軸向斷層掃描、X射線或磁共振成像方法、熒光檢測和化學發光檢測。在某些實施方案中,體內成像技術被用于顯示動物(例如人類或非人類哺乳動物)中癌癥標志物的存在或表達。例如,在某些實施方案中,使用特異性針對癌癥標志物的標記抗體,標記癌癥標志物的mRNA或蛋白。可以使用體內成像方法在個體中檢測特異性結合和標記的抗體,所述方法包括但不限于放射性核素成像、正電子發射斷層掃描、計算機軸向斷層掃描、X射線或磁共振成像方法、熒光檢測和化學發光檢測。用于產生針對本發明的癌癥標志物的抗體的方法在下文描述。本發明的體內成像方法可用于診斷表達本發明的癌癥標志物的癌癥(例如前列腺癌)。體內成像被用于顯示指示癌癥的標志物的存在。這樣的技術允許不使用不受歡迎的活檢即可進行診斷。本發明的體內成像方法也可用于為癌癥患者提供預后。例如,可以檢測指示癌癥可能轉移的標志物的存在。本發明的體內成像方法還可用于檢測身體其他部 分中的轉移癌。在某些實施方案中,特異性用于本發明的癌癥標志物的試劑(例如抗體)被熒光標記。將標記的抗體導入對象(例如口服或腸胃外)。使用任何適合的方法檢測熒光標記的抗體(例如使用在此引為參考的美國專利No. 6,198,107中描述的儀器)。在其他實施方案中,抗體被放射性標記。使用抗體進行體內診斷在本技術領域中是公知的。Sumerdon等(Nucl. Med. Biol 17 247-254[1990])描述了優化的抗體-螯合劑,用于使用銦-111作為標記物進行腫瘤的放射免疫閃爍成像。Griffin等(J Clin One 9 631-640[1991])描述了使用該藥劑在懷疑患有復發的結腸直腸癌的患者中檢測腫瘤。使用帶有順磁性離子作為磁共振成像標記物的類似試劑,在本技術領 域中是已知的(Lauffer,Magnetic Resonance in Medicine 22 :339_342 [1991])。使用的標記物將取決于所選的成像形式。放射性標記物例如銦-111、锝-99m或碘-131可用于平面掃描或單光子發射計算機斷層掃描(SPECT)。正電子發射標記物例如氟-19也可用于正電子發射斷層掃描(PET)。對于MRI來說,可以使用順磁性離子例如釓(III)或錳(II)。半衰期為I小時至3. 5天的放射性金屬可用于接合抗體,例如鈧-47(3. 5天)、鎵-67 (2. 8天)、鎵-68 (68分鐘)、锝_99m (6小時)和銦-111 (3. 2天),其中鎵-67、锝_99m和銦-111優選用于Y相機成像,鎵-68優選用于正電子斷層掃描。使用這種放射性金屬來標記抗體的有用方法是利用雙功能螯合劑,例如二乙烯三胺五乙酸(DTPA),如由 Khaw 等(Science 209 :295 [1980])對 In-Ill 和 Tc_99m 的描述,以及Scheinberg等(Science 215 :1511 [1982])的描述。也可以使用其他螯合劑,但是有優勢的是I-(對羧基甲氧基苯甲基)EDTA和DTPA的羧基碳酐,因為使用它們允許接合而基本不影響抗體的免疫反應性。將DPTA與蛋白偶聯的另一種方法是使用DTPA的環狀酐,如Hnatowich等(Int.J. Appl. Radiat. Isot. 33 327[1982])對In-Ill標記白蛋白所描述的,但是其可適用于標記抗體。用Tc-99m標記抗體并且不使用DPTA螯合的適合方法是Crockford等的亞錫法(pretinning method)(美國專利 No. 4, 323, 546,在此引為參考)。用Tc_99m標記免疫球蛋白的優選方法是Wong等(Int. J. Appl. Radiat. Isot,29 251[1978])描述的用于血漿蛋白的方法,并且最近由Wong等(J. Nucl. Med. ,23 229[1981])成功應用于標記抗體。在放射性金屬與特異性抗體接合的情況下,同樣希望將盡可能高比例的放射性標記物導入抗體分子而不破壞其免疫特異性。為了確保抗體上的抗原結合位點得到保護,可以通過在本發明的特定癌癥標志物存在下執行放射性標記以獲得進一步改進。在標記后分尚抗原。在其他實施方案中,使用體內生物光子成像(Xenogen, Almeda, CA)進行體內成像。該實時體內成像利用螢光素酶。將螢光素酶基因摻入到細胞、微生物和動物中(例如作為帶有本發明癌癥標志物的融合蛋白)。當活化時,它引起發光反應。使用CCD相機和軟件捕獲圖像并對其進行分析。F.組合物和試劑盒在本發明的診斷方法中使用的組合物包括但不限于探針、擴增寡核苷酸和抗體。特別優選的組合物只有在基因融合體存在時才檢測到產物。這些組合物包括單個標記探針,其包含與5’融合配偶體的5’部分與3’融合配偶體的3’部分融合的連接處雜交(即跨越基因融合體連接處)的序列;一對擴增寡核苷酸,其中第一個擴增寡核苷酸包含與5’融合配偶體雜交的序列,第二個擴增寡核苷酸包含與3’融合配偶體雜交的序列;針對氨基端截短的3’融合配偶體的抗體;或針對具有5’融合配偶體的氨基端部分和3’融合配偶體的羧基端部分的嵌合蛋白的抗體。然而,其他有用的組合物包括一對標記探針,其中第一個標記探針包含與5’融合配偶體雜交的序列,第二個標記探針包含與3’融合配偶體雜交的序列。任何這些組合物,單獨地或與本發明的其他組合物組合,可以提供成試劑盒的形式。例如,單個標記探針和擴增寡核苷酸對可以提供在試劑盒中,用于本發明的基因融合體的擴增和檢測。試劑盒還可以包含適合的對照和/或檢測試劑。本發明的探針和抗體組合物也可以提供成陣列的形式。IV.藥物篩選應用在某些實施方案中,本發明提供了藥物篩選測定法(例如篩選抗癌藥物)。本發明的篩選方法利用了使用本發明的方法鑒定到的癌癥標志物(例如包括但不限于本發明的基因融合體)。例如,在某些實施方案中,本發明提供了改變(例如降低)基因融合體表達的化合物的篩選方法。化合物或藥劑可以通過例如與啟動子區相互作用而干擾轉錄。化合物或藥劑可以干擾從融合體產生的mRNA (例如通過RNA干擾、反義技術等)。化合物或藥劑可以干擾融合體生物活性的上游或下游的途徑。在某些實施方案中,候選化合物是針對癌癥標志物的反義或干擾RNA藥劑(例如寡核苷酸)。在其他實施方案中,候選化合物是特異性結合本發明的癌癥標志物調控物或表達產物并抑制其生物功能的抗體或小分子。在一種篩選方法中,通過將化合物與表達癌癥標志物的細胞相接觸,然后測定候選化合物對表達的影響,來評估候選化合物改變癌癥標志物表達的能力。在某些實施方案中,通過檢測細胞所表達的癌癥標志mRNA的水平,來測定候選化合物對癌癥標志物基因的表達的影響。mRNA表達可以通過任何適合的方法檢測。在其他實施方案中,通過測量癌癥標志物編碼的多肽的水平來測定候選化合物對癌癥標志物基因的表達的影響。所表達的多肽的水平可以使用任何適合的方法來測量,包括但不限于本文公開的方法。具體來說,本發明提供了篩選方法,用于鑒定與本發明的癌癥標志物結合、對例如癌癥標志物表達或癌癥標志物活性具有抑制(或刺激)效應、或對例如癌癥標志物底物的表達或活性具有刺激或抑制效應的調節物——即候選或測試化合物或藥劑(例如蛋白、肽、肽模擬物、類肽、小分子或其他藥物)。由此鑒定的化合物可用于在治療方案中直接或間接調節靶基因產物(例如癌癥標志物基因)的活性、闡明靶基因產物的生物功能、或鑒定破壞正常靶基因相互作用的化合物。抑制癌癥標志物的活性或表達的化合物可用于增殖性病癥例如癌癥、特別是前列腺癌的治療。在一個實施方案中,本發明提供了用于篩選候選或測試化合物的測定方法,所述化合物是癌癥標志物蛋白或多肽或其生物活性部分的底物。在另一個實施方案中,本發明提供了用于篩選候選或測試化合物的測定方法,所述化合物結合癌癥標志物蛋白或多肽或其生物活性部分,或調節它們的活性。
本發明的測試化合物可以使用本技術領域已知的組合文庫方法中大量方法的任一種來獲得,所述文庫包括生物文庫、類肽文庫(具有肽的功能性但是帶有新的非肽骨架的分子的文庫,它們對酶降解具有抗性但仍然保留生物活性;參見例如Zuckennann等,J. Med. Chem. 37 :2678_85 [1994])、空間可尋址平行固相或溶液相文庫、需要反卷積的合成文庫方法、“一顆珠子一種化合物(one-bead one-compound) ”的文庫方法、以及使用親和層析選擇的合成文庫方法。生物文庫和類肽文庫方法優選用于肽文庫,而其他四種方法適用于肽、非肽低聚物或化合物的小分子文庫(Lam(1997)Anticancer Drug Des. 12 :145)。
用于合成分子文庫的方法的實例可以見于本技術領域,例如在下述文獻中Deffitt 等,Proc. Natl. Acad. Sci. U. S. A. 90 6909 [1993] ;Erb 等,Proc. Nad. Acad. Sci.USA 91 :11422 [1994] ;Zuckermann 等,J. Med. Chem. 37 2678[1994] ;Cho 等,Science 261 1303 [1993] ; Carre 11 等,Angew. Chem. Int. Ed. Engl. 33. 2059 [1994] ; Care 11 等,Angew.Chem. Int. Ed. Engl. 33 2061[1994];以及 Gallop 等,J. Med. Chem. 37 :1233 [1994]。
化合物文庫可以存在于溶液中(例如Houghten, Biotechniquesl3 412-421 [1992]),或存在于珠子(Lam, Nature 354 :82_84[1991])、芯片(Fodor, Nature364 :555-556[1993])、細菌或孢子(美國專利No. 5,223,409 ;在此引為參考)、質粒(Cull等,Proc. Nad. Acad. Sci. USA89 :1865-1869 [1992])或噬菌體上(Scott 和 Smith, Science249 :386-390[1990] ;Devlin Science 249 :404_406[1990] ;Cwirla 等,Proc. Natl. Acad.Sci. 87 6378-6382[1990] ;Felici, J. Mol. Biol. 222 301[1991]) 在一個實施方案中,測定方法是基于細胞的測定方法,其中將表達癌癥標志mRNA或蛋白或其生物活性部分的細胞與測試化合物相接觸,并測定測試化合物調節癌癥標志物活性的能力。測定測試化合物調節癌癥標志物活性的能力,可以通過監測例如酶活性的變化、破壞或mRNA等來實現。也可以評估測試化合物調節癌癥標志物與化合物、例如癌癥標志物底物或調節物結合的能力。這可以通過例如將化合物例如底物與放射性同位素或酶標記物偶聯來實現,以便化合物例如底物與癌癥標志物的結合可以通過檢測復合物中的標記化合物例如底物來測定。或者,將癌癥標志物與放射性同位素或酶標記物偶聯,以監測測試化合物調節復合物中癌癥標志物與癌癥標志物底物結合的能力。例如,化合物(例如底物)可以用1251、35S、14C或3H直接或間接標記,并通過對放射性發射進行直接計數或通過閃爍計數來檢測放射性同位素。或者,化合物可以用例如辣根過氧化物酶、堿性磷酸酶或螢光素酶進行酶標記,并通過測定適合的底物向產物的轉化來檢測酶標記物。可以在標記或不標記任何相互作用物的情況下評估化合物(例如癌癥標志物底物)與癌癥標志物相互作用的能力。例如,可以使用微生理計在不標記化合物或癌癥標志物的情況下檢測化合物與癌癥標志物的相互作用(McConnell等,Science 257 1906-1912[1992])。當在本文中使用時,“微生理計”(例如細胞傳感器)是使用可光尋址的電勢測定傳感器(LAPS)測量細胞酸化其環境的速率的分析儀器。該酸化速率的變化可用作化合物與癌癥標志物之間的相互作用的指示物。在另一個實施方案中,提供了無細胞測定方法,其中將癌癥標志物蛋白或其生物活性部分與測試化合物相接觸,并評估測試化合物與癌癥標志物蛋白、mRNA或其生物活性部分結合的能力。用于本發明測定方法的癌癥標志物蛋白或mRNA的優選生物活性部分包括參與與底物或其他蛋白的相互作用的片段,例如具有高表面概率分值的片段。無細胞測定方法包括制備靶基因蛋白與測試化合物的反應混合物,在足以允許兩種組分相互作用和結合的條件下和時間內反應,從而形成可以被取出和/或檢測的復合物。也可以使用例如熒光能量轉移(FRET)來檢測兩種分子之間的相互作用(參見例如 Lakowicz 等,美國專利 No. 5, 631, 169 ;Stavrianopoulos 等,美國專利 No. 4, 968, 103 ;其每個在此引為參考)。對熒光團標記物進行選擇,使得第一個供體分子的發射熒光能量將被第二個“受體”分子上的熒光標記物吸收,所述第二個受體分子進而由于吸收能量而能發射熒光。或者,“供體”蛋白分子可以簡單地利用色氨酸殘基的天然熒光能量。選擇發射不同波長的光的標記物,使得“受體”分子的標記物可以與“供體”的相區分。因為標記物之間的能量轉移效率與分子相隔的距離相關,因此可以評估分子之間的空間關系。在分子之間發生結合的情形下,“受體”分子標記物的熒光發射將最大化。通過本技術領域公知的標準熒光測定手段(例如使用熒光計),可以方便地測量FRET結合事件。 在另一個實施方案中,測定癌癥標志物蛋白或mRNA與靶分子結合的能力可以使用實時生物分子相互作用分析(BIA)來實現(參見例如Sjolander和Urbaniczky, Anal.Chem. 63 :2338_2345 [1991]以及 Szabo 等,Curr. Opin. Struct. Biol. 5 :699_705 [1995])。“表面等離激元共振”或“BIA”不用標記任何相互作用物即可實時檢測生物特異性相互作用(例如BIAcore)。結合表面處質量的變化(表明結合事件)導致表面附近光的折射率的改變(表面等離激元共振(SPR)的光學現象),產生可檢測信號,其可用作生物分子之間實時反應的指示。在一個實施方案中,將靶基因產物或測試物質錨定在固相上。錨定在固相上的靶基因產物/測試化合物復合物可以在反應結束時檢測。優選,靶基因產物可以錨定在固相表面上,并且測試化合物(其沒有被錨定)可以用本文中討論的可檢測標記物直接或間接
己 O將癌癥標志物、抗癌癥標志物抗體或其靶分子固定化,以便于一種或兩種蛋白的復合與未復合形式分離以及適應于測定方法的自動化,可能是理想的。測試化合物與癌癥標志物蛋白的結合,或癌癥標志物蛋白與靶分子在候選化合物存在或不存在下的相互作用,可以在適合容納反應試劑的任何容器中進行。這種容器的實例包括微量滴定板、試管和微量離心管。在一個實施方案中,可以提供融合蛋白,其添加了允許蛋白中的一種或二者與基質結合的結構域。例如谷胱甘肽-S轉移酶-癌癥標志物融合蛋白或谷胱甘肽-S-轉移酶/祀融合蛋白可以吸附在谷胱甘肽瓊脂糖凝膠珠子(Sigma Chemical, St. Louis, MO)或谷胱甘肽衍生化的微量滴定板上,然后將其與測試化合物或測試化合物以及不被吸附的靶蛋白或癌癥標志物蛋白合并,并將混合物在引起復合物形成的條件下(例如在鹽和pH的生理條件下)溫育。在溫育后,清洗珠子或微量滴定板的孔以除去任何未結合的組分,在珠子的情況下將基質固定化,例如如上所述直接或間接測定復合物。或者,可以將復合物從基質上解離,并使用標準技術測定癌癥標志物的結合或活性水平。用于將癌癥標志物蛋白或靶分子固定化在基質上的其他技術包括使用生物素和鏈親和素進行接合。生物素化的癌癥標志物蛋白或靶分子可以使用本技術領域已知的技術(例如生物素化試劑盒,Pierce Chemicals, Rockford, EL)從生物素_NHS (N_輕基-琥拍酰亞胺)制備,并固定化在鏈親和素包被的96孔板(Pierce Chemical)的孔中。
為了進行測定,將非固定化組分添加到含有錨定組分的包被表面上。在反應完成后,在使任何形成的復合物保持固定化在固體表面上的條件下除去(例如通過洗滌)未反應組分。錨定在固相表面上的復合物的檢測可以用多種方式實現。當之前非固定化的組分預先標記時,檢測到在表面上固定化的標記物表明復合物形成。當之前非固定化組分沒有預先標記時,可以使用間接標記物檢測錨定在表面上的復合物,例如使用特異性針對固定化的組分的標記抗體(抗體又可以用例如標記的抗IgG抗體直接標記或間接標記)。這種測定方法使用與癌癥標 志物蛋白或靶分子具有反應性但是不干擾癌癥標志物蛋白與其靶分子結合的抗體來進行。這樣的抗體可以衍生化到板的孔上,并且將未結合的靶或癌癥標志物蛋白通過抗體接合捕獲在孔中。用于檢測這種復合物的方法,除了上述用于GST固定化復合物的方法之外,還包括使用與癌癥標志物蛋白或靶分子具有反應性的抗體進行的復合物免疫檢測,以及依賴于檢測與癌癥標志物蛋白或靶分子相關的酶活性的酶聯測定法。或者,無細胞測定方法可以在液相中進行。在這樣的測定方法中,通過多種標準技術中的任一種將反應產物與未反應的組分分離,所述技術包括但不限于差速離心(參見例如,Rivas和Minton,Trends Biochem Sci 18 :284_7[1993])、層析(凝膠過濾層析、離子交換層析)、電泳(參見例如Ausubel等主編《分子生物學現代方法》(Current Protocolsin Molecular Biology), 1999, J. Wiley New York.)以及免疫沉淀(參見例如 Ausubel 等主編《分子生物學現代方法》(Current Protocols in Molecular Biology), 1999, J. Wiley New York.)。這樣的樹脂和層析圖譜技術對于本技術領域的專業人員來說是公知的(參見例如Heegaard J. Mol. Recognit 11 141-8 [1998] ;Hageand Tweed J. Chromatogr. Biomed.Sci. Appl 699 :499-525 [1997])。此外,也可以如本文中所述方便地使用熒光能量轉移,不需從溶液中進一步純化復合物即可檢測結合。測定方法可以包括將癌癥標志物蛋白、mRNA或其生物活性部分與結合癌癥標志物的已知化合物接觸以形成測定混合物,將測定混合物與測試化合物相接觸,并測定測試化合物與癌癥標志物蛋白或mRNA相互作用的能力,其中測定測試化合物與癌癥標志物蛋白或mRNA相互作用的能力包括測定測試化合物與已知化合物相比優先結合癌癥標志物或其生物活性部分、或調節靶分子活性的能力。就癌癥標志物在體內能夠與一種或多種細胞或細胞外大分子、例如蛋白質相互作用來說,這種相互作用的抑制劑是有用的。均相測定方法可用于鑒定抑制劑。例如,制備靶基因產物與相互作用的細胞或細胞外結合配偶體產物的預制復合物,使得靶基因產物或其結合配偶體被標記,但是由標記物產生的信號由于復合物形成而被淬滅(參見例如美國專利No. 4,109, 496,在此引為參考,其利用了這種免疫測定方法)。添加與預制復合物的一種物質競爭并取代它的測試物質,將導致產生高于背景的信號。通過這種方式,可以鑒定破壞靶基因產物-結合配偶體相互作用的測試物質。或者,癌癥標志物蛋白可以在雙雜交測定法或三雜交測定法中用作“誘餌蛋白”(參見例如美國專利 No. 5,283,317 ;Zervos 等,Cell 72 :223_232[1993] ;Madura 等,J. Biol.Chem. 268. 12046-12054[1993] ;Bartel 等,Biotechniques 14 920-924[1993] ;Iwabuchi等,Oncogene 8 1693-1696 [1993];以及 fcent WO 94/10300 ;其每個在此引為參考),以鑒定與癌癥標志物結合或相互作用(“癌癥標志物結合蛋白”或“癌癥標志物_bp”)和參與癌癥標志物活性的其他蛋白。這樣的癌癥標志物_bp可以是癌癥標志物蛋白或作為例如癌癥標志物介導的信號傳導途徑下游元件的靶的信號激活劑或抑制劑。也可以鑒定癌癥標志物表達的調節物。例如,將細胞或無細胞混合物與候選化合物相接觸,并相對于不存在候選化合物的情況下癌癥標志mRNA或蛋白的表達水平,評估癌癥標志物mRNA或蛋白的表達。當癌癥標志mRNA或蛋白的表達在候選化合物存在下高于其不存在下的表達時,候選化合物被鑒定為癌癥標志mRNA或蛋白表達的刺激物。或者,當癌癥標志mRNA或蛋白的表達在候選化合物存在下低于(即統計學顯著地低于)其不存在下的表達時,候選化合物被鑒定為癌癥標志mRNA或蛋白表達的抑制劑。癌癥標志mRNA或蛋白表達的水平可以通過本文描述的用于檢測癌癥標志mRNA或蛋白的方法來確定。可以使用基于細胞或無細胞的測定方法鑒定調節劑,并且藥劑調節癌癥標志物蛋白活性的能力能夠在體內得到證實,例如在動物例如疾病的動物模型(例如患有前列腺癌或轉移的前列腺癌的動物;或帶有來自于動物(例如人類)的前列腺癌異種移植物的動物)、或來自由前列腺癌轉移產生的癌癥(例如轉移到淋巴結、骨或肝臟)的細胞或來自前列腺癌細胞系的細胞中。本發明還涉及通過上述的篩選測定法鑒定到的新的藥劑(參見例如下面癌癥治療的描述)。因此,在本發明的范圍內還包括將如本文所述鑒定到的藥劑(例如癌癥標志物調節劑、反義癌癥標志物核酸分子、siRNA分子、癌癥標志物特異性抗體或癌癥標志物結合配偶體)進一步用于適合的動物模型中(例如本文描述的模型),以確定使用這種藥劑進行治療的效能、毒性、副作用或作用機制。此外,通過上述篩選測定法鑒定到的新藥劑可以例如用于本文所述的治療。VI.治療性應用在某些實施方案中,本發明提供了用于癌癥(例如前列腺癌)的療法。在某些實施方案中,療法直接或間接靶向本發明的基因融合體。 A. RNA干擾和反義療法在某些實施方案中,本發明靶向基因融合體的表達。例如,在某些實施方案中,本發明使用了包含寡聚反義或RNAi化合物、特別是寡核苷酸(例如在上面描述的藥物篩選方法中鑒定的寡核苷酸)的組合物,用于調節編碼本發明癌癥標志物的核酸分子的功能,最終調節表達的癌癥標志物的量。I. RNA 干擾(RNAi)在某些實施方案中,使用RNAi抑制融合蛋白功能。RNAi代表了用于控制大多數真核生物包括人類中外來基因表達的進化保守的細胞防御機制。RNAi典型地由雙鏈RNA(dsRNA)觸發,并對dsRNA做出響應引起單鏈靶RNA同源物的序列特異性mRNA降解。mRNA降解的介導物是小干擾RNA雙鏈體(siRNA),其正常在細胞中通過酶切割長dsRNA而產生。siRNA通常長度約為21個核苷酸(例如長度為21-23個核苷酸),并具有特征為兩個核苷酸3’-突出的堿基配對結構。在將小的RNA或RNAi導入細胞后,據認為該序列被遞送到被稱為RISC(RNA誘導的沉默復合物)的酶復合物。RISC識別靶并使用內切核酸酶將其切開。應該注意的是,如果將較大的RNA序列遞送到細胞,RNase III酶(Dicer)將較長dsRNA轉變成21-23nt的ds siRNA片段。在某些實施方案中,RNAi寡核苷酸被設計成靶向融合蛋白的連接區域。、
化學合成的siRNA已經變成在培養的體細胞中對哺乳動物基因功能進行基因組廣度分析的有力試劑。除了用于驗證基因功能的價值之外,siRNA作為基因特異性治療劑也具有極大潛力(Tuschl 和 Borkhardt,Molecular Intervent. 2002 ;2(3) :158_67,在此引為參考)。將siRNA轉染到動物細胞中,引起特定基因的強有力、持久的轉錄后沉默(Caplen等,Proc Natl Acad Sci U. S. A. 2001 ;98 : 9742_7 ;Elbashir 等,Nature. 2001 ;411 :494_8 ;Elbashir 等,Genes Dev. 2001 ; 15 188-200 ;以及 Elbashir 等,EMBO J. 2001 ;20 :6877_88,其全部在此引為參考)。使用siRNA執行RNAi的方法和組合物描述在例如美國專利6,506, 559中,在此引為參考。siRNA格外有效地降低被被靶向的RNA的量,并波及蛋白質,經常降低到檢測不到的水平。沉默效應能夠持續幾個月,并且是格外特異性的,因為靶RNA與siRNA中心區域之間一個核苷酸的錯配往往足以阻止沉默(Brummelkamp等,Science 2002 ;296 550-3 ;以及Holen 等,Nucleic Acids Res. 2002 ;30 :1757_66,兩者在此引為參考)。在siRNA設計中的重要因素是存在可及的siRNA結合位點。Bahoia等(J. Biol.Chem. ,2003 ;278 :15991-15997 ;在此引為參考)描述了使用一種被稱為掃描陣列的DNA陣列來發現mRNA中用于設計有效siRNA的可及位點。這些陣列包含的寡核苷酸的尺寸范圍從單體到一定的最大值,通常為Comer,其使用物理屏障物(掩膜),通過逐步添加序列中的每個堿基來合成。因此該陣列代表了靶基因區域的全部寡核苷酸互補物。靶mRNA與這些陣列的雜交提供了窮舉的該靶mRNA區域的可及譜。這樣的數據可用于設計反義寡核苷酸(范圍從7聚體到25聚體),其中重要的是在寡核苷酸長度與結合親和性之間實現折衷,以保留效能和靶特異性(Sohail 等,Nucleic Acids Res. , 2001 ;29 (10) :2041_2045)。用于選擇 siRNA 的其他方法和考慮描述在例如 WO 05054270,W005038054AUW003070966A2, J MolBiol.2005 May13 ;348(4) :883_93、J Mol Biol. 2005 May 13 ;348(4) :871_81和 NucleicAcids Res. 2003 Aug I ;31(15) :4417_24中,其每個在此以其全文引為參考。此外,用于選擇siRNA的軟件(例如,MWG在線siMAX siRNA設計工具)是可商購或可公開獲得的。2.反義在其他實施方案中,使用與一種或多種編碼本發明的癌癥標志物的核酸特異性雜交的反義化合物來調節融合蛋白表達。寡聚化合物與其靶核酸的特異性雜交干擾了核酸的正常功能。這種通過與靶核酸特異性雜交的化合物對靶核酸功能的調節一般被稱為“反義”。被干擾的DNA功能包括復制和轉錄。被干擾的RNA的功能包括所有至關重要的功能,例如RNA向蛋白翻譯位點的易位、蛋白從RNA的翻譯、RNA的剪接以產生一種或多種mRNA物質、以及可能由RNA參與或促進的催化活性。這種對靶核酸功能的干擾的總體效應是調節本發明的癌癥標志物的表達。在本發明的文本中,“調節”是指基因表達的增加(刺激)或降低(抑制)。例如,可以抑制表達以潛在地阻止腫瘤增殖。本發明還包括下述包含本發明的反義化合物的藥物組合物和制劑。B.基因治療本發明預想了使用任何遺傳操作用于調節本發明的基因融合體的表達。遺傳操作的實例包括但不限于基因敲除(例如使用例如重組將融合基因從染色體上除去)、帶有或不帶誘導型啟動子的反義構建物的表達等。在體外或體內將核酸構建物遞送到細胞,可以使用任何適合的方法來進行。適合的方法是將核酸構建物導入細胞使得所需事件(例如反義構建物的表達)發生的方法。遺傳治療也可用于遞送siRNA或在體內表達(例如在被誘導型啟動子(例如雄激素響應性啟動子)刺激后)的其他干擾分子。將攜帶遺傳信息的分子導入細胞是通過各種方法中的任一種來實現的,所述方法包括但不限于直接注射裸DNA構建物、使用載有所述構建物的金粒子進行轟擊、以及使用例如脂質體、生物聚合物等進行的大分子介導的基因轉移。優選的方法使用源自于病毒的基因遞送載體,所述病毒包括但不限于腺病毒、反轉錄病毒、痘苗病毒和腺相關病毒。由于與反轉錄病毒相比具有更高的效率,源自于腺病毒的載體是用于將核酸分子轉移到體內宿主細胞中的優選基因遞送載體。已經顯示,腺病毒載體在動物模型的各種實體腫瘤中以及在免疫缺陷小鼠的人類實體腫瘤異種移植物中,提供了非常有效的體內基因轉移。用于基因轉移的腺病毒載體和方法的實例描述在PCT公開WO 00/12738和WO 00/09675以及美國專利申請 No. 6,033,908,6, 019,978,6, 001,557,5, 994,132,5, 994,128,5, 994,106、5981,225,5, 885,808,5, 872,154,5, 830,730 和 5,824,544 中,其每個在此以其全文引為參考。 載體可以用各種方式施用于對象。例如,在本發明的某些實施方案中,使用直接注射將載體施用到腫瘤或與腫瘤相關的組織中。在其他實施方案中,施用通過血液或淋巴循環進行(參見例如PCT公開99/02685,在此以其全文引為參考)。腺病毒載體的示例性劑量水平優選為向灌注液添加IO8至IO11個載體粒子。C.抗體治療在某些實施方案中,本發明提供了靶向表達本發明的基因融合體的前列腺腫瘤的抗體。在本文公開的治療方法中可以利用任何適合的抗體(例如單克隆、多克隆或合成的抗體)。在優選實施方案中,用于癌癥治療的抗體是人源化抗體。將抗體人源化的方法在本技術領域中是公知的(參見,例如美國專利No. 6,180, 370,5, 585,089,6, 054, 297和5,565,332,其每個在此引為參考)。在某些實施方案中,治療性抗體包含針對本發明的基因融合體產生的抗體,其中所述抗體與細胞毒性劑接合。在這樣的實施方案中,產生了不靶向正常細胞的腫瘤特異性治療劑,從而減少了傳統化療的許多有害副作用。對于某些應用來說,設想治療劑將是可用作連接抗體的有用藥劑的藥理學藥劑,特別是具有殺死或抑制內皮細胞生長或細胞分裂的能力的細胞毒性或其他抗細胞藥劑。本發明預想了使用任何能夠與抗體接合并以活性形式遞送的藥理學藥劑。示例性的抗細胞藥劑包括化療藥劑、放射性同位素和細胞毒素。本發明的治療性抗體可以包括各種細胞毒性部分,包括但不限于放射性同位素(例如碘-131、碘-123、锝-99m、銦-111、錸-188、錸-186、鎵-67、銅-67、釔-90、碘-125 或砹-211)、激素例如類固醇、抗代謝物例如胞嘧啶(例如阿拉伯糖苷、氟尿嘧啶、氨甲蝶呤或氨基喋呤;蒽環類;絲裂霉素C)、長春花生物堿(例如秋水仙胺、依托泊苷、光神霉素)以及抗腫瘤烷基化藥劑例如苯丁酸氮芥或美法侖。其他實施方案可以包括藥劑例如促凝劑、細胞因子、生長因子、細菌內毒素或細菌內毒素的脂A部分。例如,在某些實施方案中,治療藥劑可以包括植物、真菌或細菌來源的毒素,例如A鏈毒素、核糖體失活蛋白、α -帚曲菌素、曲霉菌素、局限曲菌素、核糖核酸酶、白喉毒素或假單胞菌外毒素,這僅僅是舉幾個例子。在某些優選實施方案中,使用去糖基化蓖麻毒蛋白A鏈。
在任何情況下,提出了例如這些的藥劑,如果需要可以使用已知的接合技術(參見例如Ghose等,Methods Enzymol. ,93 280[1983])與抗體成功接合,所述接合的方式將允許它們根據需要在被靶向的腫瘤細胞位點處定向、內化、釋放或呈遞給血液組分。例如,在某些實施方案中,本發明提供了靶向本發明的癌癥標志物(例如ERG或ETVl融合體)的免疫毒素。免疫毒素是特異性靶向藥劑、典型為腫瘤定向抗體或片段與細胞毒性藥劑例如毒素部分的接合物。靶向藥劑將毒素導向攜帶有被靶向抗原的細胞并因此選擇性殺死它們。在某些實施方案中,治療性抗體使用具有高體內穩定性的交聯劑(Thorpe等,Cancer Res. ,48 :6396 [1988])。
在其他實施方案中,特別是涉及實體腫瘤治療的實施方案中,抗體被設計成通過抑制血管內皮細胞的生長或細胞分裂而對腫瘤血管系統具有細胞毒性或其他抗細胞效應。這種攻擊旨在引起腫瘤局限性血管坍陷,剝奪腫瘤細胞、特別是血管系統遠端的腫瘤細胞的氧氣和營養物,最終引起細胞死亡和腫瘤壞死。在優選實施方案中,基于抗體的治療藥物被配制成如下所述的藥物組合物。在優選實施方案中,施用本發明的抗體組合物導致癌癥可測量的減少(例如腫瘤的減小或消除)。D.藥物組合物本發明還提供了藥物組合物(例如包含調節本發明的基因融合體的表達或活性的藥劑)。取決于需要的是局部還是全身治療并取決于待治療的區域,本發明的藥物組合物可以用多種方式給藥。給藥可以是局部(包括眼部和粘膜包括陰道和直腸遞送)、肺部(例如通過吸入或吹入粉末或氣溶膠,包括通過噴霧器;氣管內、鼻內、表皮和透皮)、口或腸胃外給藥。腸胃外給藥包括靜脈內、動脈內、皮下、腹膜內或肌肉內注射或灌注;或顱內例如鞘內的或腦室內給藥。用于局部給藥的藥物組合物和制劑可以包括透皮貼片、軟膏、洗劑、霜劑、凝膠、滴齊IJ、栓劑、噴劑、液體和粉劑。常規的藥物載體、水性、粉末或油性基料、增稠劑等,可能是需要或合乎需要的。用于口服給藥的組合物或制劑包括粉劑或顆粒劑、在水或非水性介質中的懸液或溶液、膠囊、袋劑或片劑。增稠劑、調味劑、稀釋劑、乳化劑、分散助劑或粘合劑可能是合乎需要的。用于腸胃外、鞘內或腦室內給藥的組合物和制劑可以包括無菌水性溶液,水溶液中還可以包含緩沖劑、稀釋劑和其他適合的添加劑,例如但不限于滲透增強劑、載體化合物和其他可藥用載體或賦形劑。本發明的藥物組合物包括但不限于溶液、乳液和含脂質體制劑。這些組合物可以從各種組分產生,所述組分包括但不限于預制液體、自乳化固體和自乳化半固體。可以方便地以單位劑型存在的本發明的藥物制劑,可以按照制藥工業中公知的常規技術來制備。這樣的技術包括將活性成分與藥物載體或賦形劑進行結合的步驟。一般來說,通過將活性成分與液體載體或細分的固體載體或兩者均勻充分地結合,然后如果需要對產品進行成形,來制備制劑。本發明的組合物可以配制成許多可能劑型中的任一種,所述劑型包括但不限于片齊U、膠囊、液體糖漿、軟凝膠、栓劑和灌腸劑。本發明的組合物也可以配制成在水性、非水性或混合介質中的懸液。水性懸液還可以含有增加懸液粘度的物質,包括例如羧甲基纖維素鈉、山梨糖醇和/或葡聚糖。懸液還可以含有穩定劑。在本發明的一個實施方案中,藥物組合物可以作為泡沫配制并使用。藥物泡沫包括的制劑例如但不限于乳液、微乳液、霜劑、膠凍和脂質體。盡管在性質上基本相似,但這些制劑在組分和終產物的稠度方面各不相同。在細胞水平上增強寡核苷酸攝取的藥劑也可以添加到本發明的藥物和其他組合物中。例如,陽離子脂類例如Iipofectin(美國專利No. 5,705, 188)、陽離子型甘油衍生物和聚陽離子分子例如聚賴氨酸(W097/30731),也增加寡核苷酸的細胞攝取。本發明的組合物可以另外含有其他在藥物組合物中常規發現的輔助組分。因此,例如,組合物可以含有附加的、相容的、有藥物活性的物質,例如止癢劑、收斂劑、局部麻醉劑或抗炎劑,或者可以含有其他對物理配制各種劑型的本發明組合物有用的材料,例如染 料、調味劑、防腐劑、抗氧化劑、乳濁劑、增稠劑和穩定劑。然而,這樣的材料在添加時,不應該過度地干擾本發明組合物的組分的生物活性。制劑可以被滅菌,并且如果需要,可以與不和制劑的核酸發生有害相互作用的輔助劑混合,所述輔助劑例如潤滑劑、防腐劑、穩定劑、潤濕劑、乳化劑、影響滲透壓的鹽類、緩沖劑、著色劑、調味劑和/或芳香物質等。本發明的某些實施方案提供了藥物組合物,其含有(a) —種或多種反義化合物,以及(b) —種或多種通過非反義機制起作用的其他化療藥劑。這樣的化療藥劑的實例包括但不限于抗癌藥物例如道諾紅菌素、更生霉素、阿霉素、博來霉素、絲裂霉素、氮芥子氣、苯丁酸氮芥、美法侖、環磷酰胺、6-巰基嘌呤、6-硫鳥嘌呤、阿糖胞苷(CA)、5_氟尿嘧啶(5-FU)、氟脫氧尿苷(5-FUdR)、氨甲蝶呤(MTX)、秋水仙素、長春新堿、長春堿、依托泊苷、替尼泊苷、順鉬和己烯雌酚(DES)。抗炎藥物包括但不限于非留族抗炎藥物和皮質類固醇,以及抗病毒藥物包括但不限于利巴韋林、阿糖腺苷、阿昔洛韋和更昔洛韋,也可以組合在本發明的組合物中。其他非反義化療藥劑也在本發明的范圍內。兩種或多種組合的化合物可以一起或相繼使用。劑量取決于待治療的疾病狀態的嚴重性和響應性,其中治療過程持續數日至數月,或直到實現治愈或獲得疾病狀態的消減。可以從患者體內藥物積累的測量值計算出最適的給藥安排。用藥的醫生可以容易地確定最適劑量、給藥方法和重復頻率。最適劑量可以隨著各寡核苷酸的相對效力而變,一般可以根據在體外和體內動物模型中發現有效的EC5tl或根據本文所述的實例進行估算。一般來說,劑量為每kg體重O. 01 μ g至100g,并且可以每日、每周、每月或每年給藥一次或多次。治療醫生可以根據測量的藥物在體液或組織中的停留時間和藥物濃度估算給藥的重復頻率。在成功治療后,可能希望使對象經歷維持治療以防止疾病狀態的復發,其中寡核苷酸以維持劑量給藥,其范圍從每kg體重O. 01 μ g至IOOg,每日一次或多次到每20年一次。VI.轉基因動物本發明預想了包含本發明的外源癌癥標志物基因(例如基因融合體)或其突變體和變體(例如截短或單核苷酸多態性)的轉基因動物的產生。在優選實施方案中,轉基因動物與野生型動物相比顯示出改變的表型(例如標志物增加或減少出現)。分析這些表型的存在或不存在的方法包括但不限于本文公開的方法。在一些優選實施方案中,轉基因動物還表現出腫瘤生長或癌癥依據的增加或減少。
本發明的轉基因動物可用于藥物(例如癌癥治療)篩選。在某些實施方案中,將測試化合物(例如懷疑可用于治療癌癥的藥物)和對照化合物(例如安慰劑)施用于轉基因動物和對照動物,并對效果進行評估。
轉基因動物可以通過各種方法產生。在某些實施方案中,使用處于各種發育階段的胚胎細胞來導入轉基因,用于產生轉基因動物。根據胚胎細胞的發育階段使用不同的方法。合子是用于微注射的最好的靶。在小鼠中,雄原核達到直徑約20微米的大小,允許重復地注射1-2皮升(pi)的DNA溶液。使用合子作為基因轉移的靶的主要優點在于,在大多數情況下被注射的DNA將在第一次卵裂前摻入到宿主基因組中(Brinster等,Proc. Natl.Acad. Sci. USA 82 =4438-4442 [1985]) 0結果,轉基因非人類動物的所有細胞將帶有摻入的轉基因。這一般也將反映在轉基因向建立者后代的有效傳遞中,因為50%的生殖細胞將帶有轉基因。美國專利No. 4,873,191描述了用于合子微注射的方法;該專利的公開內容在此以其全文引為參考。在其他實施方案中,使用反轉錄病毒感染將轉基因導入非人類動物。在某些實施方案中,通過將反轉錄病毒載體注入卵母細胞的卵周空間,利用反轉錄病毒載體轉染卵母細胞(美國專利No. 6,080,912,在此引為參考)。在其他實施方案中,可以將發育中的非人類胚胎在體外培養到囊胚階段。在此期間,卵裂球可以作為反轉錄病毒感染的靶(Janenich, Proc. Natl. Acad. Sci. USA 73 :1260 [1976])。卵裂球的有效感染可以通過酶處理以除去透明帶來獲得(Hogan等,《小鼠胚胎操作》(Manipulating the Mouse Embryo),Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N. Y. [1986])。用于導入轉基因的病毒載體系統典型為帶有轉基因的復制缺陷型反轉錄病毒(Jahner等,Proc. Natl.Acad Sci. USA 82 :6927[1985])。通過將卵裂球在單層病毒產生細胞上培養,可以容易有效地獲得轉染(Stewart等,EMBO J.,6 :383[1987])。或者,感染可以在更晚的階段執行。可以將病毒或病毒產生細胞注射到囊胚腔中(Jahner等,Nature 298 :623 [1982])。大多數建立者對于轉基因是嵌合的,因為摻入只發生在形成轉基因動物的一部分細胞中。此外,建立者可能在基因組的不同位置處包含轉基因的各種反轉錄病毒插入片段,其在后代中一般將分離。此外,還可能通過妊娠中期胚胎的子宮內反轉錄病毒感染將轉基因導入生殖系,盡管效率較低(Jahner等,同上[1982])。本技術領域已知的使用反轉錄病毒或反轉錄病毒載體產生轉基因動物的其他手段,包括將反轉錄病毒粒子或絲裂霉素C處理的反轉錄病毒產生細胞微注射到受精卵的卵周空間或早期胚胎中(PCT國際申請WO 90/08832[1990],以及Haskell 和 Bowen, Mol.Reprod. Dev. ,40 386[1995])。在其他實施方案中,將轉基因導入胚胎干細胞中,并使用轉染的干細胞形成胚胎。ES細胞通過將預先植入的胚胎在適合的條件下體外培養來獲得(Evans等,Nature 292 154 [1981] ;Bradley 等,Nature 309 255 [1984] ;Gossler 等,Proc. Acad. Sci. USA 83:9065[1986];和Robertson等,Nature 322 :445[1986])。轉基因可以通過利用本技術領域已知的各種方法進行DNA轉染而有效地導入ES細胞,所述方法包括磷酸鈣共沉淀、原生質體或原生質球融合、脂轉染和DEAE-葡聚糖介導的轉染。轉基因也可以通過反轉錄病毒介導的轉導或通過微注射導入到ES細胞中。然后,這些轉染的ES細胞在導入到囊胚階段胚胎的囊胚腔中之后定植于胚胎,并促成所產生嵌合動物的生殖系(綜述參見Jaenisch,Science 240 :1468[1988])。在將轉染的ES細胞導入囊胚腔之前,可以對轉染的ES細胞實施各種選擇方案以富集整合了轉基因的ES細胞,假如轉基因提供這種選擇手段的話。或者,可以使用聚合酶鏈反應篩選整合了轉基因的ES細胞。這種技術避免了需要將轉染的ES細胞在轉入囊胚腔之前在適合的選擇條件下生長。在其他實施方案中,使用同源重組來敲除基因功能或產生缺失突變體(例如截短突變體)。同源重組的方法描述在美國專利No. 5,614,396中,在此引為參考。實驗提供了下面的實施例以便對本發明的某些優選實施方案和方面進行演示和進一步說明,這些實施例不應被解釋為對本發明范圍的限制。實施例I 本實施例描述了用于實施例2的材料和方法。樣本和細胞系良性永生化前列腺細胞系RWPE和前列腺癌細胞系LNCaP從美國典型培養物保藏中心(American Type Culture Collection)獲得。初級良性前列腺上皮細胞(PrEC)從Cambrex Bio Science獲得。VCaP從患有激素抗拒性轉移性前列腺癌的患者的脊椎轉移腫瘤產生(Korenchuk 等,In Vivo (Athens, Greece) 15,163-8 (2001))。雄激素刺激實驗使用LNCaP和VCaP細胞進行,將細胞在含有活性炭處理過的血清的培養基中生長24小時,然后用1%乙醇或溶解在乙醇中的InM美曲勃龍(R1881,NEN LifeScience Products)處理24和48小時。使用RNeasy小型試劑盒(Qiagen)按照制造商的說明書分離總RNA。前列腺組織從密歇根大學(University of Michigan)的根治性前列腺切除術系列和密歇根大學前列腺癌杰出研究專項(Specialized Program of Research Excellence)組織核心的快速尸檢計劃(Rapid Autopsy Program) (Rubin 等,Clin. Cancer Res. 6 1038 [2000])獲得。454FLX 測序使用Dynabeads mRNA純化試劑盒(Dynal Biotech, Oslo,挪威),按照制造商的說明書,利用在含有oligo-dT的順磁性珠子上進行的兩輪篩選,從50 μ g總RNA純化了 PolyA+RNA。將 200ng mRNA 在 82°C 下,在片段化緩沖液(40mM Tris-乙酸,IOOmM 乙酸鉀,31. 5mM乙酸鎂,pH 8.1)中片段化2分鐘。第一鏈cDNA文庫使用SuperscriptII (Invitrogen)按照標準方案制備,并將定向接頭連接到cDNA末端,用于克隆擴增和在基因組測序儀FLX上測序。如下所示,5'-末端接頭A具有5個核苷酸的5’突出,3’-末端接頭B具有6個隨機核苷酸的突出5,-NANNACTGATGGCGCGAGGGAGGC-3,(SEQ ID NO 1)GACTACCGCGCTCCCTCCG-5’ (SEQ ID NO 2)5,-生物素-GCCTTGCCAGCCCGCTCAGNNNNNN-P-3’ (SEQ ID NO 3)3,-CGGAACGGTCGGGCGAGTC(SEQ ID NO 4)接頭連接反應在含有I. 67 μ M接頭A、6. 67 μ M接頭B和2000單位T4DNA連接酶(New England Biolabs, Ipswich, MA)的 Quick 連接酶緩沖液(New England Biolabs,Ipswich, MA)中,在37 °C下進行2小時。帶有接頭的文庫使用(λ 05 % Sera_Mag30鏈親和素珠子(Seradyn Inc, Indianapolis, IN)按照制造商的說明書回收。最后,使用RNAClean(Agencourt, Beverly, MA)按照制造商的說明書將sscDNA文庫純化兩次,不同之處在于將珠子的量減少到樣本體積的I. 6X。將純化的sscDNA文庫在2100生物分析儀(Agilent Technologies, Santa Clara, CA)上的 RNA 6000 Pico 芯片上進行分析,以證實尺寸分布在450至750個核苷酸之間,并使用Quant-iT Ribogreen RNA測定試劑盒(Invitrogen Corporation, Carlsbad, CA)在 Synergy HT(Bio-Tek Instruments Inc,Winooski,VT)儀器上按照制造商的說明書進行定量。使用2μΜ每種引物A(5' -GCCTCCCTC GCG CCA-3' ;SEQ ID NO :5)和引物 B (5' -GCCTTG CCA GCC CGC-3' ;SEQ ID NO:6) >400 μ M dNTP、lX Advantage〗緩沖液和 I μ I Advantage 2 聚合酶混合物(Clontech,Mountain View, CA)對文庫進行PCR擴增。擴增反應在下述條件下進行96°C 4分鐘;940C 30 #,640C 30秒,將步驟2和3重復總共20個循環,然后68°C 3分鐘。使用AMPure珠子純化樣本,并稀釋到每μ I 200,000個分子的最終工作濃度。用于測序的乳液珠子使用測序emPCR試劑盒II和試劑盒III產生,并使用600,000個珠子進行測序。通過差減進行歸一化將來自前列腺癌細胞系VCaP的mRNA與固定化在磁珠(Dynabeads, Invitrogen)上的差減細胞系(substractor cell line) LNCaP的第一鏈cDNA,按照制造商的說明書進行雜交。捕獲兩種細胞共有的轉錄物并通過磁性分離珠子結合的差減cDNA將其除去,通過沉淀來回收上清液中留下的差減過的VCaP mRNA,將其按照描述用于產生測序文庫。通過差減之前和之后樣本中選定轉錄物水平的qRT-PCR測定來評估歸一化的效率。Illumina基因組分析儀測序 將200ng mRNA在片段化緩沖液(Ambion)中在70 °C下片段化5分鐘,并使用Superscript III (Invitrogen)轉變成第一鏈cDNA,然后使用大腸桿菌DNA polI (Invitrogen)進行第二鏈cDNA合成。將雙鏈cDNA文庫通過Illumina基因組DNA樣本制備試劑盒進一步處理;處理包含使用T4DNA聚合酶、Klenow DNA聚合酶和T4多核苷酸激酶進行末端修復,然后使用Klenow 3’至5’外切聚合酶添加單個<A>堿基,并使用T4DNA連接酶與Illumina的接頭寡核苷酸混合物連接。將連接有接頭的文庫通過在4%瓊 脂糖凝膠上分離進行大小選擇,并切下200bp(+/-25bp)處的文庫條帶。通過Phu聚合酶(Stratagene)對文庫進行PCR擴增,并通過Qiaquick PCR純化試劑盒(Qiagen)進行純化。將文庫用 Quant-iTPicogreen dsDNA測定試劑盒(Invitrogen Corporation, Carlsbad, CA)在Modulus 單管照度計(Turner Biosystems, Sunnyvale, CA)上按照制造商的說明書進行定量。使用IOnM文庫制備流動池,每道具有約30,000個簇。序列數據集人類基因組18版(hgl8)被用作參比基因組。所有UCSC和Refseq轉錄物從UCSC基因組瀏覽器下載(Karolchik等,Nucleic Acids Res. 32 :D493[2004])。以前鑒定的TMPRSS2-ERGa 融合轉錄物(Genbank 登記號DQ204772)和 BCR-ABLl 融合轉錄物(Genbank登記號M30829)的序列被用作參比。短讀段嵌合體發現與人類基因組、Refseq基因、線粒體、核糖基或污染序列不完全配準的短讀段被分類為未定位。對于許多嵌合體來說,預期將存在定位于融合配偶體的較大部分(主要配準序列)和與第二配偶體配準的較小部分(次要配準序列)。因此,將方法分成兩個階段,其集中于首先鑒定主要配準序列,然后執行更詳盡的方法以鑒定次要配準序列。在第一階段,使用一種圖案匹配程序 Vmatch (Abouelhoda 等,J. Discrete Algorithsms I 53 [2004]),將所有未定位的讀段針對Refseq基因的所有外顯子配準。只保留與外顯子邊界具有12個以上核苷酸配準的讀段作為潛在的嵌合體。在第二階段中,然后使用利用規則表達來檢測少至6個核苷酸的配準的Perl腳本,將剩余讀段的未定位部分作圖于所有可能的外顯子邊界。只有與兩個分離基因的外顯子邊界顯示出部分配準的那些短讀段被分類為嵌合體。嵌合體可能具有與基因X配準的28個核苷酸以及與基因I和z配準的8個核苷酸,因為8聚體不能提供足夠的序列分辨力以區分基因y和基因z。因此,這將被分類為兩種單獨的嵌合體。如果序列形成了超過5個嵌合體,它將被拋棄,因為它不明確。為了將假陽性降到最低,預測的基因融合事件需要具有至少兩個支持性嵌合體。長和短讀段整合嵌合體發現使用BLAT,一種快速mRNA/DNA 比對工具(Kent,Gen. Res. 12 :656 [2002])),將所有454個讀段針對人類Refseq集合進行比對。使用Perl腳本分析BLAT輸出文件以檢測潛在的嵌合讀段。如果讀段與已知Refseq轉錄物顯示出超過90%的配準,將其分類為完全配準。當它們幾乎完全配準并因此沒有嵌合體的特征時,它們被舍棄。從剩余的讀段中,希望查詢與代表推測嵌合體的兩個Refseq轉錄物具有部分配準并具有最小交疊的讀段。為了實現這一點,對于推測的嵌合體重復所有可能的BLAT比對,僅提取出具有不超過6個核苷酸或兩個密碼子交疊的部分配準序列。該步驟降低了由重復區、大基因家族和保守結構域導入的假陽性嵌合體。此外,盡管該方法耐受部分配準序列之間的交疊,但它過濾掉在部分配準序列之間具有超過10個以上核苷酸的交疊。從Illumina平臺產生的短讀段(36個核苷酸),通過使用一種用于短讀段的比對工具Eland將它們針對Refseq數據庫和人類基因組進行比對來分析。除去完全配準或不能進行質量控制的讀段,只留下“未定位”的讀段這種用于嵌合體的豐富來源。然后使用Vmatch20,一種圖案匹配程序,將這些未定位的短讀段針對所有推測的長讀段嵌合體(如上所述獲得的)進行比對。使用Perl腳本分析Vmatch輸出結果,以便僅僅提取出跨越融合體邊界每一側上至少三個核苷酸的讀段。進行該整合后,將剩余的推測嵌合體根據部分配準序列是位于不同還是同一染色體上,分別分類成染色體間或染色體內嵌合體。與相鄰基因具有部分配準序列的那些染色體內嵌合體,據認為是通過基因間剪接而連接的相鄰基因的共轉錄(CoTIS)的產物(Communi等,J. Biol. Chem. 276 16561 [2001]),也被稱為通讀體。剩余的染色體內和所有染色體間嵌合體被當作候選基因融合體。假陽性嵌合體的另一個來源可以是Refseq中沒有的未知轉錄物。由于它不存在于Refseq數據庫中,因此相應的長讀段將不能顯示出完全配準,而是顯示出部分命中。結果,跨越該轉錄物的短讀段將自然驗證人為產生的融合體邊界。因此,為了去除這些候選物,使用BLAT將所有嵌合體針對人類基因組進行比對。如果長讀段與一個基因組位置具有超過90%的配準,它被當作新的轉錄物而不是嵌合讀段。對于剩余的嵌合體進行打分,所述分值通過將跨越融合體邊界的長讀段覆蓋度乘以跨越融合體邊界的短讀段覆蓋度而計算。覆蓋度分析從通過過濾的、經ELAND定位于外顯子的讀段的總數計算每個基因座的轉錄物覆 蓋度。將這些讀段的總數乘以讀段長度,并除以通過UCSC已知基因表(2006年3月匯編)中定義的所有外顯子長度的總和所確定的基因的最長轉錄物同種型。通過根據來自所有可能UCSC轉錄物同種型的非冗余外顯子組內每個核苷酸位置處的ELAND定位而列出全部讀段,來確定核苷酸覆蓋度。陣列CGH分析 寡核苷酸比較性基因組雜交是用于在全基因組水平上檢測不平衡拷貝數變化的高分辨率方法。差異標記的腫瘤和參比DNA與以陣列格式印刷的寡核苷酸(AgilentTechnologies, USA)的競爭性雜交以及每種探針的熒光強度分析,將檢測腫瘤樣本中的拷貝數相對于正常參比基因組中的變化。對于涉及超過一個代表每個基因組間隔的探針的獲得或丟失來說,按照通過CGH分析算法中的畸變檢測方法(ADM)進行檢測,拷貝數水平發生至少一個拷貝(對數比±0.5)變化的區域,鑒定到基因組斷點。實時PCR驗證使用Power SYBR Green Mastermix(Applied Biosystems, Foster City,CA),在 Applied Biosystems Step One Plus 實時 PCR 系統上按照描述(Tomlins 等,Nature 448 :595[2007])進行定量 PCR(QPCR)。所有寡核苷酸引物由 Integrated DNATechnologies (Coralville, IA)合成。所有測定執行兩份或三份平行樣,并將結果按照相對于GAPDH的平均倍數變化作圖。對SLC45A3-ELK4的定量PCR通過Taqman測定方法,使用融合體特異性引物和人類通用探針文庫(UPL)的7號探針(Roche)作為內部寡核苷酸,按照制造商的說明書執行。使用PGKl作為持家對照基因,按照制造商的說明書進行基于UPL的Taqman測定方法(Roche)。HMBS(Applied Biosystems,Taqman assay Hs00609297_ml)用作持家基因對照,按照標準規程(Applied Biosystems)用于Taqman測定。熒光原位雜交(FISH)FISH雜交在VCaP、LNCaP和FFPE腫瘤和正常組織上進行。從UCSC基因組瀏覽器選擇BAC克隆。在集落純化后,使用QiagenTips-IOO (Qiagen,USA)制備中量制備DNA。通過切口平移標記將DNA用生物素-16-dUTP和地高辛-11-dUTP (Roche, USA)標記。將探針DNA沉淀并溶解在含有50%甲酰胺、2XSSC、10%硫酸葡聚糖和1% Denhardts溶液的雜交混合物中。將約200ng標記的探針與正常人類染色體雜交,以驗證每個BAC克隆的定位位置。使用抗地高辛-熒光素和alexa fluor594接合物獲得分別為綠色和紅色的FISH信號。使用由ISIS圖像處理軟件(Metasystems,德國)控制的高分辨率CXD相機捕獲熒光圖像。Affymetrix基因組廣度人類SNP陣列6. O將I μ g每種基因組DNA樣本送往Affymetrix服務中心(分子醫學中心(Centerfor Molecular Medicine),Grand Rapid,MI 和 Vanderbilt Affymetrix Genotyping Core,Nashville,TN),用于在基因組廣度人類SNP陣列6. O上對15個樣本進行基因組水平分析。拷貝數分析使用Affymetrix基因分型控制臺軟件進行,并通過基因分型控制臺(GTC)瀏覽器產生可視化。實施例2作為在本發明過程中進行的實驗概念的驗證,進行了帶有經典基因融合體BCR-ABLl的慢性髓性白血病細胞系K562 (Shtivelman等,Nature 315 550[1985])的全轉錄組測序。使用Illumina基因組分析儀,產生了長度為36個核苷酸的66. 9百萬個讀段,并篩選與來自兩個不同基因的外顯子邊界部分配準的讀段的存在。盡管這種方法能夠檢測BCR-ABL1,但它僅僅是一組111個其他嵌合體(具有至少兩個讀段)中的一個。因此,在從頭發現方式中,在其他推測的嵌合體背景中鑒別BCR-ABLl融合體是困難的。然而,當使用BCR-ABLl (Genbank No. M30829)的已知融合體連接處作為參比序列時,檢測到19個嵌合讀段(圖I)。因此,使用了整合方法進行嵌合體檢測,利用短讀段測序技術獲得深部序列數據并使用長讀段技術(Roche 454測序平臺)提供參比序列用于定位候選融合基因。
轉錄組測序中的因素是是否能夠在高豐度持家基因的背景中檢測嵌合轉錄物(即是否需要cDNA歸一化)。為了闡明這一點,將來自具有基因融合體TMPRSS2-ERG的前列腺癌細胞系VCaP的歸一化和未歸一化cDNA文庫的序列進行比較(表I)。總的來說,歸一化的文庫顯示出被提名的嵌合體總數減少約3. 6倍。此外,盡管預期歸一化的文庫將富含TMPRSS2-ERG基因融合體,但它不能揭示出任何TMPRSS2-ERG嵌合體,表明歸一化在這些分析中不提供益處。為了評估使用大規模平行轉錄組測序鑒定新基因融合體的可行性,從前列腺癌細胞系VCaP和LNCaP以及良性永生化前列腺細胞系RWPE產生了非歸一化的cDNA文庫。作為第一步,使用 Roche 454 平臺,產生了總共 551,912 個 VCaP、244, 984 個 LNCaP 和 826,624個RWPE轉錄組序列讀段,平均為229. 4個核苷酸。它們被分類為與人類參比數據庫完全配準、部分配準或未定位(圖2)。與兩個基因顯示出部分配準的序列讀段被提名為首先通過的候選嵌合體。這產生了 428個VCaP、247個LNCaP和83個RWPE候選物。無可否認地,許多這些嵌合序列可能是反式剪接(Takahara等,Mol. Cell 18:245[2005])或通過基因間剪接連接的相鄰基因的共轉錄(Communi等,J. Biol Chem. 276 16561 [2001])、或單純是測序方案的人為現象的結果。在428個VCaP候選物中,使用長讀段測序平臺,只有一個讀段跨越TMPRSS2-ERG融合體連接處(表2)。接下來,使用Illumina基因組分析儀從VCaP、LNCaP和RWPEcDNA文庫獲得了超過5千萬個短轉錄組序列讀段(表3)。最初致力于VCaP細胞,鑒定到了 TMPRSS2-ERG融合體作為57個候選物之一,許多這些候選物可能是假陽性。為了克服假陽性、在長讀段中缺少深度以及部分配準短讀段難以定位的問題,考慮將長和短讀段序列數據整合在一起。在該策略之后,發現了來自于VCaP轉錄組序列的跨越TMPRSS2-ERG連接處的單個長讀段嵌合序列,其由21個短讀段支撐(圖2)并作為總共僅僅8個提名的嵌合體之一存在。因此,使用整合方法,降低了假候選物的總數,并且實驗驗證過的候選物的比例急劇增加(圖3)。將整合分析擴展到LNCaP和RWPE序列,提供了總共15個嵌合轉錄物,其中10個可以經實驗驗證(表4)。為了確保整合策略只過濾掉假陽性而不是有效嵌合體,對在整合后被消除的一組16個長讀段嵌合體候選物進行了測試。它們中沒有一個被qRT-PCR證實是融合轉錄物(圖 4)。為了系統地影響由兩個測序平臺提供的集合覆蓋度并對候選物排序,制定了評分功能。通過將來自于任一種方法的嵌合讀段的數量相乘而獲得分值(表4)。此外,根據這些嵌合體在相同或不同染色體上的位置,將它們分別分類成染色體內或染色體間。后者表示真正的基因融合體,與不相鄰轉錄物配準的染色體內嵌合體也是如此;相鄰基因之間的染色體內嵌合體被分類為(通讀體)。TMPRSS2-ERG是排序靠前的基因融合體序列,僅次于通讀嵌合體ZNF577-ZNF649。
除了 TMPRSS2-ERG之外,在VCaP中還鑒定到了幾個新的基因融合體。一個這樣的融合體位于USPlO的外顯子I與ZDHHC7的外顯子3之間,這兩個基因以相反方向位于16號染色體上,間隔約200kb(圖5)。此外,鑒定到了涉及2號染色體上的基因HJURP的兩個不同的融合體。EIF4E2的外顯子2與HJURP的外顯子8之間的融合產生了融合轉錄物EIF4E2-HJURP,HJURP的外顯子9與INPP4A的外顯子25之間的融合產生了HJURP-INPP4A (圖 5、圖 6)。對VCaP中的這種意料之外和復雜的涉及HJURP的染色體內重排進行了進一步研究HJURP的外顯子8和9兩者與不同基因融合這一事實指明了內含子內存在斷點(圖5)。在VCaP和VCaP-Met中通過qRT-PCR驗證了這兩個基因融合體,并發現它們在其他測試樣本中不存在。該復雜的染色體內重排也通過FISH分析得到證實。已經顯示,HJURP與癌細胞中的基因組不穩定性和永生性相關(Kato等,Cancer Res. 67 :8544 [2007]),而INPP4A編碼參與磷脂酰肌醇信號傳導途徑的一種酶,并且EIF4E2是真核翻譯起始因子(Greenman等,Nature 446 :153 [2007])。有趣的是,基于全轉錄組測序,排序最高的LNCaP基因融合體位于14號染色體上MIPOLl的外顯子11與7號染色體上DGKB的最后一個外顯子之間,通過qRT-PCR和FISH得到證實(圖7、圖8)。最近證實,致癌ETS轉錄因子家族的一個成員ETVl的過表達,在LNCaP細胞的腫瘤發展中發揮作用。盡管了解機制對于實踐本發明來說不是必需的,并且盡管本發明不限于任何具體作用機制,但ETVl過表達的機制被歸因于包含ETVl基因的約280Kb片段隱蔽插入到MIPOLl的內含子區中。因此,盡管以前的研究表明ETVl被重排而沒有ETVl融合轉錄物的證據,但本文中顯示了 MIPOLl與DGKB的替代融合體產生的證據,其看來指示了 ETVl染色體畸變。除了基因融合體之外,在相鄰基因之間鑒定到幾個轉錄物嵌合體,被稱為通讀事件。總體來說,通讀事件看來跨惡性和良性樣本兩者更廣泛表達,而基因融合體是癌細胞特異性的(圖9)。例如,LNCaP細胞中C19orf25的外顯子2與相鄰基因APC2的內含子之間的嵌合體(圖9)。實驗驗證證實了 C19orf25-APC2(內含子)的表達水平比在基因融合體上觀察到的低,并且在多種細胞系中弱表達,表明它們的表達更加廣泛。對WDR55-DND1 (圖9)、MBTPS2-YY2 (圖9)和ZNF649-ZNF577 (圖9)來說觀察到了相似圖式。 許多研究利用基因組信息挖掘基因融合體候選物(Campbe 11等,NatureGenet. 40 722[2008] ;Bashir 等,PLoS Comput. Biol. 4 :el000051 [2008])。因此,理想的是確定轉錄組數據是否檢測到不能從基因組DNA分析顯示出的嵌合體。為此,將匹配樣本的陣列比較性基因組雜交得到的不平衡的基因組拷貝數變化數據整合,并監測基因融合體候選物內的基因組畸變。這揭示了在兩個基因融合體候選物USP10-ZDHHC7和我MIP0L1-DGKB中包含的基因中的斷點(表4)。更具體來說,VCaP細胞以及產生VCaP的親代轉移前列腺癌組織(VCaP-Met)中觀察到了跨越USP10-ZDHHC7之間的區域的純合缺失,但是在正常前列腺細胞系RWPE中沒有觀察到(圖19)。盡管了解機制對于實踐本發明來說不是必需的,并且盡管本發明不限于任何具體作用機制,但合在一起,這表明與復雜重排相伴的缺失可能已經導致USP10-ZDHHC7融合。基于qRT-PCR的評估證實了該融合對于VCaP及其親代組 織VCaP-Met來說是特異的,并且不存在于LNCaP、RWPE、PREC或轉移前列腺癌組織(Met 2)中(圖5)。在LNCaP細胞中,對于MIP0L1-DGKB融合體來說,只在DGKB中而沒有在MIPOLl中發現斷點。此外,在檢查的所有其他融合嵌合體中不存在斷點,表明通過測序鑒定到的大部分融合基因候選物將不能通過挖掘基因組拷貝數畸變數據來發現。此外,盡管只有一部分基因組重排潛在地代表功能性基因融合體,但大多數嵌合轉錄物表明是生產性融合體,在發現它們的細胞的生物學中可能具有功能。接下來,將該方法擴展到呈現出惡性細胞經常與良性上皮、基質、淋巴細胞和血管細胞混合在一起的腫瘤樣本。轉錄組測序使用兩種TMPRSS2-ERG基因融合體陽性的轉移前列腺癌組織VCaP-Met (VCaP細胞系從其衍生)和Met 3以及一種ERG陰性的轉移前列腺組織Met 4來進行。除了在VCaP-Met和Met 3組織中檢測到的TMPRSS2-ERG融合序列之外,還鑒定到三個新的基因融合體(圖10)。一個來自Met 3的嵌合轉錄物包含STRN4的外顯子9與GPSN2的外顯子2 (圖10)。GPSN2屬于類固醇5- α還原酶家族,該酶將睪酮轉化成二氫睪酮(DHT),其是在前列腺組織中介導雄激素響應的關鍵激素。已知DHT在前列腺癌中高表達并且是治療靶點。DHT與其合成類似物R1881相似,已被顯示誘導TMPRSS2-ERG表達以及PSA2。此外,發現在VCaP-Met (以及VCaP細胞)中RC3H2的外顯子10與RGS3的外顯子20融合(圖10)。另一個新的基因融合體在LMAN2的外顯子I與AP3S1的外顯子2 之間(圖10)。轉移性前列腺癌Met 4和LNCaP細胞系中鑒定到位于SLC45A3的第四個外顯子與ETS轉錄因子家族的成員ELK4的外顯子2之間的一個表明復現性的通讀嵌合體SLC45A3-ELK4(圖11)。在一組細胞系中執行的對該融合體的Taqman qRT-PCR測定顯示出在LNCaP細胞中的高水平表達,以及在其他前列腺癌細胞系包括22Rvl、VCaP和MDA-PCA-2B中的低得多的水平。良性前列腺上皮細胞PREC和RWPE以及非前列腺細胞系包括乳腺、黑素瘤、肺、CML和胰腺癌細胞系對該融合體陰性(圖11)。較早時已經報道,在前列腺癌樣本3中SLC45A3與ETVl融合,并且值得注意的是,它是前列腺特異性、雄激素響應性基因。也發現融合轉錄物SLC45A3-ELK4被合成的雄激素R1881所誘導(圖11)。此外在一組前列腺組織中查詢該融合體,并發現它在20個被檢查的轉移性前列腺癌組織的7個中表達(圖11)。在以前的工作中,基于FISH篩查,已將這7個陽性例中的6個鑒定為對ETS基因ERG、ETV1、ETV4 和 ETV5 陰性(Han 等,Cancer Res. 68 :7629 [2008])。一個 TMPRSS2-ETV1 陽性的轉移性前列腺癌樣本也被發現對SLC45A3-ELK4陽性(與LNCaP類似,其也是ETVl陽性的(Tomlins等,Nature448 :595 [2007]))。與以前鑒定到的ETS基因融合體不同,SLC45A3-ELK4是相鄰基因之間的通讀事件,在DNA水平上不具有可以通過FISH (圖12)、陣列CGH (數據未顯示)或高密度SNP陣列(圖13)檢測到的變化。因為LNCaP和Met 4帶有ETVl的基因組畸變并表達高水平的SLC45A3-ELK4嵌合轉錄物,這表明ETVl和ELK4可以在那些腫瘤中協同驅動前列腺癌發生。盡管了解機制對于實踐本發明來說不是必需的,并且盡管本發明不限于任何具體作用機制,但SLC45A3-ELK4可能代表了對不具有可檢測的DNA畸變的癌癥有特異性的復現性RNA嵌合轉錄物的第一個描述。總的來說,SLC45A3-ELK4看來是在轉錄組測序研究中鑒定到的唯一復現性嵌合轉錄物,因為在一組前列腺癌樣本中測試的其他基因融合體看來受限于用來鑒定它們的樣本(至少在所分析的有限數量的樣本中),因此可能代表稀有或個體性突變(圖14)。接下來,對本研究中鑒定到的新的基因融合體進行測試,以確定它們代表獲得性體細胞突變還是簡單的種系變異。基于在患者匹配的種系組織上對一組代表性融合基因進行的qPCR(圖15)和FISH(圖16、圖17)評估,發現嵌合體局限于癌組織。此外,對于新的基因融合體中所涉及的29個基因,在基因組變體數據庫中進行了查詢。發現它們中只有8個具有以前報道的拷貝數變異(CNV)(表5),但是匹配的aCGH數據在那些基因中沒有顯示出任何拷貝數變異(表6),表明所分析的樣本不具有人類群體共有的CNV。基于所表征的基因融合體(表7),提出了嵌合體分類系統(圖11)。染色體間易位(I類)包含不同染色體上的兩個基因之間的融合(例如BCR ABL1) ο染色體間復雜重排(II類),其中來自不同染色體的兩個基因融合在一起,而第三個基因跟隨在一起并變得活化(MIP0L1-DGKB)。染色體內缺失(III類)在基因組區域的缺失使兩翼基因融合時(TMPRSS2-ERG)產生。染色體內復雜重排(IV類)涉及一個基因中的斷點與多個區域融合(HJURP-EIF4E2和INPP4-HJURP),以及通讀嵌合體(V類)包含相鄰基因之間的嵌合轉錄物(ZNF649-ZNF577)。LNCaP細胞中排名第一的基因融合體包含MIP0L1-DGKB融合體。該基因融合體可能代表ETVl隱蔽重排的預兆,這是LNCaP前列腺癌細胞系中推測的驅動性突變。此外,已觀察到LNCaP細胞帶有多個融合體,與VCaP中的觀察相似。一個驗證過的實例是來自6號染色體的MRPSlO的外顯子7與16號染色體的HPR的外顯子7之間的融合(圖18)。MRPSIO-HPR 在 LNCaP 中通過 FISH 證實并通過 qRT-PCR 驗證,但是在 VCaP、VCaP-Met、RWPE、PREC或Met 2中沒有觀察到(圖18)。表I.歸一化和未歸一化VCaP 454文庫的概述
權利要求
1.一種用于鑒定患者的前列腺癌的方法,所述方法包含 (a)提供來自患者的樣本,所述樣本可含有前列腺來源的核酸;以及 (b)檢測樣本中具有來自SLC45A3基因的轉錄調控區的5’部分和來自ELK4基因的3’部分的基因融合體的存在或不存在, 其中在樣本中檢測到所述基因融合體的存在鑒定患者的前列腺癌。
2.權利要求I的方法,其中SLC45A3基因的轉錄調控區包含SLC45A3基因的啟動子區。
3.權利要求I的方法,其中步驟(b)包含檢測具有從SLC45A3基因的轉錄調控區轉錄的5’ RNA部分和從ELK4基因轉錄的3’ RNA部分的嵌合mRNA轉錄物。
4.權利要求I的方法,其中所述基因融合體是通讀轉錄物。
5.權利要求I的方法,其中樣本選自組織、血液、血漿、血清、尿液、尿液上清液、尿液細胞沉淀、精液、前列腺分泌物和前列腺細胞。
6.權利要求I的方法,其還包含檢測具有來自雄激素調控基因或持家基因的轉錄調控區的5’部分和來自ETS家族成員基因的3’部分的基因融合體的存在或不存在的步驟。
7.一種用于鑒定患者的前列腺癌的方法,所述方法包含 (a)提供來自患者的樣本,所述樣本可含有前列腺來源的核酸;以及 (b)檢測樣本中選自下列的基因融合體的存在或不存在USP10:ZDHHC7、EIF4E2:HJURP,HJURP:INPP4A、STRN4:GPSN2、RC3H2:RGS3、LMAN2:AP3S1、ZNF649-ZNF577 和MIPOLl:DGKB, 其中在樣本中檢測到所述基因融合體的存在鑒定患者的前列腺癌。
8.權利要求7的方法,其中步驟(b)包含檢測基因組DNA的染色體重排。
9.權利要求7的方法,其中步驟(b)包含檢測嵌合mRNA轉錄物。
10.權利要求7的方法,其中樣本選自組織、血液、血漿、血清、尿液、尿液上清液、尿液細胞沉淀、精液、前列腺分泌物和前列腺細胞。
11.一種用于鑒定患者的前列腺癌的方法,所述方法包含 (a)提供來自患者的樣本,所述樣本可含有前列腺來源的核酸;以及 (b)檢測樣本中具有來自HERPUD1基因的轉錄調控區的5’部分和來自ERG基因的3’部分的基因融合體的存在或不存在, 其中在樣本中檢測到所述基因融合體的存在鑒定患者的前列腺癌。
12.一種用于鑒定患者的前列腺癌的方法,所述方法包含 (a)提供來自患者的樣本,所述樣本可含有前列腺來源的核酸;以及 (b)檢測樣本中具有來自AX747630基因的轉錄調控區的5’部分和來自ETVl基因的3’部分的基因融合體的存在或不存在, 其中在樣本中檢測到所述基因融合體的存在鑒定患者的前列腺癌。
13.一種用于鑒定患者的前列腺癌的方法,所述方法包含 (a)提供來自患者的樣本,所述樣本可含有前列腺來源的核酸;以及 (b)檢測樣本中選自下列的基因融合體的存在或不存在TIA1:DIRC2、NUP214:XKR3、DLEU2:PSPCl、PIK3C2A:TEADl、SPOCKl:TBC1D9B 和 RERE:PIK3CD, 其中在樣本中檢測到所述基因融合體的存在鑒定患者的前列腺癌。
14.一種用于鑒定患者的乳腺癌的方法,所述方法包含(a)提供來自患者的樣本,所述樣本可含有乳腺來源的核酸;以及 (b)檢測樣本中選自下列的基因融合體的存在或不存在AHCYL1:RAD51C、ARHGAP19:DRGl, BC017255: TMEM49, FCHOl :MY09B 和 PAP0LA:AK7, 其中在樣本中檢測到所述基因融合體的存在鑒定患者的前列腺癌。
15.一種用于鑒定患者的前列腺癌的方法,所述方法包含 (a)提供來自患者的樣本,所述樣本可含有前列腺來源的核酸;以及 (b)檢測樣本中選自下列的基因融合體的存在或不存在CARM1:HPF2、MGC11102:BANF1、 SLC4A1AP:SUPT7L、 ERCC2:KLC3、 PMF1:BGLAP、 TH0C6:HCFC1R1、NDUFB8:SEC31L2、ANKRD39 : ANKRD23、C14orf124:KIAA0323, C14orf21:CIDEB 和ZNF511:TUBGCP2, 其中在樣本中檢測到所述基因融合體的存在鑒定患者的前列腺癌。
16.一種組合物,其包含下列的至少一種 (a)寡核苷酸探針,其包含與嵌合基因組DNA或嵌合mRNA的連接處雜交的序列,其中嵌合基因組DNA或嵌合mRNA的5’部分來自于SLC45A3基因的轉錄調控區,并且嵌合基因組DNA或嵌合mRNA的3’部分來自于ELK4基因; (b)第一寡核苷酸探針,其包含與來自于SLC45A3基因轉錄調控區的嵌合基因組DNA或嵌合mRNA的5’部分雜交的序列,以及第二寡核苷酸探針,其包含與來自ELK4基因的嵌合基因組DNA或嵌合mRNA的3’部分雜交的序列;以及 (c)第一擴增寡核苷酸,其包含與來自于SLC45A3基因轉錄調控區的嵌合基因組DNA或嵌合mRNA的5’部分雜交的序列,以及第二擴增寡核苷酸,其包含與來自ERG基因的嵌合基因組DNA或嵌合mRNA的3’部分雜交的序列。
17.—種組合物,其包含下列的至少一種 (a)寡核苷酸探針,其包含與基因融合體的嵌合基因組DNA或嵌合mRNA的連接處雜交的序列,所述基因融合體選自USP10: ZDHHC7、EIF4E2: HJURP、HJURP: INPP4A、STRN4: GPSN2、RC3H2:RGS3、LMAN2:AP3S1、ZNF649-ZNF577 和 MIPOLl :DGKB ; (b)第一寡核苷酸探針,其包含與來自基因融合體的嵌合基因組DNA或嵌合mRNA的.5’部分雜交的序列,所述基因融合體選自USP10:ZDHHC7、EIF4E2:HJURP, HJURP: INPP4A、STRN4:GPSN2、RC3H2:RGS3、LMAN2:AP3S1、ZNF649-ZNF577 和 MIPOLl :DGKB,以及第二寡核苷酸探針,其包含與來自基因融合體的嵌合基因組DNA或嵌合mRNA的3’部分雜交的序列,所述基因融合體選自USP10:ZDHHC7、EIF4E2:HJURP, HJURP: INPP4A、STRN4:GPSN2、RC3H2:RGS3、LMAN2:AP3S1、ZNF649-ZNF577 和 MIPOLl :DGKB ; (c)第一擴增寡核苷酸,其包含與來自基因融合體轉錄調控區的嵌合基因組DNA或嵌合mRNA的5’部分雜交的序列,所述基因融合體選自USP10:ZDHHC7、EIF4E2:HJURP、HJURP:INPP4A, STRN4:GPSN2、RC3H2:RGS3、LMAN2:AP3S1、ZNF649-ZNF577 和 MIPOLl :DGKB,以及第二擴增寡核苷酸,其包含與來自基因融合體的3’部分雜交的序列,所述基因融合體選自USPlO :ZDHHC7、EIF4E2:HJURP、HJURP:INPP4A、STRN4:GPSN2、RC3H2:RGS3、LMAN2:AP3S1、ZNF649-ZNF577 和 MIPOLl :DGKB。
18.—種組合物,其包含下列的至少一種 (a)寡核苷酸探針,其包含與基因融合體的嵌合基因組DNA或嵌合mRNA的連接處雜交的序列,所述基因融合體選自HERPUD1:ERG、AX747630:ETV1、TIA1:DIRC2、NUP214:XKR3、DLEU2:PSPC1、PIK3C2A:TEADl、SPOCKl:TBC1D9B、RERE:PIK3CD、AHCYLl:RAD51C、ARHGAP19:DRG1、 BC017255:TMEM49、 FCH01:MY09B、 PAP0LA:AK7、 CARM1:YIPF2、MGC11102:BANF1、SLC4A1AP:SUPT7L、ERCC2:KLC3、PMFl:BGLAP, TH0C6:HCFC1R1、NDUFB8:SEC31L2、ANKRD39:ANKRD23、C14orf124:KIAA0323, C14orf21:CIDEB 和ZNF511:TUBGCP2 ; (b)第一寡核苷酸探針,其包含與來自基因融合體的嵌合基因組DNA或嵌合mRNA的5’部分雜交的序列,所述基因融合體選自HERPUD1: ERG、AX747630: ETVl、TIA1:DIRC2、NUP214:XKR3、DLEU2:PSPC1、PIK3C2A:TEADl、SPOCKI:TBC1D9B、RERE:PIK3CD、AHCYLl: RAD51C、ARHGAP19 : DRGl、BCO17255 : TMEM49、FCH01:MY09B、PAP0LA:AK7、CARM1:YIPF2、MGCl 1102:BANFl、SLC4A1AP:SUPT7L、ERCC2:KLC3、PMFl:BGLAP, TH0C6:HCFCIRl、NDUFB8: SEC31L2、ANKRD39:ANKRD23、C14orfl24:KIAA0323、C14orf21:CIDEB和ZNF511 :TUBGCP2,以及第二寡核苷酸探針,其包含與來自基因融 合體的嵌合基因組DNA或嵌合mRNA的3’部分雜交的序列,所述基因融合體選自HERPUDI:ERG, AX747630:ETV1、TIA1:DIRC2、NUP214:XKR3、DLEU2:PSPCU PIK3C2A:TEADl、SPOCKl :TBC1D9B、RERE:PIK3CD、AHCYLl:RAD51C、ARHGAP19 :DRGl、BC017255 : TMEM49、FCHOl:MY09B、PAPOLA:AK7、CARMl:YIPF2、MGCl1102:BANFl、SLC4A1AP:SUPT7L、ERCC2:KLC3、PMFl:BGLAP, TH0C6:HCFC1R1、NDUFB8: SEC31L2、ANKRD39:ANKRD23、C14orf 124:KIAA0323、C14orf21:CIDEB 和 ZNF511:TUBGCP2 ; (c)第一擴增寡核苷酸,其包含與來自基因融合體轉錄調控區的嵌合基因組DNA或嵌合mRNA的5’部分雜交的序列,所述基因融合體選自HERPUD1: ERG、AX747630: ETVl、TIA1:DIRC2、NUP214:XKR3、DLEU2:PSPC1、PIK3C2A:TEADl、SPOCKI:TBC1D9B、RERE:PIK3CD、AHCYLl:RAD51C、ARHGAP19:DRGl、BC017255:TMEM49、FCHOl:MY09B和 PAP0LA:AK7、CARM1:YIPF2、MGCl 1102:BANFl、SLC4A1AP:SUPT7L、ERCC2:KLC3、PMFI:BGLAP, TH0C6:HCFC1R1、NDUFB8:SEC31L2、ANKRD39:ANKRD23、C14orfl24:KIAA0323、C14orf21:CIDEB、ZNF511 :TUBGCP2,以及第二擴增寡核苷酸,其包含與來自基因融合體的3’部分雜交的序列,所述基因融合體選自HERPUD1: ERG、AX747630: ETVl、TIA1:DIRC2、NUP214:XKR3、DLEU2:PSPC1、PIK3C2A:TEADI、SPOCKI :TBC1D9B、RERE:PIK3CD、AHCYLl:RAD51C、ARHGAP19:DRGl、BC017255:TMEM49、FCHOl:MY09B、PAP0LA:AK7、CARM1:YIPF2、MGCl 1102:BANFl、SLC4A1AP:SUPT7L、ERCC2:KLC3、PMFl:BGLAP, TH0C6:HCFC1RU NDUFB8: SEC31L2、ANKRD39:ANKRD23、C14orfl24:KIAA0323、C14orf21:CIDEB 和 ZNF511:TUBGCP2。
全文摘要
本發明涉及用于癌癥診斷、研究和治療的組合物和方法,包括但不限于癌癥標志物。具體來說,本發明涉及作為癌癥(例如前列腺癌)的診斷標志物和臨床靶點的復現性基因融合體。
文檔編號C12Q1/68GK102639709SQ201080010862
公開日2012年8月15日 申請日期2010年1月8日 優先權日2009年1月9日
發明者阿魯·M·辛萊巖 申請人:密歇根大學董事會
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 灌阳县| 麦盖提县| 彰化市| 永胜县| 鄢陵县| 阜城县| 雷山县| 昌黎县| 汝州市| 大荔县| 徐州市| 双流县| 德江县| 鄂托克旗| 江川县| 海丰县| 遵化市| 杭锦旗| 方城县| 独山县| 大埔区| 舒兰市| 邵武市| 乡城县| 绵竹市| 阿瓦提县| 阳城县| 河南省| 宁化县| 辉南县| 稷山县| 连城县| 忻城县| 烟台市| 河源市| 汶上县| 通化县| 门源| 乌审旗| 察哈| 宣化县|