乳腺癌標志物的制作方法
【專利摘要】本申請涉及乳腺癌標志物。提供了多態性與乳腺癌之間的相關性。提供了乳腺癌的診斷、預后和治療方法。提供了乳腺癌診斷、預后和治療的系統和試劑盒。還記載了鑒定乳腺癌調控劑的方法。
【專利說明】乳腺癌標志物
[0001]本申請是申請日為2006年11月29日、中國申請號為200680051710.0、發明名稱為“乳腺癌標志物”的發明申請的分案申請。
[0002]相關申請的交叉參考
[0003]本申請請求Cox 等在 2005 年 11 月 29 日提交的 USSN60/740, 971MARKERS FORBREAST CANCER的優先權和利益。本申請還請求Cox等在2006年3月10日提交的USSN60/781,483MARKERS FOR BREAST CANCER的優先權和利益。將這些在先申請各自完整地引入本文作為參考。
[0004]發明背景
[0005]乳腺癌如其它常見的癌癥一樣表現出家族性聚類(clustering)。大量流行病學調查已經證實,總體而言,該病在乳腺癌患者的一級親屬中普及約為2倍i。家族研究特別是雙生子研究提示如果不是所有該聚類,那么也是大部分該聚類存在遺傳基礎2,3。例如,Peto和Mack3估計乳腺癌在患病女性的MZ雙生子中的風險約高于姊妹病例風險的4倍。
[0006]已經鑒定了幾種乳腺癌易感性(susceptibility)基因,最重要的是BRCAl和BRCA2。在這些基因中的突變賦予了乳腺癌的高風險(截止到70歲分別為65%和45%的等級)4。基于群體的系列乳腺癌病例突變篩選已經證實僅約15%的乳腺癌家族風險度可以解釋為這些基因中的突變5’6。其它已知的乳腺癌易感性基因(TP53、PTEN、ATM、CHEK2)對家族性風險僅有較小的貢獻(因為惡病質突變是罕見的和/或僅賦予較小的風險)。因此,總體而言,估計已知的乳腺癌易感性基因占家族性風險的不超過20%7。
[0007]風險中的遺傳變異可能源自罕見的高度外顯性(penetrant)突變(諸如BRCAl和BRCA2中的那些)或源自賦予更為中度風險的變異。幾條證據強烈提示高度外顯性突變并非剩余的家族性乳腺癌風險的主要提供者。首先,多個病例家族的突變篩選發現具有極為明顯家族史(例如4個或個以上患病親屬)的大部分病例在BRCAl或BRCA2中包含突變8。第二,盡管在過去的9年中進行了廣泛努力,但是遺傳連鎖研究尚未鑒定任何額外連鎖基因座9’1(1。第三,對較大系列的乳腺癌家族的分離分析已經發現,在調整BRCAl和BRCA2后,無進一步重大顯性乳腺癌易感性等位基因的證據n’12。在最大規模的這類分析中,Antoniou等13發現乳腺癌的最經濟型(parsimonious)模型為多基因模型,它與大量小作用基因座的倍增聯合(a large number of loci of small effect combining multiplicatively)相當。
[0008]盡管上述分析提示幾種較低外顯性乳腺癌易感性基因仍然有待檢測,但是這類基因的精確數目尚不了解。此外,在現有技術中,尚不清楚這類易感性等位基因在群體中是常見的還是罕見的。本申請集中于相對常見(頻率高于5%)的等位基因且本文基于全基因組對這類基因座進行鑒定。
[0009]發明概述
[0010]本發明包括與乳腺癌表型, 諸如乳腺癌易感性相關的多態性基因座的鑒定。圖1和2提供了表型基因座的描述。圖1提供了優選的表型基因座的描述。因此,本發明提供了先前未知的各種多態性與乳腺癌易感性表型之間的相關性。因此,對這些多態性(或與之相關的基因座)的檢測提供了用于鑒定患者處于乳腺癌風險中的有力和精確的方法和系統。此外,對這些多態性的鑒定提供了鑒定乳腺癌調控劑的高通量系統和方法。
[0011]因此,本發明在一個方面中提供了鑒定生物體或其衍生的生物學樣品的乳腺癌表型的方法。該方法包括檢測生物體或生物學樣品中的多態性或與之緊密連鎖的基因座,所述的多態性選自圖1的多態性,其中多態性與乳腺癌表型相關。這些方法進一步包括使所述多態性或基因座與所述表型建立相關性。
[0012]生物體典型的是哺乳動物,優選人類患者,最典型的是女性患者(盡管男性也會發生乳腺癌,而且本文中所述的相關性也適用于男性患者)。類似的,生物學樣品典型的衍生自哺乳動物,例如人類患者,例如遵循適宜的知情同意實踐。所述方法可用于檢測取自人類患者的樣品中的乳腺癌標志物,或者可用于檢測由其衍生的生物學樣品(例如細胞,包括原代的和培養的細胞)中的標志物。
[0013]可以通過任何可利用的方法檢測多態性,包括擴增、與探針或陣列雜交等。在一個具體的實施方案中,檢測包括擴增多態性、連鎖基因座或與之相關的序列(例如,側翼序列、轉錄序列等)并檢測所得擴增子。例如,在一個實施方案中,擴增包括:a)混合擴增引物或擴增引物對與分離自生物體或生物學樣品的核酸模板。所述的引物或引物對可以與鄰近或包含多態性或連鎖基因座的區互補或部分互補,并且能夠在核酸模板上由聚合酶啟動核酸聚合。所述的引物或引物對在包括聚合酶和模板核酸的DNA聚合反應中延伸而生成擴增子。在某些方面中,任選通過如下方法檢測擴增子,該方法包括使所述的擴增子與陣列雜交、用限制酶消化該擴增子或實時PCR分析。例如,可以任選通過雜交對擴增子進行完全或部分測序。一般而言,擴增可以包括使用分離自生物體或生物學樣品的核酸作為PCR、RT-PCR或LCR中的模板進行聚合酶鏈反應(PCR)、逆轉錄酶PCR(RT-PCR)或連接酶鏈反應(LCR)。可以用其它技術取代擴增,例如使用分支DNA(bDNA)探針。
[0014]在典型的實施方案中,多態性或連鎖基因座可以包括SNP。等位基因的實例包括圖1和/或2中所述的那些。例如,相關多態性可以為圖1 (最優選)或圖2的那些。優選的多態性包括選自SNP識別號碼所述的SNP組的SNP,所述的識別號碼選自:SNPID2312116,SNP ID1622530,SNP ID3712013,SNPID1509710,SNP ID843029,SNP ID1990126,SNP ID604819, SNP ID30257`34, SNP ID1152499, SNP ID4415909, SNP ID1732681,SNP ID4281579, SNP ID4454457, SNP ID2616199, SNP ID1720694, SNP ID4077723,SNP ID3711990, SNP ID3337858, SNP ID4093095, SNP ID4213825, SNP ID3488617,SNP ID3610210, SNP ID3451239, SNP ID1582533, SNP ID3488150, SNP ID2770052, SNPID4141351,SNP ID1335030, SNP ID2211665 和 SNP ID4538418。這些識別號碼為 PerlegenSNP 識別號碼(Perlegen Sciences, Inc.1n Mountain View, CA),其為公眾可得到的并且可以在Perlegen (dot) com上查閱到大量相關信息,通過使用該公司在genome (dot)perlegen (dot) com/browser/index (dot) html 可利用的基因組瀏覽器查閱。可以在 SNP_ID開始處添加通配符(例如,符號)以便例如按照提供的完整說明書鑒定有關所有SNP等位基因的相關信息。該數據庫還與NCBI基因組數據庫鏈接,由此提供大量有關相關基因和多態性的額外信息。這些SNP包括與例如如下基因相關的SNP:FGFR2, A2BP1, TNRC9, H19,FSTL5, LSPl,L0C388927, UNQ9391, HCNl,L0C441192, TNRC9, NR3C2, KIAA0826, FLJ31033,AACS, FRMD4A和SEC31L2(另外,參見圖1)。因此,與這些基因相關的多態性也是可能與乳腺癌多態性相關的優選SNP。
[0015]并且任選在某些實施方案中,該方法包括在一種以上這類基因中檢測多態性(例如,在某些便利性的應用中,可以同時對單一患者檢測幾種多態性以便更完整地確定或指定相關表型)。如此,本發明在一個方面中包括檢測多個所述基因中的多個多態性或連鎖基因座。該方法可以包括,例如,檢測下列每種的至少一個多態性:SNP ID2312116、SNP ID1622530、SNP ID3712013、SNP ID1509710 和 SNP ID84302,和 / 或 FGFR2、A2BP1、TNRC9、H19和FSTL5中的多態性。類似地,該方法可以包括檢測下列每種的至少一個多態性:SNP ID2312116, SNP ID1622530, SNP ID3712013, SNP BD1509710, SNP ID843029,SNP ID1990126, SNP ID604819, SNP ID3025734, SNP ID1152499, SNP ID4415909,SNP ID1732681, SNP ID4281579, SNP ID4454457, SNP ID2616199, SNP ID1720694,SNP ID4077723, SNP ID3711990, SNP ID3337858, SNP ID4093095, SNP ID4213825,SNP ID3488617, SNP ID3610210, SNP ID3451239, SNP ID1582533, SNP ID3488150, SNPID2770052,SNP ID4141351, SNP ID1335030, SNP ID2211665和 SNP ID4538418 ;或如下每種中的至少一個多態性:FGFR2,A2BP1, TNRC9, H19, FSTL5, LSPl,L0C388927, UNQ9391, HCNl,L0C441192, TNRC9, NR3C2, KIAA0826, FLJ31033, AACS, FRMD4A 和 SEC31L2。一般而言,可以檢測本文圖中的這些或任何其它多態性/基因/基因座的任何組合,并且所有這類組合均任選為本發明的特征,無論是否特別列出。本發明用于檢測本文多態性的探針或引物可以包括圖1和/或2多態性的核苷酸序列,其側翼序列或其互補核酸或其轉錄產物(例如,由基因組序列例如通過轉錄或剪接產生的nRNA或mRNA形式)。還可以檢測多肽序列,例如對任何由核酸指定等位基因形式轉錄的多肽序列檢測多態性。
[0016]一般而言,與QTL相關的任何多態性可以用作QTL的標志物。因此,與圖中指定多態性相關的標志物可以用作指定多態性的代替(proxy)標志物。一般而言,相關性越緊密,則作為QTL/多態性的標志物越好。因此,期望連鎖基因座可以為距多態性約為5cM或以下(且任選IcM或以下)的緊密連鎖基因座。
[0017]所述的方法任選包括通過參照查閱表使多態性或連鎖基因座與乳腺癌表型建立相關性,所述的查閱表包含多態性或連鎖基因座的等位基因與乳腺癌表型的相關性的信息。用于這種相關性的數據庫可以為啟發式的(heuristic),或者以其它方式能夠基于通過關聯標志物-性狀信息獲得的信息改進相關性。
[0018]相關的組合物為本發明的特征,例如,包含多個標志物探針或擴增引物的組合物,所述的標志物探針或擴增引物檢測或擴增例如如本文所述與乳腺癌表型相關的多種多態性。引物/探針可以基于陣列或在溶液中游離。
[0019]在另一個方面中,還提供了鑒定乳腺癌表型調控劑的方法。所述的方法包括使潛在的調控劑接觸基因或基因產物,例如,其中基因或基因產物包含本文所述的多態性(例如,在圖1和/或2中)或與之緊密連鎖。檢測潛在調控劑對基因或基因產物的作用,由此鑒定潛在的調控劑是否調控表型。
[0020]基因或基因產物任選包括選自本文所列那些的多態性的特定等位基因,但還可以對其它等位基因測試調控劑以便鑒定特異性或非特異性調控等位基因的調控劑。可以測試的作用包括如下中的任意種:(a)在有調控劑存在下基因或基因產物表達的升高或降低;(b)在有調控劑存在下基因廣物活性的升聞或降低;和(C)在有調控劑存在下基因或基因產物表達圖式的改變。
[0021]治療乳腺癌表型的試劑盒可以包括所述方法鑒定的調控劑和用于對患者給藥以便治療所述表型的說明書。
[0022]除上述方法外,用于實施所述方法的試劑盒和系統也為本發明的特征。例如,用于鑒定生物體或其衍生的生物學樣品的乳腺癌表型的系統為本發明的一個特征。該系統包括,例如,一組為檢測一種或多種多態性或連鎖基因座中的至少一種等位基因配置的標志物探針或引物,例如,其中所述的多態性為本文所述,例如,在圖1或2中所述的任何多態性。該系統任選還包括檢測器,該檢測器為檢測來自所述標志物探針或引物組或由該標志物探針或引物組產生的擴增子的一種或多種信號輸出,由此鑒定存在或不存在所述的等位基因。一般在該系統中包括使等位基因的存在或不存在與預測的表型建立相關性的系統指令(例如,在該系統計算機中包含的軟件)作為系統的組成部分。
[0023]篩選調控劑的系統也為本發明的特征。這些系統可以包括,例如,與本文多態性相關的基因或基因編碼的表達產物。這些系統一般包括檢測器,該檢測器測定在有調控劑存在下基因或基因產物表達的升高或降低;在有調控劑存在下基因產物活性的升高或降低;或在有調控劑存在下基因或基因產物表達圖式的改變。這些系統還可以包括用于混合和等分調控劑和/或基因或產物、混合它們、進行實驗室操作(例如純化,合成,細胞培養等)的流體操作部件。用于記錄調控劑作用且任選用于選擇調控劑的系統指令也為這些系統的任選特征。
[0024]用于進行本文任何方法的試劑盒為本發明的另一個特征。這類試劑盒可以包括用于檢測本文的任何多態性的探針或擴增子、適當的包裝材料和用于實施所述方法的說明書。
[0025]上述多態性和基因和相應標志物探針、擴增子或引物可以以物理核酸或多肽的形式或系統說明書的形式具體·配置在本文的任何系統中,所述的系統說明書包括有關核酸和多肽的序列信息。例如,該系統可以包括對應于本文所述基因或多態性的引物或擴增子或者擴增其一部分的引物或擴增子,所述的基因或多態性諸如SNP ID2312116,SNPID1622530,SNP ID3712013,SNP ID1509710,SNP ID843029,SNP ID1990126,SNP ID604819,SNP ID3025734, SNP ID1152499, SNP ID4415909, SNP ID1732681, SNP ID4281579,SNP ID4454457, SNP ID2616199, SNP ID1720694, SNP ID4077723, SNP ID3711990,SNP ID3337858, SNP ID4093095, SNP ID4213825, SNP ID3488617, SNP ID3610210,SNP ID3451239, SNP ID1582533, SNP ID3488150, SNP ID2770052, SNP ID4141351, SNPID1335030, SNP ID2211665 和 SNP ID4538418,和 / 或 FGFR2,A2BP1, TNRC9, H19, FSTL5,LSPl,L0C388927, UNQ9391, HCNl,L0C441192, TNRC9, NR3C2, KIAA0826, FLJ31033, AACS,FRMD4A和SEC31L2。正如在上述方法中,標志物探針或引物組任選檢測多個所述基因或遺傳基因座中的多個多態性。因此,例如,標志物探針或引物組檢測本文圖中的這些多態性或基因或任何其它多態性、基因或基因座每種中的至少一個多態性。任何這類探針或引物可以包括任何這類多態性或基因或其互補核酸或其轉錄產物的核苷酸序列(例如,由基因組序列,例如通過轉錄或剪接產生的nRNA或mRNA形式)。
[0026]許多可選擇的變體為本發明的實施方案。例如,檢測器一般檢測一種或多種光發射,它表示存在或不存在所述的等位基因。說明書一般包含至少一種查閱表,它包括所述等位基因的存在或不存在與所述表型之間的相關性。系統任選包括測試樣品,例如,基因組DNA、擴增的基因組DNA、cDNA、擴增的cDNA、RNA或擴增的RNA。樣品可以來自或衍生自哺乳動物,諸如人類患者。
[0027]所述方法、試劑盒和系統的所有特征可以彼此結合使用。例如,用于檢測調控劑的系統可以用于實施調控劑檢測方法。用于鑒定乳腺癌表型與多態性之間相關性的系統可以用于實施本文的方法。試劑盒可以用于實施本文的方法。因此,系統、方法和試劑盒的所述特征可以適用于本文的不同系統、方法和試劑盒。
[0028]本發明涉及下述各項。
[0029]1.對生物體或其衍生的生物學樣品鑒定乳腺癌表型的方法,該方法包括:
[0030]檢測生物體或生物學樣品中的多態性或與之緊密連鎖的基因座,所述的多態性選自圖1或2的多態性,其中所述的多態性與乳腺癌表型相關;并且
[0031]將所述的多態性或基因座與所述的表型建立相關性。
[0032]2.項I所述的方法,其中所述的生物體為哺乳動物或所述的生物學樣品衍生自哺乳動物。
[0033]3.項I所述的方法,其中所述的生物體為人類患者或所述的生物學樣品衍生自人
類患者。
[0034]4.項I所述的方法,其中所述的檢測包括擴增多態性、連鎖基因座或與之相關的序列,并且檢測所得擴增子。
[0035]5.項4所述的方法,其中所述的擴增包括:
[0036]a)混合擴增引物或擴`增引物對與分離自所述生物體或生物學樣品的核酸模板,其中所述的引物或引物對與鄰近或包含所述的多態性或連鎖基因座的區互補或部分互補,并且能夠在所述核酸模板上由聚合酶啟動核酸聚合;和
[0037]b)使引物或引物對在包括聚合酶和模板核酸的DNA聚合反應中延伸以便生成擴增子。
[0038]6.項4所述的方法,其中通過包括如下一個或多個步驟的方法檢測所述的擴增子:使該擴增子與陣列雜交;用限制酶消化該擴增子;或實時PCR分析。
[0039]7.項4所述的方法,包括對所述的擴增子進行部分或完全測序。
[0040]8.項4所述的方法,其中所述的擴增包括進行聚合酶鏈反應(PCR)、逆轉錄酶PCR(RT-PCR)或連接酶鏈反應(LCR),其中使用分離自所述生物體或生物學樣品的核酸作為PCR、RT-PCR或LCR中的模板。
[0041]9.項I所述的方法,其中所述的多態性或連鎖基因座包含單核苷酸多態性(SNP)。
[0042]10.項I所述的方法,其中所述的多態性包含選自圖1或2中等位基因的等位基因。
[0043]11.項I所述的方法,其中所述的多態性為選自下組的單核苷酸多態性:SNP ID2312116、 SNP ID1622530、 SNP ID3712013、 SNP ID1509710、 SNP ID843029、SNP ID1990126、 SNP ID604819、 SNP ID3025734、 SNP IDl152499、 SNP ID4415909、SNP ID1732681、 SNP ID4281579、 SNP ID4454457、 SNP ID2616199、 SNP ID1720694、SNP ID4077723、 SNP ID3711990、 SNP ID3337858、 SNP ID4093095、 SNP ID4213825、SNP ID3488617、SNP ID3610210、SNP ID3451239、SNP ID1582533、SNP ID3488150、SNPID2770052、SNP ID4141351、SNP ID1335030、SNP ID2211665和 SNP ID4538418。
[0044]12.項I所述的方法,其中所述的多態性在選自下組的基因或基因座中:FGFR2、A2BP1、TNRC9、H19、FSTL5、LSPU L0C388927、UNQ9391、HCNl、L0C441192、TNRC9、NR3C2、KIAA0826、FLJ31033、AACS、FRMD4A 和 SEC31L2。
[0045]13.項12所述的方法,其中該方法包括檢測在多個所述基因中的多個多態性或連鎖基因座。
[0046]14.項12所述的方法,其中該方法包括檢測在FGFR2、A2BP1、TNRC9、H19和FSTL5每種中的至少一個多態性。[0047]15.項12所述的方法,其中該方法包括檢測SNP ID2312116、SNP ID1622530、SNPID3712013、SNP ID1509710 和 SNP ID843029 每種的至少一個多態性。
[0048]16.項12所述的方法,其中該方法包括檢測如下每種的至少一個多態性:SNP ID2312116、 SNP ID1622530、 SNP ID3712013、 SNP ID1509710、 SNP ID843029、SNP ID1990126、 SNP ID604819、 SNP ID3025734、 SNP IDl152499、 SNP ID4415909、SNP ID1732681、 SNP ID4281579、 SNP ID4454457、 SNP ID2616199、 SNP ID1720694、SNP ID4077723、 SNP ID3711990、 SNP ID3337858、 SNP ID4093095、 SNP ID4213825、SNP ID3488617、SNP ID3610210、SNP ID3451239、SNP ID1582533、SNP ID3488150、SNPID2770052.SNP ID414135USNP ID1335030.SNP ID2211665和SNP ID4538418 ;或如下每種中的至少一個多態性:FGFR2、A2BP1、TNRC9、H19、FSTL5、LSP1、L0C388927、UNQ9391、HCN1、L0C441192、TNRC9、NR3C2、KIAA0826、FLJ31033、AACS、FRMD4A 和 SEC31L2。
[0049]17.項I所述的方法,其中所述的連鎖基因座為距離所述多態性約5cM或5cM以下的緊密連鎖基因座。
[0050]18.項I所述的方法,其中將所述多態性或連鎖基因座與所述乳腺癌表型建立相關性包括參閱查閱表,該查閱表包含所述多態性或連鎖基因座的等位基因與所述乳腺癌表型的相關性的信息。
[0051]19.組合物,包含多個標志物探針或擴增引物,該標志物探針或擴增引物用于檢測或擴增多個選自下組的多態性:SNP ID2312116、SNP ID1622530、SNP ID3712013、SNPID1509710.SNP ID843029、SNP ID1990126、SNP ID604819、SNP ID3025734、SNP ID1152499、SNP ID4415909、 SNP ID1732681、 SNP ID4281579、 SNP ID4454457、 SNP ID2616199、SNP ID1720694、 SNP ID4077723、 SNP ID3711990、 SNP ID3337858、 SNP ID4093095、SNP ID4213825、SNP ID3488617、SNP ID3610210、SNP ID3451239、SNP ID1582533、SNPID3488150、SNP ID2770052、SNP ID4141351、SNP ID1335030、SNP ID2211665 和 SNPID4538418。
[0052]20.項19所述的組合物,其中所述的標志物探針或擴增引物在溶液中游離。
[0053]21.鑒定乳腺癌表型的調控劑的方法,該方法包括:
[0054]使潛在的調控劑接觸基因或基因產物,其中所述的基因或基因產物包含選自下組的多態性或與之緊密連鎖:SNP ID2312116、SNP ID1622530、SNP ID3712013、SNPID1509710.SNP ID843029、SNP ID1990126、SNP ID604819、SNP ID3025734、SNP ID1152499、SNP ID4415909、 SNP ID1732681、 SNP ID4281579、 SNP ID4454457、 SNP ID2616199、SNP ID1720694、 SNP ID4077723、 SNP ID3711990、 SNP ID3337858、 SNP ID4093095、SNP ID4213825、SNP ID3488617、SNP ID3610210、SNP ID3451239、SNP ID1582533、SNPID3488150、SNP ID2770052、SNP ID4141351、SNP ID1335030、SNP ID2211665 和 SNPID4538418 ;并且
[0055]檢測該潛在的調控劑對所述基因或基因產物的作用,由此鑒定該潛在的調控劑是否調控所述的表型。
[0056]22.項21所述的方法,其中所述的基因或基因產物包含選自下組的多態性:SNP ID2312116、 SNP ID1622530、 SNP ID3712013、 SNP ID1509710、 SNP ID843029、SNP ID1990126、 SNP ID604819、 SNP ID3025734、 SNP IDl152499、 SNP ID4415909、SNP ID1732681、 SNP ID4281579、 SNP ID4454457、 SNP ID2616199、 SNP ID1720694、SNP ID4077723、 SNP ID3711990、 SNP ID3337858、 SNP ID4093095、 SNP ID4213825、SNP ID3488617、SNP ID3610210、SNP ID3451239、SNP ID1582533、SNP ID3488150、SNPID2770052、SNP ID4141351、SNP ID1335030、SNP ID2211665 和 SNP ID4538418。
[0057]23.項21所述的方法,其中所述的作用選自:
[0058](a)在有所述調控劑存在下所述基因或基因產物的表達升高或降低;
[0059](b)在有所述調控劑存在下所述基因產物的活性;和升高或降低
[0060](c)在有所述調控劑存在下所述基因或基因產物的表達圖式改變。
[0061]24.治療乳腺癌表型的試劑盒,該試劑盒包含通過項21所述方法鑒定的調控劑和將該調控劑施用于患者以便治療所述表型的說明書。
[0062]25.對生物體或其衍生的生物學樣品鑒定乳腺癌表型的系統,該系統包含:
[0063]a) 一組標志物探針或引物,設置用于檢測一個或多個多態性或連鎖基因座的至少一個等位基因,其中所述的多態性選自SNP ID2312116.SNP ID1622530.SNP ID3712013、SNPID1509710、SNP ID843029、SNP ID1990126、SNP ID604819、SNP ID3025734、SNP ID1152499、SNP ID4415909、 SNP ID1732681、 SNP ID4281579、 SNP ID4454457、 SNP ID2616199、SNP ID1720694、 SNP ID4077723、 SNP ID3711990、 SNP ID3337858、 SNP ID4093095、SNP ID4213825、SNP ID3488617、SNP ID3610210、SNP ID3451239、SNP ID1582533、SNPID3488150、SNP ID2770052、SNP ID4141351、SNP ID1335030、SNP ID2211665 和 SNPID4538418 ;
[0064]b)檢測器,設置用于檢測來自該組標志物探針或引物的一種或多種信號輸出或由該組標志物探針或引物產生的擴增子,由此鑒定所述等位基因的存在與否;和
[0065]c)系統指令,其將所述等位基因的存在與否與預測的表型建立相關性。
[0066]26.項25所述的系統,其中該組標志物探針或引物檢測選自下組的基因中的多態性:FGFR2、A2BP1、TNRC9、H19、FSTL5、LSP1、L0C388927、UNQ939 UHCNU L0C441192、TNRC9、NR3C2、KIAA0826、FLJ31033、AACS、FRMD4A 和 SEC31L2。
[0067]27.項25所述的系統,其中該組標志物探針或引物檢測多個所述基因或遺傳基因座中的多個多態性。
[0068]28.項25所述的系統,其中該組標志物探針或引物檢測FGFR2、A2BP1、TNRC9、H19和FSTL5每種中的至少一個多態性。
[0069]29.項25所述的系統,其中該組標志物探針或引物檢測選自SNP ID2312116、SNPID1622530、SNP ID3712013、SNP ID1509710 和 SNP ID843029 多態性的至少一個多態性。[0070]30.項25所述的系統,其中所述的檢測器檢測一種或多種光發射,其中所述的光發射指示所述等位基因的存在與否。
[0071]31.項25所述的系統,其中所述的指令包含至少一種查閱表,該查閱表包括所述等位基因的存在與否與所述表型之間的相關性。
[0072]32.項25所述的系統,其中該系統包含樣品。
[0073]33.項32所述的系統,其中所述的樣品包含基因組DNA、擴增的基因組DNA、cDNA、擴增的cDNA、RNA或擴增的RNA。
[0074]34.項32所述的系統,其中所述的樣品衍生自哺乳動物。
[0075]附圖簡述
[0076]圖1為優選多態性、基因和與乳腺癌相關的多態性的相關信息的表。
[0077]圖2為優選多態性、基因和與乳腺癌相關的多態性的相關信息的表。
[0078]定義
[0079]應理解本發明并不限于特定的實施方案,其當然可以改變。還應理解本文所用術語的目的僅在于描述特定的實施方案,但并非旨在限制。除非上下文中另有明確的描述,否則作為本說明書和所附權利要求中所用的單數和單數形式的術語例如"一個/ 一種(a,an)〃和〃所述的(the) 〃任選包括復數指示物。因此,例如,提到〃 一種探針〃任選包括多個探針分子;類似地,根據上下文的不同,應用的術語"一種核酸"作為實用物質任選包括該核酸分子的許多拷貝。對基因或蛋白質的字母命名根據上下文的不同可以指基因形式和/或蛋白質形式。本領域技術 人員完全能夠通過參比本文的序列、已知的序列和遺傳密碼聯系相關生物學分子的核酸和氨基酸形式。
[0080]除非另作陳述,否則核酸從左到右以5’ 一 3’方向書寫。本說明書中引述的數值范圍包括確定范圍的數值并且包括該定義范圍的每個整數或任何非整數的分數。除非另作陳述,否則本文所用的所有技術和科學術語具有與本發明所屬領域普通技術人員通常理解相同的含義。盡管與本文所述那些類似或相當的任何方法和物質可以用于實施本發明的測試,但是優選的物質和方法如本文所述。在描述和請求保護本發明中,按照如下列出的定義使用下列術語。
[0081]"表型"為在個體或群體中可觀察到的性狀或性狀集合。該性狀可以為定量的(數量性狀或QTL)或定性的。例如,對乳腺癌的易感性為可以按照本文的方法、組合物、試劑盒和系統監測的表型
[0082]〃乳腺癌易感性表型〃為展示出個體對發生乳腺癌的惡病質(predisposition)的表型。展示出對乳腺癌的惡病質的表型可以例如表現出癌癥在具有該表型的個體中發生的可能性高于在指定的一組環境條件(膳食、體力活動方案、地理位置等)下的相關一般群體中的成員。
[0083]"多態性"為可變的基因座;即在群體內多態性處的核苷酸序列具有一種以上形式或等位基因。術語"等位基因"意指出現在特定基因座上或在其上編碼的兩種或多種不同核苷酸序列或由這類基因座編碼的兩種或多種不同多肽序列之一。例如,第一種等位基因可以出現在一條染色體上,而第二種等位基因出現在第二條同源染色體上,例如,正如對雜合個體的不同染色體或群體中的不同純合或雜合個體之間的不同染色體出現的。多態性的一個實例為"單核苷酸多態性"(SNP),其為在基因組中的單一核苷酸位置上的多態性(在特定位置上的核苷酸在個體或群體之間可變)。
[0084]在等位基因與性狀連鎖且在等位基因的存在為性狀或性狀形式會在包含該等位基因的個體中出現的指示物時,該等位基因與該性狀“正”相關。在等位基因與性狀連鎖且在等位基因的存在為性狀或性狀形式不會在包含該等位基因的個體中出現的指示物時,該等位基因與該性狀“負”相關。
[0085]在標志物多態性或等位基因可以在統計學上(正的或負的)與特定表型關聯時,該標志物多態性或等位基因與該表型(乳腺癌易感性等)"關聯"或"相關"。即特定多態性與對照群體(例如,不具有乳腺癌的個體)相比更常見于病例群體(例如,乳腺癌患者)。通常將這種相關性推斷為實際上是致病原因,但不一定一與表型潛在的性狀的基因座的簡單遺傳連鎖(與之相關)足以使關聯/相關性出現。
[0086]〃有利的等位基因〃為與期望表型,例如乳腺癌抗性正相關的特定基因座上的等位基因,例如,與乳腺癌惡病質負相關的等位基因。連鎖標志物的有利等位基因為與有利等位基因分離的標志物等位基因。染色體區段的有利等位基因形式為如下染色體區段,它包括與不利表型正相關或與物理上位于染色體區段上的一個或多個遺傳基因座上的不利表型負相關的核苷酸序列。
[0087]〃不利的等位基因〃為與期望表型負相關或與不利表型正相關,例如與乳腺癌易感性正相關的特定基因座上的等位基因。連鎖標志物的不利等位基因為與不利等位基因分離的標志物等位基因。染色體區段的不利等位基因形式為如下染色體片段,它包括與期望表型負相關或與物理上位于該染色體區段上的一個或多個遺傳基因座上的不利表型正相關的核苷酸序列。
[0088]〃等位基因頻率〃意指等位基因存在于個體、品系或品系群體內基因座上的頻率(比例或百分比)。例如,就等位基因〃A〃而言,基因型〃AA〃、〃Aa〃或〃aa〃的二倍體個體具有的等位基因頻率分別為1.·0,0.5或0.0。可以估計品系或群體(例如病例或對照)內的等位基因頻率,通過取來自該品系或群體的個體樣品的等位基因頻率的平均值來進行。類似地,可以通過取構成所述群體的品系的等位基因頻率的平均值來計算等位基因頻率。
[0089]若個體在指定基因座上僅具有一種類型的等位基因(例如,二倍體個體在兩條同源染色體各自的基因座上具有相同的等位基因拷貝),則該個體為"純合"的。若一種以上的等位基因類型存在于指定基因座上(例如,具有兩種不同等位基因各自的一種拷貝的二倍體個體),則該個體為"雜合"的。術語"同質性"表示組中的成員在一個或多個特定基因座上具有相同基因型。相反,術語"異質性"用于表示組中的個體在一個或多個特定基因座上的基因型不同。
[0090]〃基因座〃為染色體位置或區域。例如,多態基因座為多態核酸、性狀決定子、基因或標志物定位的位置或區域。在另一個實例中,"基因的基因座"為可以發現特定基因的物種基因組中的特定染色體位置(區域)。類似地,術語"數量性狀基因座"或"QTL"意指具有至少兩種等位基因的基因座,所述的兩種等位基因在至少一種遺傳背景中例如在至少一種群體或子代中有差別地影響數量或連續表型性狀的表達或改變數量或連續表型性狀的變化形式。
[0091]〃標志物",〃分子標志物〃或〃標志物核酸〃意指在鑒定基因座或連鎖基因座時用作參比點的核苷酸序列或其編碼的產物(例如蛋白質)。標志物可以衍生自基因組核苷酸序列或表達的核苷酸序列(例如,衍生自RNA、nRNA、mRNA、cDNA等)或編碼的多肽。該術語還意指與標志物序列互補或位于其側翼的核酸序列,諸如用作能夠擴增該標志物序列的探針或引物對的核酸。〃標志物探針〃為可以用于鑒定標志物基因座的存在的核酸序列或分子,例如與標志物基因座序列互補的核酸探針。若例如核酸按照沃森-克里克堿基配對原則在溶液中特異性雜交,則該核酸為〃互補的"。〃標志物基因座〃為可以用于示蹤第二種連鎖基因座的存在的基因座,例如,編碼或促成表型性狀的群體變異的連鎖或相關基因座。例如,標志物基因座可以用于監測在基因座,諸如QTL上的等位基因的分離,這些等位基因在遺傳或物理上與標志物基因座連鎖。因此,〃標志物等位基因〃,或者〃標志物基因座的等位基因",為在對該標志物基因座而目多態性的群體中的標志物基因座上發現的多個多態性核苷酸序列之一。本發明在一個方面中提供了與所關注的表型,例如乳腺癌易感性/抗性相關的標志物基因座。預計鑒定的標志物各自與促成相關表型的遺傳元件,例如QTL具有緊密的物理和遺傳鄰近性(導致物理和/或遺傳連鎖)。可以通過本領域完全確立的方法檢測群體成員之間對應于遺傳多態性的標志物。這些方法包括,例如,基于PCR的序列特異性擴增法、檢測限制性片段長度多態性(RFLP)、檢測同工酶標志物、檢測等位基因特異性雜交(ASH)、檢測單核苷酸延伸、檢測基因組的擴增可變序列、檢測自維持序列復制、檢測單一序列重復(SSR)、檢測單核苷酸多態性(SNP)或檢測擴增片段長度多態性(AFLP)。
[0092]〃遺傳圖〃 一般以圖或表形式描述指定物種中一條或多條染色體(或連鎖群)上的基因座中的遺傳連鎖(或關聯)相關性。"作圖"為通過使用遺傳標志物、標志物的群體分離和重組頻率的標準遺傳原理定義基因座連鎖相關性的過程。"圖定位"為遺傳圖上相對于連鎖遺傳標志物的指定位置,其中可以在指定物種中發現特定標志物。術語〃染色體區段〃指居留在單一染色體上的基因組DNA的連續的線性跨度。類似地,〃單倍型〃為在個體或群體的可遺傳物質中發現的一組遺傳基因座(該組可以為連續的或不連續的)。在本發明的上下文中,遺傳元件諸如本文的一種或多種等位基因和一種或多種連鎖標志物等位基因可以位于染色體區段內,且因而是遺傳連鎖的,特定遺傳重組距離小于或等于20厘摩(CM)或20cM以下,例如15cM或15cM以下,通常為IOcM或IOcM以下,例如,約9、8、7、6、5、
4、3、2、1、0.75,0.5,0.25或0.1CM或以下。即單一染色體區段內兩種緊密連鎖的遺傳元件在減數分裂過程中以小于或等于約20%、例如約19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%`、3%、2%、1%、0.75%,0.5%、0.25%或0.1%或以下的頻率彼此重組。一旦例如通過比較病例和對照的基因座統計頻率鑒定出表型(例如,乳腺癌惡病質)與多態基因座之間的相關性/關聯性,則與相關基因座連鎖的任何多態性可以用作相關基因座的替代標志物。
[0093]〃遺傳重組頻率〃為兩個遺傳基因座之間重組事件的頻率。可以通過跟蹤減數分裂過程中標志物和/或性狀的分離來觀察重組頻率。在本發明的上下文中,若相關基因座因染色體物理關聯而為相同連鎖群的組成部分且連鎖不平衡(linkage disequilibrium)時,則該標志物基因座與另一標志物基因座或某些其它基因座(例如,乳腺癌易感性基因座)"有關聯"。這一情況在發現標志物基因座和連鎖基因座一起在子代中比基因座隨機分離更頻繁時發生。類似地,標志物基因座還可以與性狀相關,例如,若標志物基因座與性狀連鎖不平衡中(例如,當發現標志物在病例中比在對照群體中更常見時,可以檢測到這一結果),則可以說標志物基因座與指定性狀(乳腺癌抗性或易感性)"相關"。術語"連鎖不平衡"意指遺傳基因座或性狀(或它們兩者)的非隨機分離。在每一情況中,連鎖不平衡意指相關基因座位于沿染色體長度的足夠物理接近內,使得它們以大于隨機的頻率彼此分離(就共分離性狀而言,性狀潛在的基因座彼此有足夠的接近性)。連鎖基因座共分離50%以上的機會,例如,約51% —約100%的機會。有利的是,兩個基因座彼此緊密鄰近定位,使得同源染色體對之間的重組以高頻率在減數分裂過程中在兩個基因座之間不發生,例如,使得緊密連鎖的基因座共分離至少約80%的機會,更優選至少約85%的機會,更優選至少 90% 的機會,例如,91%,92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 99.5%, 99.75% 或 99.90%或以上的機會。
[0094]本申請中的術語〃緊密連鎖〃意指兩個連鎖的基因座(例如,SNP,諸如圖1或2中鑒定的(例如,通過比較病例和對照群體得出與乳腺癌表型相關)和第二種連鎖多態性)之間重組以等于或小于約20%的頻率發生。換言之,緊密(或〃緊固〃)連鎖的基因座共分離至少80%的機會。標志物基因座在它們與靶基因座(例如,乳腺癌的QTL,或單純的其它乳腺癌標志物基因座)緊密連鎖時對本發明尤其有用。標志物與靶基因座連鎖得越緊密,則該標志物為靶基因座指示物越好。因此,在一個實施方案中,緊密連鎖的基因座,諸如標志物基因座和第二種基因座展示出約20%或以下,例如,15%或以下,例如,10%或以下,優選約9%或以下,更優選約8%或以下,更優選約7%或以下,更優選約6%或以下,更優選約5%或以下,更優選約4%或以下,更優選約3%或以下且更優選約2%或以下的基因座間重組頻率。在高度優選的實施方案中,相關基因座(例如,標志物基因座和靶基因座,諸如QTL)展示出約1%或以下,例如,約0.75%或以下,更優選約0.5%或以下、或更優選約0.25%或以下、或更優選約0.1%或以下的重組頻率。還認為對于位于同一染色體上的兩個基因座并且在兩個基因座之間以小于約20%,例如15%,更優選10%(例如,約9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%,0.75%, 0.5%, 0.25%, 0.1%或以下)的頻率發生重組的這類距離上,兩個基因座為彼此〃鄰近的"。 當提到兩個連鎖遺傳元件,諸如促成性狀的遺傳元件和鄰近標志物的相關性時,"偶聯〃相連鎖表示位于性狀基因座上的〃有利〃等位基因以物理方式結合在與相應連鎖標志物基因座的"有利"等位基因相同的染色體鏈上的狀態。在偶聯相中,兩種有利的等位基因一起通過遺傳該染色體鏈的子代遺傳。在"排斥"相連鎖中,在所關注的基因座(例如,乳腺癌易感性的QTL)上的〃有利〃等位基因以物理方式結合在與鄰近標志物基因座上〃不利"等位基因相同的染色體鏈上,并且兩個"有利"的等位基因不一起遺傳(即兩個基因座彼此〃異相〃)。
[0095]在有關核酸擴增的上下文中術語"擴增"為產生所選核酸(或其轉錄形式)的額外拷貝的任何過程。典型的擴增方法包括基于各種聚合酶的復制方法,包括聚合酶鏈反應(PCR)、連接酶介導的方法諸如連接酶鏈反應(LCR)和基于RNA聚合酶的擴增(例如,通過轉錄)法。"擴增子"為擴增得到的核酸,例如通過用任何可利用的擴增方法(例如,PCR、LCR、轉錄等)擴增模板核酸產生的核酸。
[0096]〃基因組核酸〃為序列上對應于細胞中可遺傳核酸的核酸。常見的實例包括核基因組DNA及其擴增子。在某些情況中,基因組核酸不同于剪接RNA或相應cDNA,即剪接的RNA或cDNA例如被剪接機制加工以除去內含子。基因組核酸任選包含不轉錄(例如,染色體結構序列、啟動子區、增強子區等)和/或不翻譯的序列(例如內含子),而剪接的RNA/cDNA—般不具有內含子。"模板基因組核酸"為用作擴增反應(例如,基于聚合酶的擴增反應,諸如PCR ;連接酶介導的擴增反應,諸如LCR ;轉錄反應等)中的模板的基因組核酸。
[0097]〃外源性核酸〃為對特定系統(例如,種質、細胞、個體等)而言在序列、基因組位置或它們兩者方面非天然的核酸。本文作為應用于多核苷酸或多肽所用的術語"外源性"或"異源性"一般意指以人工方式提供給生物系統(例如,細胞、個體等)并且對特定生物學系統而言為非天然的分子。該術語可以表示該相關物資源自非天然存在來源的來源,或可以指具有部分非天然構造、遺傳位置或排列的分子。
[0098]術語〃導入〃在指將異源性或外源性核酸轉移入細胞時意指使用任何方法將核酸摻入細胞。該術語涵蓋諸如〃轉染〃、〃轉化〃和〃轉導〃這類核酸導入方法。
[0099]本文所用的術語〃載體〃用于指將核酸區段轉入細胞的多核苷酸或其它分子。術語〃媒介(vehicle) 〃有時與〃載體(vector) 〃可以互換使用。載體任選包含介導載體維持并且能夠實現指定應用的部分(例如,復制必需序列、傳遞藥物或抗生素抗性的基因、多克隆位點、能夠表達所克隆基因的可操作連接的啟動子/增強子元件等)。載體通常衍生自質粒、噬菌體、或植物或動物病毒。〃克隆載體〃或〃穿梭載體〃或〃亞克隆載體〃包含有利于亞克隆步驟的可操作連接的部分(例如,包含多個限制性內切核酸酶位點的多克隆位點)。
[0100]本文所用的術語〃表達載體〃意指包含有利于特定宿主生物體中編碼序列表達的可操作連接的多核苷酸序列(例如,細菌表達載體或哺乳動物細胞表達載體)。有利于原核細胞中表達的多核苷酸序列一般包括,例如,啟動子、操縱基因(任選)和核糖體結合位點,通常還有其它序列。真核細胞可以使用啟動子、增強子、終止和聚腺苷酸化信號、和一般不同于原核細胞所用的其它序列。在一個任選的實施方案中,將對應于本文基因座的基因克隆入表達載體并且表達,其中將基因產物用于本文的方法和系統以便進行調控劑鑒定。
[0101]若特定的核酸是使用指定的核酸序列構建的,或者特定的核酸是使用指定的核酸構建的,則該特定的核酸〃·衍生自〃該指定的核酸。
[0102]〃基因〃為基因組中一起編碼一種或多種表達分子,例如RNA或多肽的一種或多種核苷酸序列。基因可以包括轉錄成RNA、隨后可翻譯成多肽序列的編碼序列,并且可以包括有助于基因復制或表達的相關結構序列或調控序列。本發明中所關注的基因包括包含圖1和/或2的基因座或與之緊密連鎖的那些。
[0103]〃基因型〃為一個或多個遺傳基因座上單個(單個成組)的遺傳組成。基因型由個體的一個或多個已知基因座的等位基因確定,一般為從其親代遺傳的等位基因的匯編。"單倍型"為個體在單一 DNA鏈上的多個遺傳基因座的基因型。一般而言,由單倍型描述的遺傳基因座在物理和遺傳上連鎖,即在相同染色體鏈上。
[0104]標志物或探針〃組〃意指標志物或探針的集合或組,或其衍生的數據,它們用于常用目的,例如鑒定具有特定表型(例如,乳腺癌抗性或易感性)的個體。通常將對應于標志物或探針或衍生自其應用的數據儲存在電子介質中。盡管一組中的成員各自具有在特定目的方面的應用,但是選自該組和亞組(其包括某些,但并非所有的標志物)的各個標志物也有效地實現特定目的。
[0105]〃查閱表〃為使一種數據形式與另一種數據形式或使一種或多種數據形式與該數據相關的預測結果建立相關性的表。例如,查閱表可以包括等位基因數據與包含一種或多種指定等位基因的個體有可能展示出的預測性狀之間的相關性。這些表可以并且一般為多維的,例如同時考慮多個等位基因,并且還任選考慮其它因素,諸如遺傳背景,例如在進行性狀預測時。
[0106]"計算機可讀介質"為可通過使用可利用或定制界面的計算機讀取的信息儲存介質。實例包括內存(例如ROM或RAM、閃存等)、光存儲介質(例如,CD-ROM)、磁存儲介質(計算機硬驅、軟盤等)、穿孔卡片和可商購的許多其它介質。信息可以在所關注的系統與計算機之間傳輸,傳輸出入計算機或出入計算機可讀介質以儲存或讀取所存儲的信息。這種傳輸可以為電子傳輸,或可以通過其它可利用的方法,諸如IR鏈接、無線連接等進行。
[0107]"系統指令"為可以由系統部分或完全執行的指令集。一般而言,該指令集作為系統軟件存在。
[0108]〃翻譯產物〃為作為核酸翻譯結果產生的產物(一般為多肽)。〃轉錄產物〃為作為核酸(例如,DNA)轉錄結果產生的產物(例如,RNA,任選包括mRNA,或例如催化性或生物學活性RNA)。
[0109]〃陣列〃為元件集合。該集合可以為空間排序的(〃樣式陣列〃)或混亂的(〃隨機樣式"陣列)。陣列可以形成或包含一種或多種功能性元件(例如,微陣列上的探針區)或它可以為非功能性的。
[0110]本文所用的術語"SNP"或〃單核苷酸多態性〃意指個體之間的遺傳變異;例如,可變的生物體DNA中的單一含氮堿基位置。本文所用的〃SNPs〃為SNP的復數。當然,當意指本文的DNA時,這類參比物可以包括DNA的衍生物,諸如擴增子、其RNA轉錄物等。
[0111]發明詳述
[0112]鐘述
[0113]本發明包括圖1和2的多態性(和包括多態性或與之鄰近的基因)與乳腺癌惡病質之間的新相關性。在這些基因或基因產物中及與之連鎖的某些等位基因可預測具有相關等位基因的個體發生乳腺癌的可能性。因此,通過任何可利用的方法檢測這些等位基因可以用于診斷目的,諸如對乳腺癌易感性的早期診斷、具有乳腺癌的患者的預后和有助于診斷,例如,當目前的標準不足以確定診斷時。
[0114]圖1或2的多態性、基因或基因產物與乳腺癌表型相關的鑒定還提供了用于篩選乳腺癌病癥的潛在調控劑的平臺。預計對應于圖1和2的多態性的任何基因或編碼蛋白質的活性的調控劑對乳腺癌有作用。因此,篩選方法、篩選系統等為本發明的特征。通過這些篩選手段鑒定的調控劑也為本發明的特征。
[0115]例如包括鑒定相關等位基因的探針、包裝材料和使相關等位基因的檢測與乳腺癌建立相關性的說明書的乳腺癌診斷和治療試劑盒也為本發明的特征。這些試劑盒還可以包括乳腺癌調控劑和/或關于使用常規方法治療患者的說明書。
[0116]鑒定乳腺癌惡病質的方法
[0117]正如所述的,本發明提供了圖1和2的某些基因或其它基因座與乳腺癌表型連鎖的發現。因此,通過檢測與相關表型正或負相關的標志物(例如,圖1或2中的SNP與之緊密連鎖的基因座),可以確定個體或群體是否可能包含這些表型。這為鑒定處于乳腺癌風險中的患者提供了增強的早期檢測選擇,從而在某些情況中有可能例如通過采取早期預防行動(例如,任何現有的療法,包括預防性手術、膳食、鍛煉、可利用的藥物等)預防癌癥的實際發生。此外,各種本文標志物的應用還為現存的鑒定患者是否患有特定形式乳腺癌的診斷技術增加了確定性。此外,是否存在該病的分子基礎的知識也可有助于例如通過提供患者對乳腺癌常規療法有響應的可能性如何的指征來確定患者的預后。還可以基于患者展示出何種類型的分子病癥來靶向疾病的治療。
[0118]用于檢測相關等位基因的檢測方法可以包括任何可利用的方法,例如,擴增技術。例如,檢測可以包括擴增多態性或與之相關的序列并且檢測所得擴增子。例如,該方法可以包括混合擴增引物或擴增引物對與分離自生物體或生物學樣品(例如包含SNP或其它多態性)的核酸模板,其中所述的引物或引物對與基因或緊密連鎖的多態性的至少一部分或與之鄰近的序列互補或部分互補。引物一般能夠啟動聚合酶在核酸模板上的核酸聚合。所述的引物或引物對例如在包含聚合酶和模板核酸的DNA聚合反應(PCR、RT-PCR等)中延伸而生成擴增子。通過可利用的檢測方法,例如測序、使擴增子與陣列雜交(或使擴增子附著在陣列上并且使探針與之雜交)、用限制酶消化擴增子(例如,RFLP)、實時PCR分析、單核苷酸延伸、等位基因特異性雜交等來檢測擴增子。
[0119]可以通過可鑒定等位基因與表型之間相關性的任何方法形成所檢測的多態性與性狀之間的相關性。最一般的情況是,這些方法包括參照包含多態性的等位基因與表型之間相關性的查閱表。該表可以包括多種等位基因-表型相關性的數據并且可以考慮到多種等位基因-表型相關性的疊加或其它高級作用,例如,通過使用統計學工具,諸如主要成分分析、啟發式算法等。
[0120]在這些方法的內容中,下列討論首先集中在標志物與等位基因如何連鎖和該現象如何應用于鑒定乳腺癌表型的方法的內容中,然后集中在標志物檢測方法。下面的別的部分討論了數據分析。
[0121 ] fa志物、連 鎖和等位基因
[0122]在傳統的連鎖(或關聯)分析中,無需染色體上基因的物理相關性的直接知識。孟德爾第一法則為成對特征的因素是分離的,意味著二倍體性狀的等位基因分離成兩個配子且然后分離成不同的子代。經典的連鎖分析可以視為對不同性狀的共分離的相對頻率的統計學描述。連鎖分析為性狀如何基于它們一起分離的頻率一起分組的充分表征的描述框架。即,如果兩個非等位基因的性狀以高于隨機的頻率一起遺傳,那么就說它們是"連鎖的〃。性狀一起遺傳的頻率為性狀如何緊密連鎖的主要度量,即以較高頻率一起遺傳的性狀比以較低(但仍然高于隨機)頻率一起遺傳的性狀更緊密連鎖。性狀連鎖是因為性狀潛在的基因彼此接近地位于同一染色體上。基因所在的染色體上的間隔越大,則它們一起分離的可能性越低,因為同源染色體在減數分裂過程中重組。因此,基因所在的染色體上的間隔越大,則在減數分裂過程中有重組事件的可能性越大,所述的重組會導致兩種基因彼此分離而進入子代。
[0123]連鎖(或關聯)的常見度量為性狀共分離的頻率。可以將此表述為共分離百分比(重組頻率),或同樣常用的以厘摩(CM)表示,它們實際上為重組頻率的倒數單位。CM以開拓性遺傳學家Thomas Hunt Morgan命名并且為遺傳重組頻率的度量單位。I個cM等于因單代(single generation)中的重組,一個遺傳基因座上的性狀與另一基因座上的性狀分離的機會為1% (這意味著這些性狀99%的機會一起分離)。因為染色體距離與性狀間重組事件頻率大致成正比,所以存在與重組頻率相關的近似物理距離。例如,在人體中,IcM平均與約I百萬個堿基對(IMbp)相關。[0124]標志物基因座自身為性狀并且可以按照標準連鎖分析,通過在分離過程中示蹤標志物基因座來評價。因此,在本發明的上下文中,I CM等于因單代中的重組,標志物基因座與另一基因座(可以為任何其它性狀,例如另一種標志物基因座,或編碼乳腺癌QTL的另一種性狀基因座)分離的機會為1%。本文的標志物,例如,圖1和2中所列的那些,可以與乳腺癌相關。這意味著所述的標志物包含乳腺癌的QTL或與之足夠鄰近,即它們自身可以用作性狀的預測物。這在疾病診斷方面極為有用。
[0125]已經在病例(乳腺癌患者)與對照群體中將圖1和2的多態性鑒定為更普遍的。與所關注的性狀基因座連鎖的任何標志物(例如,在目前情況中為乳腺癌的QTL或鑒定的連鎖標志物基因座,例如,如在圖1和2中)可以用作該性狀的標志物。因此,在圖1和2中注意到的外,與這些圖中詳細列舉的標志物緊密連鎖的其它標志物也可以有用地預測圖中所不的標志物等位基因(和由此的相關表型性狀)的存在。在它們足夠鄰近指定基因座,使得它們展示出與指定基因座的低重組頻率時,這類連鎖的標志物特別有用,。在本發明中,這類緊密連鎖的標志物為本發明的特征。緊密連鎖的基因座展示出與指定標志物的重組頻率為約20%或以下(指定基因在指定標志物的20cM內)。換言之,緊密連鎖的基因座至少80%的機會共分離。更優選重組頻率為10%或以下,例如,9%,8%,7%,6%,5%,4%,3%,2%,1%, 0.5%, 0.25%或0.1%或以下。在一種典型類型的實施方案中,緊密連鎖的基因座彼此在5cM或以下內。
[0126]正如本領域技術人員認識到的,重組頻率(和作為結果的圖位置)可以根據所用圖(和圖上的標志物)而改變。與圖1和2中鑒定的標志物緊密連鎖的(例如,在約20cM內,更優選在約IOcM內,更優選在5cM內)別的標志物易于用于鑒定乳腺癌惡病質的QTL。
[0127]在標志物基因座與靶基因座(例如,乳腺癌表型的QTL,或可選擇地,自身與這類QTL連鎖的其它標志物基因座)(所述標志物基因座作為所述靶基因的標志物)緊密連鎖時,該標志物基因座尤其可用于本發明。標志物與編碼或影響表型性狀的靶基因座連鎖得越緊密,則該標志物作為靶基因座的指示物越好(因靶基因座與標志物之間的交叉(cross-over)頻率下降)。因此,在一個實施方案中,緊密連鎖的基因座諸如標志物基因座和第二種基因座(例如圖1和2的指定標志物基因座和別的第二種基因座)展示出約20%或以下,例如15%或以下,優選10`%或以下,更優選約9%或以下,更優選約8%或以下,更優選約7%或以下,更優選約6%或以下,更優選約5%或以下,更優選約4%或以下,更優選約3%或以下且更優選約2%或以下的基因座間交叉頻率。在非常優選的實施方案中,相關基因座(例如,標志物基因座和靶基因座諸如QTL)展示出約1%或以下,例如約0.75%或以下,更優選約0.5%或以下,或更優選約0.25%或0.1%或以下的重組頻率。因此,基因座相距約 20cM, 19cM, 18cM,17cM,16cM,15cM,14cM,13cM,12cM,IlcM,IOcM,9cM,8cM,7cM,6cM,5cM,4cM,3cM,2cM,lcM,0.75cM,0.5cM,0.25cM,0或0.1cM以下。換言之,認為位于相同染色體上并且在兩個基因座之間的重組以低于20%(例如,約19%,18%,17%,16%,15%,14%,13%,12%,11%,10%, 9%, 8%, 7%, 6%, 5%, 4%, 3%, 2%, 1%,0.75%, 0.5%, 0.25%, 0.1% 或以下)的頻率出現的這類距離上的兩個基因座彼此〃鄰近〃。在一個方面中,連鎖標志物彼此在IOOkb內(在人體中對應于約0.lcM,這取決于局部重組率),例如,50kb,乃至20kb或以下。
[0128]當涉及兩種遺傳元件,諸如促成乳腺癌的遺傳元件與鄰近標志物之間的相關性時,〃偶聯〃相連鎖表示位于基因座上的〃有利〃等位基因以物理方式結合在與相應的連鎖標志物基因座的"有利"等位基因相同的染色體鏈上的狀態。在偶聯相中,兩種有利的等位基因一起通過遺傳該染色體鏈的子代遺傳。在"排斥"相連鎖中,在所關注的基因座(例如,乳腺癌的QTL)上的〃有利〃等位基因以物理方式與位于鄰近標志物基因座上的〃不利〃等位基因連鎖,并且兩個〃有利〃的等位基因不一起遺傳(即兩個基因座彼此〃異相")。
[0129]在示蹤基因組和相應表達的核酸和多肽中的SNP和其它多態性外,個體或群體之間的mRNA或蛋白質形式的圖1和2基因產物的表達水平差異也與乳腺癌相關。因此,本發明的標志物可以包括如下的任意種,例如:基因組基因座、轉錄的核酸、剪接的核酸、表達的蛋白質、轉錄的核酸的水平、剪接的核酸的水平和表達的蛋白質的水平。
[0130]標志物擴增策略
[0131]用于擴增標志物(例如,標志物基因座)的擴增引物和用于檢測這類標志物或對樣品在多種標志物等位基因方面進行基因分型合適探針為本發明的特征。在圖1和2中,提供了用于擴增的特定基因座及這類引物設計中已知的側翼序列。例如,用于遠程PCR的引物選擇描述在2002年I月9日提交的USSN10/042,406和2002年9月5日提交的USSN10/236, 480中;就近程PCR而言,2003年I月14日提交的USSN10/341,832中提供了有關引物選擇的指導原則。此外,存在公眾可用于進行引物設計的程序,諸如"Oligo"。使用這類可利用的引物選擇和設計軟件、圖1和2中提供的公眾可利用的人類基因組序列和多態性位置,本領域技術人員可以構建引物以便擴增本發明的SNP。此外,可以理解用于檢測包含SNP的核酸(例如,包含SNP的擴增子)的精確探針可以改變,例如,可以鑒定所檢測的標志物擴增子區的任何探針可以與本發明結合使用。此外,檢測探針的構造當然可以改變。因此,本發明并不限于本文所述的序列。
[0132]實際上,可以理解擴增并非標志物檢測所要求的-例如,可以單純通過對基因組DNA樣品進行Southern印跡來直接檢測未擴增的基因組DNA。用于進行Southern印跡、標準擴增(PCR、LCR等)和許 多其它核酸檢測方法的規程為充分確立的并且例如教導在下列文獻中:Sambrook 等,Molecular Cloning-A Laboratory Manual (3rd Ed.), Vol.1-3,Cold Spring Harbor Laboratory, Cold Spring Harbor, New York,2000(〃Sambrook〃);Current Protocols in Molecular Biology, F.M.Ausubel 等,eds., Current Protocols,Greene Publishing Associates, Inc.和 John ffiley&Sons, Inc.的合作項目,(增補至2002) ("Ausubel"))和 PCR Protocols A Guide to Methods and Applications(Innis 等eds)Academic Press Inc.San Diego, CA(1990)(Innis).[0133]在擴增/檢測方法中,例如,還可以通過進行檢測產物形成的實時擴增反應來省略單獨的檢測探針,其中在摻入產物時修飾相關擴增引物,將標記的核苷酸摻入擴增子,或監測與未擴增的前體相比擴增子的分子旋轉特性的改變(例如,通過熒光偏振)。
[0134]一般而言,通過本領域中任何可利用的確立的方法檢測分子標志物,包括,但不限于等位基因特異性雜交(ASH)、檢測單核苷酸延伸、陣列雜交(任選包括ASH)或其它檢測單核苷酸多態性(SNP)的方法、擴增片段長度多態性(AFLP)檢測、擴增可變序列檢測、隨機擴增多態性DNA(RAPD)檢測、限制性片段長度多態性(RFLP)檢測、自維持序列復制檢測、單一序列重復(SSR)檢測、單鏈構象多態性(SSCP)檢測、同工酶標志物檢測、Northern分析(其中將表達水平用作標志物)、mRNA或cDNA的定量擴增等。盡管圖中提供的例示性標志物為SNP標志物,但是上述任何標志物類型均可以用于本發明的上下文中,以便鑒定與乳腺癌表型相關的連鎖基因座。
[0135]用于標志物檢測的例示技術
[0136]本發明提供了包含乳腺癌表型的QTL或與之連鎖的分子標志物。這些標志物應用于疾病惡病質診斷、預后、治療等。并非意圖將本發明限于用于檢測這些標志物的任何特定方法。
[0137]可以通過大量本領域中充分確立的方法來檢測對應于群體成員之間的遺傳多態性的標志物(例如,基于PCR的序列特異性擴增、限制性片段長度多態性(RFLP)、同工酶標志物、Northern分析、等位基因特異性雜交(ASH)、基于陣列的雜交、擴增可變基因組序列、自維持序列復制、單一序列重復(SSR)、單核苷酸多態性(SNP)、隨機擴增的多態性DNA("RAPD")或擴增片段長度多態性(AFLP))。在另一個實施方案中,單純通過測定多態性標志物區的核苷酸序列來確定分子標志物的存在與否。任何這些方法均易于適合于高通量分析。
[0138]用于檢測遺傳標志物的某些技術利用探針核酸與對應于遺傳標志物的核酸(例如,使用基因組DNA作為模板產生的擴增的核酸)的雜交。雜交方式,包括,但不限于:溶液相、固相、混合相或原位雜交測定法,可用于等位基因檢測。應用于核酸雜交的廣泛指導原貝丨丨見 Ti issen (1993) Laboratory Techniques in Biochemistry and MolecularBiology-Hybridization with Nucleic Acid Probes Elsevier,New York 以及 Sambrook,Berger 和 Ausubel。
[0139]例如,包含限制性片段長度多態性(RFLP)的標志物例如通過使一般為待檢測核酸的亞片段(或對應于亞片段的寡核苷酸)的探針與限制性消化基因組DNA雜交來檢測。選擇限制酶以便提供在不同個體或群體中有至少兩種可選擇的(或多態性)長度的限制片段。確定對標志物各等位基因產生有用片段的一種或多種限制酶為本領域眾所周知的簡便規程。在根據長度在適當基質(例如,瓊脂糖或聚丙烯酰胺)中分離并且轉至膜(例如,硝化纖維素、尼龍等)后,在導致探針與靶物平衡結合的條件下雜交標記的探針,隨后通過洗漆除去過量的探針。
[0140]可以克隆和/或合成用于標志物基因座的核酸探針。任何合適的標記物均可以與本發明的探針聯用。適用于核酸探針的可檢測標記物包括,例如,可通過分光光度法、放射性同位素、光化學、生物化學、免疫化學、電、光學或化學方式檢測的任何組合物。有用的標記物包括使用標記的鏈霉親合素綴合物染色的生物素、磁珠、熒光染料、放射性標記物、酶、和比色標記物。其它標記物包括結合用熒光團、化學發光劑和酶標記的抗體的配體。探針還可以構成用于產生放射性標記的擴增子的放射性標記的PCR引物。用于標記核酸的標記策略和相應的檢測策略可以見例如Haugland(2003) Handbook of Fluorescent Probes andResearch Chemicals Ninth Edition, Molecular Probes, Inc.(Eugene OR)。有關標志物檢測策略的其它細節可以在下文中找到。
[0141]基于擴增的檢測方法
[0142]PCR、RT-PCR和LCR特別廣泛地用作擴增所關注的核酸(例如,包含標志物基因座的那些)的擴增和擴增-檢測方法,從而有利于檢測所關注的核酸。有關這些和其它擴增方法的詳細描述可以在任何多種標準教科書中找到,包括,例如,Sambrook, Ausubel和Berger0許多可利用的生物學教科書還擴展了有關PCR和相關擴增方法的討論。本領域技術人員可以理解基本上可以將任何RNA轉化成適合于限制性消化、PCR延伸、和使用逆轉錄酶和聚合酶測序(〃逆轉錄-PCR或〃RT-PCR")的雙鏈DNA。另外參見上述的Ausubel,Sambrook和Berger。這些方法還可以用于定量擴增mRNA或相應的cDNA,從而提供個體中對應于基因產物的mRNA表達水平的指示,所述的基因產物對應于圖1和2的基因或基因產物。個體、家族、品系和/或群體之間的這些基因的表達水平差異可以用作乳腺癌表型的標志物。
[0143]實時擴增/檢測方法
[0144]在一個方面中,例如,使用分子信標或TaqMan?探針對本文所述的擴增混合物進行實時PCR或LCR。分子信標(MB)為在適當雜交條件下自雜交而形成莖環結構的寡核苷酸或PNA。MB在寡核苷酸或PNA末端上具有標記物和猝滅劑;由此在允許分子內雜交的條件下,標記物一般被猝滅劑猝滅(或至少在其熒光方面發生改變)。在MB未展示出分子內雜交的條件下(例如在擴增過程中當結合靶核酸,例如擴增子區時),MB標記物未猝滅。有關制備和使用MB的標準方法的詳細描述在文獻中充分確立,并且MB可購自許多商品試劑來源。另外,參見例如,Leone 等(1995) "Molecular beacon probes combined withamplification by NASBA enable homogenous real-time detection of RNA."NucleicAcids Res.26:2150-2155 ;Tyagi 和 Kramer (1996)"Molecular beacons: probesthat fluoresce upon hybridization〃Nature Biotechnology14:303-308 ;Blok和 Kramer(1997) "Amplifiable hybridization probes containing a molecularswitch"Mol Cell Probesl1: 187-194 ;Hsuih 等(1997)"Novel,ligation-dependentPCR assay for detection of hepatitis C in serum〃J Clin Microbiol34:501-507 ;Kostrikis 等(1998)"Molecular beacons: spectral genotyping of humanalleles"Science279:1228-1229 ;Sokol 等(1998)"Real time detection of DNA:RNAhybridization in living cells〃Proc.Natl.Acad.Sd.U.S.A.95:11538-11543 ;Tyagi等(1998)"Multicolor `molecular beacons for allele discrimination"NatureBiotechnologyl6:49-53:Bonnet 等(1999)"Thermodynamic basis of the chemicalspecificity of structured DNA probes〃Proc.Natl.Acad.Sd.U.S.A.96:6171-6176 ;Fang 等(1999)"Designing a novel molecular beacon for surface-1mmobilized DNAhybridization studies〃J.Am.Chem.Soc.121:2921-2922:Marras 等(1999)"Multiplexdetection of single-nucleotide variation using molecular beacons〃Genet.Anal.Biomo1.Eng.14: 151-156;和 Vet 等(1999)"Multiplex detection of fourpathogenic retroviruses using molecular beacons〃Proc.Natl.Acad.Sc1.U.S.A.96:6394-6399。有關MB構建和應用的額外詳細描述可以在專利文獻中找到,例如,Tyagi等的 USP5,925,517 (1999 年 7 月 20 日),標題為"Detectably labeled dual conformationoligonucleotide probes, assays and kits" ;Tyagi 等的 USP6,150,097(2000 年 11 月21 日),標題為"Nucleic acid detection probes having non-FRET fluorescencequenching and kits and assays including such probes〃 和 Tyagi 等的USP6,037,130(2000 年 3 月 14 日),標題為"Wavelength-shifting probes and primersand their use in assays and kits〃。[0145]還可以按照本發明使用通常稱作"TaqMan?"探針的雙重標記的熒光寡脫氧核苷酸探針進行PCR檢測和定量。這些探針由使用兩種不同熒光染料標記的短(例如,20-25個堿基)寡核苷酸組成。在每個探針的5’端上為報道染料,并且在每個探針的3’端上發現猝滅染料。寡核苷酸探針序列與存在于PCR擴增子中的內部靶序列互補。當該探針完整時,在兩個熒光團之間發生能量轉移并且由猝滅劑通過FRET猝滅來自報道分子的發射。在PCR的延伸期過程中,探針因用于反應的聚合酶的5’核酸酶活性而裂解,由此從寡核苷酸-猝滅劑中釋放報道分子并且產生報道分子發射強度的增加。因此,TaqMan?探針為具有標記物和猝滅劑的寡核苷酸,其中標記物在擴增過程中通過擴增所用聚合物的外切核酸酶作用而釋放。這在合成過程中提供了對擴增的實時測量。各種TaqMan?試劑為商購的,例如購自 Applied Biosystems (Division Headquarters, Foster City, CA)并且購自各種專業供應商,諸如Biosearch Technologies (例如,黑洞粹滅劑探針)。有關雙重標記物探針策略的額外詳細描述可以在例如W092/02638中找到。
[0146]其它類似的方法包括,例如,使用例如U.S.6,174,670中所述的”LightCycler?”形式的兩個相鄰雜交探針之間的熒光共振能量轉移。
[0147]基于陣列的標志物檢測
[0148]可以使用商購陣列,例如購自Affymetrix(Santa Clara, CA)或其它制造商的陣列進行基于陣列的檢測。有關核酸陣列操作的綜述包括Sapolsky等(1999) ^High-throughput polymorphism screening and genotyping with high-densityoligonucleotide arrays"Genetic Analysis:Biomolecular Engineering 14:187-192 ;Lockhart (1998)"Mutant yeast on drugs"Nature Medicine4: 1235-1236 ;Fodor (1997)"Genes,Chips and the Human Genome〃FASEB Journal 11:A879 ;Fodor (1997) "Massively Parallel Genomics.^Science.277:393-395 ;和 Chee 等(1996)"Accessing Genetic Information with High-Density DNA Arrays〃Science274:610-614。基于陣列的檢測因基于陣列的檢測的固有高流通量性質而成為用于鑒定樣品中本發明標志物的優選方法。
[0149]各種探針陣列已經描述在文獻中并且可以用于本發明上下文中檢測可能與本文所述表型相關的標志物。例如,DNA探針陣列芯片或較大的DNA探針陣列晶片(否則,可以通過打斷晶片而獲得各個體芯片)用于本發明的一個實施方案。DNA探針陣列晶片一般包含玻璃晶片,其上放置了高密度DNA探針(短DNA片段)陣列。這些晶片各自可以保持例如約6000萬個用于識別較長樣品DNA序列(例如,來自個體或群體,例如,包含所關注的標志物)的DNA探針。用玻璃晶片上的DNA探針組識別樣品DNA通過DNA雜交進行。當DNA樣品與DNA探針陣列雜交時,樣品結合與樣品DNA序列互補的那些探針。通過評價個體樣品DNA與那些探針更穩固地雜交,有可能確定已知的核酸序列是否存在于樣品中,由此確定核酸中發現的標志物是否存在。還可以使用這一手段通過控制雜交條件以允許區別單一核苷酸,例如,用于SNP鑒定和一種或多種SNP的樣品基因分型來進行ASH。陣列提供了一種同時(或串連)檢測多個多態性標志物的便利性實施方案。例如,可以構建乳腺癌易感性檢測陣列,其中同時檢測任何或所有本文所述的多態性(或與之連鎖的多態性)以便指定乳腺癌易感性表型。當然,可以類似地使用任何檢測技術(PCR、LCR、實時PCR等),例如,使用多重擴增/檢測反應或單純通過運行幾個單獨的反應,例如,同時的或串連的。[0150]DNA探針陣列在獲得等位基因信息中的應用一般包括下列一般步驟:設計和制備DNA探針陣列,制備樣品,使樣品DNA與陣列雜交,檢測雜交事件和數據分析以便測定序列。使用來自半導體生產的改良方法制備優選的晶片以便獲得成本效率和高質量并且可購自例如 Affymetrix, Inc (Santa Clara, California)。
[0151]例如,可以通過光定向的化學合成方法制備探針陣列,所述的光定向的化學合成方法合并了固相化學合成與半導體工業所采用的光刻制造技術。由于使用一系列光刻罩來限定芯片暴露點,隨后進行特定的化學合成步驟,所以該方法構建了高密度寡核苷酸陣列,在該陣列中每個探針位于預定的位置。可以在大玻璃晶片上同時合成多個探針陣列。這種平行方法提高了再現性并且有助于實現規模化經濟。
[0152]一旦制成,DNA探針陣列就可以用于獲得有關所關注標志物的存在和/或表達水平的數據。可以通過標準生化方法用生物素和/或熒光報道基團標記DNA樣品。將標記的樣品與陣列一起孵育,并且使樣品的區段與陣列上的互補序列結合或雜交。可以洗滌和/或染色陣列以便產生雜交模式。然后掃描該陣列并且根據從熒光報道基團中發射的光檢測雜交模式。有關這些規程的額外詳細描述可以在下文的實施例中找到。因為已知陣列上每個探針的身份和位置,所以可以確定應用于陣列的樣品中的DNA序列的性質。當這些陣列用于基因分型實驗時,它們可以稱作基因分型陣列。如上所述,可以檢測例如圖1和/或圖2中本文所述的任何或所有多態性的基因型,例如以便指定乳腺癌惡病質表型。
[0153]將待分析的核酸樣品分離,擴增且一般用生物素和/或熒光報道基團標記。然后使用流控技術站和分子雜交儀將標記的核酸樣品與陣列一起孵育。可以根據檢測方法的需要對陣列進行洗滌和/或染色或復染。在雜交、洗滌和染色后,將陣列插入檢測雜交模式的掃描儀。將雜交數據采集為發射自熒光報道基團的光,所述的熒光報道基團已經摻入現在與探針陣列結合的標記核酸。最明顯地與標記核酸匹配的探針產生強于具有錯配的那些的信號。由于已知陣列上每個探針的序列和位置,所以可以根據互補性鑒定應用于探針陣列的核酸的身份。
[0154]在一個實施方案中,可以差別標記兩種DNA樣品并且使其與單組設計的基因分型陣列雜交。在這種方式中,可以從相同的物理陣列中獲得兩組數據。可以使用的標記物包括,但不限于cychrome、熒光素或生物素(隨后在雜交后用藻紅蛋白-鏈霉親合素染色)。雙色標記描述在美國專利No,6,342,355中,將該文獻完整地引入本文作為參考。可以掃描每個陣列,使得同時檢測來自兩種標記物的信號或將它們掃描兩次以便分別檢測每個信號。
[0155]對測試標志物存在的各個體用掃描儀采集所有標志物的強度數據。測得的強度為指示存在于指定個體的樣品中特定標志物的量的度量(存在于個體中的等位基因的表達水平和/或拷貝數,取決于是分析基因組核酸還是表達的核酸)。這可以用于確定個體在左關注的標志物方面是純合型的還是雜合型的。處理強度數據以便提供有關各種強度的相應標志物信息。
[0156]有關擴增的可奪序列、SSR、AFLP、ASH、SNP和同工酶標志物的別的細節
[0157]擴增的可變序列意指在同一物種成員之間表現出高度核酸殘基變異性的基因組的擴增序列。所有生物體均具有可變基因組序列且每種生物體(除克隆,例如克隆的細胞外)均具有不同組的可變序列。 一旦鑒定,則特定可變序列的存在可以用于預測表型性狀。優選的,來自基因組的DNA用作使用位于DNA可變序列側翼的引物擴增的模板。擴增可變序列且然后測序。
[0158]可選擇地,自維持序列復制可以用于鑒定遺傳標志物。自維持序列復制意指使用靶核酸序列進行核酸擴增的方法,所述的靶核酸序列在體外基本上等溫條件下通過使用三種涉及逆轉錄病毒復制的酶活性呈指數復制:(I)逆轉錄酶,(2) RNA酶H和(3) DNA-依賴性RNA 聚合酶(Guatelli 等(1990)Proc Natl Acad Sci USA87:1874)。通過模擬經 cDNA 中間體的RNA復制的逆轉錄病毒策略,該反應累積了原始靶標的cDNA和RNA拷貝。
[0159]擴增片段長度多態性(AFLP)也可以用作遺傳標志物(Vos等(1995)迦過AcidsRes23:4407)。術語〃擴增片段長度多態性〃意指在用限制性內切核酸酶切割之前或之后擴增的所選限制性片段。擴增步驟容許易于檢測特定限制片段。AFLP容許檢測大量的多態性標志物并且已經用于遺傳作圖(Becker等(1995) Mol Gen Genet249:65;和Meksem等(1995)Mol Gen Genet249:74)。
[0160]等位基因特異性雜交(ASH)可以用于鑒定本發明的遺傳標志物。ASH技術基于短的單鏈寡核苷酸探針與完全互補單鏈靶核酸的穩定退火。可以用附著于探針的同位素或非同位素標記物進行檢測。
[0161]就每種多態性而言,設計兩種或多種不同的ASH探針,它們具有相同的DNA序列,但不包括多態性核苷酸上的序列。每個探針具有與一種等位基因序列確切的同源性,使得該探針系列可以區分所有已知的可選等位基因序列。每種探針與靶DNA雜交。使用適當的探針設計和雜交條件,探針與靶DNA之間的單堿基錯配會防止雜交。按照這種方式,僅可選探針之一與對等位基因而言純合或均質的靶樣品雜交。對兩種等位基因而言雜合或異質的樣品與兩種可選探針均雜交。
[0162]ASH標志物用作顯性標志物,其中根據僅有一種探針雜交或不雜交確定僅一種等位基因的存在與否。可以根據無雜交推斷可選的等位基因。ASH探針和靶分子任選為RNA或DNA ;靶分子為超過與探針互補序列的任何核苷酸長度;設計所述探針以便與DNA靶標的任一鏈雜交;探針的大小范圍與`各種嚴格雜交條件一致等。
[0163]PCR容許在相對小體積中由低濃度的核酸擴增ASH的靶序列。否則,用限制性內切核酸酶消化來自基因組DNA的靶序列并且通過凝膠電泳進行大小分離。雜交一般如美國專利5,468,613中所述與結合至膜表面的靶序列進行,ASH探針序列可以與膜結合。
[0164]在一個實施方案中,一般如下獲得ASH數據,即使用PCR由基因組DNA擴增核酸片段(擴增子),按照斑點印跡形式將該擴增子靶DNA轉至膜上,使標記的寡核苷酸探針與擴增子靶標雜交,并且通過放射自顯影術觀察雜交斑點。
[0165]單核苷酸多態性(SNP)為由基于單核苷酸區分的共有序列組成的標志物。一般而言,通過包含SNP的擴增子在例如丙烯酰胺凝膠上的差別遷移模式來檢測這一差別。然而,可選的檢測方式,諸如雜交,例如,ASH或RFLP分析或基于陣列的檢測也是合適的。
[0166]例如,可以將同工酶標志物用作遺傳標志物,以便示蹤與本文所述標志物連鎖的同工酶標志物。同工酶為彼此在其氨基酸和由此的其核酸序列方面不同的酶的多種形式。某些同工酶為包含略微不同亞基的多聚體酶。其它同工酶為多聚體的或單體的,但已經在氨基酸序列的不同位點上從酶原中裂解。可以在蛋白質水平上表征和分析同工酶,或者,可以確定在核酸水平上不同的同工酶。在這類情況中,本文所述任何基于核酸的方法可用于分析同工酶標志物。
[0167]有關核酸擴增的別的細節
[0168]正如注意到的,核酸擴增技術,諸如PCR和LCR為本領域眾所周知的并且可以應用于本發明,以便擴增和/或檢測所關注的核酸,諸如包含標志物基因座的核酸。在上述參考文獻例如Innis, Sambrook, Ausubel和Berger中可以找到足以指導本領域技術人員通過這類體外方法的技術的實例,包括聚合酶鏈反應(PCR)、連接酶鏈反應(LCR)、Q3-復制酶擴增和其它RNA聚合酶介導的技術(例如NASBA)。額外的詳細描述在如下文獻中找到=Mullis 等(1987)美國專利 N0.4,683,202 ;Arnheim&Levinson(1990 年10 月 I 日)C&EN36~47:The Tournal Of NIH Research(1991)3,81-94:Kwoh 等(1989)Proc.Natl.Acad.Sc1.USA86,1173 ;Guatelli 等(1990) Proc.Natl.Acad.Sc1.USA87,1874 ;Lomell 等(1989)T.Clin.Chem35,1826 ;Landegren 等(1988)Science241,1077-1080 ;VanBrunt(1990)Biotechnology8, 291-294 ;ffu 和 Wallace(1989)Gene4, 560 ;Barringer 等(1990)Gene89,117 和 Sooknanan 和 Malek(1995)Biotechnology13:563-564。Cheng 等(1994)Nature369:684及其中的參考文獻中進一步概括了通過PCR擴增大核酸的改進方法,其中生成達40kb的PCR擴增子,它可用于與本文多態性(圖1和/或2)連鎖的基因的定位克隆的情況中。例如,在下列文獻中披露了遠程PCR方法:2002年I月9日提交的美國專利申請N0.10/042,406,標題為"Algorithms for Selection of Primer Pairs" ;2002年9月9曰提交的美國專利申請N0.10/236,480,標題為〃Methods for Amplification ofNucleic Acids";和2004年 5 月 25 日授權的美國專利N0.6,740,510,標題為〃Methods forAmplification of Nucleic Aci ds"。USSN10/341, 832 (1/14/03 提交)中還提供了有關進行近程PCR的引物挑取法的詳細描述。
_9] 蛋白質表達產物的檢測
[0170]蛋白質,諸如圖1和/或2中注意到的基因編碼的那些由核酸,包括包含與本文關注的表型相關的標志物的那些編碼。關于分子生物學的基本范例的說明,包括DNA表達(轉錄和/或翻譯)成RNA,進而成蛋白質,參見Alberts等(2002)Molecular Biologyof the CelUillEdition Taylor 和 Francis, Inc., ISBN:0815332181 ("Alberts")和 Lodish 等(1999)Molecular Cell Biology, ^Edition W H Freeman&Co, ISBN:071673706X(〃LOdish〃)。因此,例如,可以通過檢測個體或群體之間的不同蛋白質同種型或通過檢測這類所關注的蛋白質(例如,圖1和/或2的基因產物)的差別存在、不存在或表達水平,將對應于圖1和/或2中的基因的蛋白質作為標志物來檢測。
[0171]已知各種蛋白質檢測方法并且可以用于區分標志物。除上文的各種參考文獻外,各種蛋白質操作和檢測方法也為本領域中公知的,包括,例如,下列文獻中所述的那些:R.Scopes, Protein Purification, Springer-Verlag, N.Y.(1982) ;Deutscher,Methods in Enzymology Vol.182:Guide to Protein Purification, Academic Press,Inc.N.Y.(1990):Sandana (1997)Bioseparation of Proteins, Academic Press,Inc.;Bollag 等(1996)Protein Methods, 2ihEclition ffiley-Liss, NY ;ffalker (1996)The Protein Protocols Handbook Humana Press, NJ;Harris 和 Angal (1990)ProteinPurification Applications:A Practical Approach IRL Press, Oxford, Oxford,England ;Harris 和 Angal Protein Purification Methods:A Practical ApproachIRL Press, Oxford, Oxford, England:Scopes (1993)Protein Purification!Principlesand PracticeSlllEdition Springer Verlag, NY ; Janson 和 Ryden (1998) ProteinPurification!Principles,High Resolution Methods and Applications, SecondEdition ffiley-VCH, NY;和 Walker(1998)Protein Protocols on CD-ROM Humana Press,NJ ;和其中引述的參考文獻。有關蛋白質純化和檢測方法的額外詳細描述可以在SatinderAhuja ed., Handbook of Bioseparations, Academic Press (2000)中找至丨J。
[0172]描述了同時檢測許多蛋白質的〃蛋白質組〃檢測方法。它們可以包括各種多維電泳方法(例如,2-d凝膠電泳)、基于質譜的方法(例如,SELD1、MALD1、電噴射等)或表面等離振子共振法。例如,在MALDI中,通常將樣品與適當的基質混合,置于探針表面上,并通過激光解吸/電離檢驗。MALDI的技術為本領域眾所周知的。例如,參見美國專利5,045,694 (Beavis等),美國專利5,202,561 (Gleissmann等)和美國專利6,111,251 (Hillenkamp)。類似地,就SELDI而言,使第一個等分試樣接觸固相支持體結合的(例如,基質結合的)吸附劑。基質一般為可以使用氣相離子分光光度計以可查詢的關系定位的探針(例如,生物芯片)。SELDI也為眾所周知的技術并且已經應用于診斷蛋白質組學。例如,參見 Issaq 等(2003) 〃SELDI_T0F MS for Diagnostic Proteomics^AnalyticalChemistry75:149A_155A。
[0173]一般而言,上述方法可以用于檢測蛋白質的不同形式(等位基因)和/或可以用于檢測個體、家族、品系、群體等之間的蛋白質的不同表達水平(可能是因為等位基因差異)。即使所編碼的差異表達的蛋白質自身相同,但是受環境因素控制的(when controlledfor environment factors)表達水平的差異可以指示位于所關注基因的QTL上的不同等位基因。例如,如果在非編碼區,例如諸如控制基因表達的啟動子或增強子這類區中存在基因的多種等位基因形式,那么上述情況發生。因此,可以將檢測差異表達水平用作檢測等位基因差異的方法。
[0174]在本發明的其它方面中,包含與乳腺癌表型相關的核酸的、與該核酸連鎖不平衡的、或在該核酸控制下的基因可以表現出差異等位基因表達。本文所用的〃差異等位基因表達"意指存在于細胞中的單一基因的多個等位基因的等位基因表達上的定性和定量差另IJ。照此,展示出差異等位基因表達的基因可以具有與相同細胞/組織中第二種等位基因相比以不同時間或水平表達的一種等位基因。例如,盡管兩者均為相同基因的等位基因并且存在于相同細胞/組織中,但是與乳腺癌表型相關的等位基因可以以高于或低于與乳腺癌表型無關的等位基因的水平得到表達。差異等位基因表達和分析方法詳細披露在2003年5月13日提交的美國專利申請號10/438,184和2004年5月12日提交的美國專利申請號 10/845,316 中,二者標題均為〃Allele-specific expression patterns"。與乳腺癌表型相關的一種或多種核酸或其片段、衍生物、多態性、變體或互補物的差異等位基因表達模式的檢測對于乳腺癌易感性/抗性是預后性的和診斷性的;同樣,檢測與乳腺癌表型相關的一種或多種核酸或其片段、衍生物、多態性、變體或互補物的差異等位基因表達模式對于乳腺癌和乳腺癌治療效果是預后性的和診斷性的。
[0175]有關適合于篩選的標志物類型的別的細節
[0176]為與本文的表型的相關性篩選的生物學標志物可以為可以通過篩選檢測的任何那些類型的標志物,例如,遺傳標志物,諸如遺傳基因座的等位基因變體(例如,像在SNP中)、表達標志物(例如,mRNA和/或蛋白質的存在或其數量)、諸如此類。
[0177]在本發明方法中待擴增、轉錄、翻譯和/或檢測的所關注的核酸基本上可以為任何核酸,不過,衍生自人體來源的核酸尤其與檢測涉及疾病診斷和臨床應用的標志物相關。可得到許多核酸和氨基酸(核酸序列可以通過逆翻譯由其推導)的序列,包括圖1和/或2的基因/蛋白質。已知核酸的公用序列全集包括GenBank? EMBL、DDBJ和NCBI。其它全集易于通過搜索互聯網鑒定。待擴增、轉錄、翻譯和/或檢測的核酸可以為RNA(例如,其中擴增包括RT-PCR或LCR、Van-GeIder Eberwine反應或Ribo-SPIA)或DNA (例如,擴增的DNA、cDNA或基因組DNA)乃至任何其類似物(例如,用于檢測合成的核酸或其類似物,例如,其中所關注的樣品包括人工核酸或用于衍生或合成人工核酸)。可以將個體或群體之間核酸序列或表達水平中的任何變異作為標志物來檢測,例如,突變、多態性、單核苷酸多態性(SNP)、等位基因、同種型、RNA或蛋白質的表達等。可以檢測序列、表達水平或基因拷貝數的變異作為可能與乳腺癌表型相關的標志物來檢測。
[0178]例如,本發明的方法可用于對衍生自患者的樣品篩選所關注的標志物核酸,例如,所述的樣品來自患者的體液(血液、唾液、尿液等)、活檢、組織、和/或廢物。因此,可通過本發明的方法對組織活檢、糞便、痰、唾液、血液、淋巴、淚液、汗液、尿液、陰道分泌物、射精的流體等容易的篩選核酸,因為所關注的任何組織基本上均包含適當的核酸。這些樣品一般在知情許可后通過標準醫學實驗室方法取自患者。
[0179]在擴增和/或檢測包含標志物的核酸前,任選通過任何可利用的方法從樣品中純化核酸,所述的方法例如在如下文獻中教導的:Berger和Kimmel, Guide to MolecularCloning Techniques, Methods in Enzymology volumeI52Academic Press, Inc., SanDiego, CA(Berger) ;Sambrook 等,Molecular Cloning ~A Laboratory Manual (3rdEd.), Vol.1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, New York,2001 ("Sambrook");和 / 或 Current Protocols in Molecular Biology, F.M.Ausubel 等,eds., Current Protocols, Greene Publishing Associates, Inc.與 John ffiley&Sons,Inc.的合作項目(增補至2·002) ("Ausubel"))。在商業上還可以利用多種試劑盒從細胞或其它樣品中純化核酸(例如,參見EasyPrep?、FlexiPrep?,均來自Pharmacia Biotech ;StrataClean?,來自Stratagene ;和QIAprep?,來自Qiagen)。可選擇地,例如,可以在等分和/或稀釋后使樣品單純的直接進行擴增或檢測。
[0180]標志物的實例可以包括多態性、單核苷酸多態性、樣品中一種或多種核酸的存在、樣品中一種或多種核酸的缺失、一種或多種基因組DNA序列的存在、一種或多種基因組DNA序列的缺失、一種或多種mRNA的存在、一種或多種mRNA的缺失、一種或多種mRNA的表達水平、一種或多種蛋白質的存在、一種或多種蛋白質的表達水平、和/或衍生自任何上述的數據或其組合。基本上可以使用可利用的方法,例如使用提供高密度、高通量標志物作圖的陣列技術檢測任何數目的標志物。因此,可以在第一種和/或第二種群體中同時或以連續方式(或其組合)對至少約10、100、1,000、10,000乃至100,000或以上個遺傳標志物測試與相關表型的相關性。例如,可能還想測試標志物的組合,以便鑒定群體中與表型相關的遺傳組合或表達模式的組合。
[0181]正如注意到的,待檢測的生物學標志物可以為任何可檢測的生物學成分。通常檢測的標志物包括遺傳標志物(例如,存在于基因組DNA中的DNA序列標志物或其表達產物)和表達標志物(可以反映出遺傳編碼因素、環境因素或它們兩者)。如果標志物為表達標志物,那么方法可以包括測定第一種個體或群體的第一種表達譜(例如,一種或多種表達的標志物,例如一組表達的標志物)并且比較第一種表達譜與第二種個體或群體的第二種表達譜。在該實例中,使表達標志物與特定表型建立相關性可以包括使第一種或第二種表達譜與所關注的表型建立相關性。
[0182]探針/引物合成方法
[0183]一般而言,用于制備寡核苷酸,包括探針、引物、分子信標、PNA、LNA(鎖定核酸)等的合適方法為眾所周知的。例如,可以如Needham-VanDevanter等(1984)Nucleic AcidsRes.12:6159-6168所述,使用商購的自動化合成儀,按照Beaucage和Caruthers (1981)Tetrahedron Letts., 22 (20): 1859-1862 中所述的固相亞憐酸胺(phosphoramidtie)三酯方法,以化學方式合成寡核苷酸。還可以由本領域技術人員知道的各種商業來源定購寡核苷酸,包括修飾的寡核苷酸。存在許多寡核苷酸合成服務的商業供應商且由此這是一項廣泛可取得的技術。可以從各種商業來源定購任何核酸,諸如The Midland CertifiedReagent Company(mcrcioligos.com)> The Great American Gene Company (www.genc0.com)、ExpressGen Inc.(www.expressgen.com)、Operon Technologies Inc.(Alameda,CA)等。類似地,可以從任何各種來源,諸如PeptidoGenic (pkimiccnet.com)、HTIBio-products, Inc.(htibi0.com) > BMA Biomedicals Ltd(U.K.) > Bio-Synthesis,Inc.等定購PNA。
[0184]計算本幾(In Silico)標志物檢泖I[0185]在某些實施方案中,計算機(in silico)方法可以用于檢測所關注的標志物基因座。例如,可以將包含所關注的標志物基因座的核酸序列儲存在計算機中。可以使用由例如,諸如BLAST這類易于得到的程序乃至簡單的文字處理器提供的適當核酸搜索算法來鑒定所需標志物基因座序列或其同系物。已經對完整人類基因組進行了測序且由此可將序列信息用于鑒定標志物區、側翼核酸等。
_6] 用于標志物檢測的擴增引物
[0187]在某些優選的實施方案中,使用合適的基于PCR的檢測方法檢測本發明的分子標志物,其中PCR擴增子的大小或序列指示所述標志物(例如,特定的標志物等位基因)的存在與否。在這些類型的方法中,PCR引物與位于多態標志物區側翼的保守區雜交。
[0188]可以使用任何合適的方法設計用于本發明的合適的引物。并非意圖將本發明限于任何特定的引物或引物對。例如,可以使用任何合適的軟件程序,諸如LASERGENE?,例如考慮到公眾可利用的序列信息來設計引物。本文鑒定的多態性的側翼序列為公眾可得到的;因此,可以基于充分理解的堿基配對原則構建合適的擴增引物。正如上述已經進行了討論,例如可以通過雜交、陣列雜交、PCR、實時PCR、LCR等進行任何擴增子的序列。
[0189]在某些實施方案中,可以通過任何合適的手段(例如,使用非放射性熒光標簽)放射性標記或標記本發明的引物,以便能夠在不添加任何額外的標記步驟或顯現步驟的擴增反應后使不同大小的擴增子快速顯現。在某些實施方案中,不標記引物并且在其大小解析后,例如在瓊脂糖或丙烯酰胺凝膠電泳后使擴增子顯現。在某些實施方案中,在大小解析后對PCR擴增子進行溴化乙錠染色能夠使不同大小的擴增子顯現。
[0190]并非意圖將本發明的引物限于產生任何特定大小的擴增子。例如,用于擴增本文的標志物基因座和等位基因的引物并不限于擴增相關基因座的完整區或其任何子區。該引物可以產生任何適當長度的擴增子用于檢測。在某些實施方案中,標志物擴增產生了至少20個核苷酸長度,或可選擇地,至少50個核苷酸長度,或可選擇地,至少100個核苷酸長度,或可選擇地,至少200個核苷酸長度的擴增子。可以使用本文披露的各種技術檢測任何大小的擴增子。可以通過常規方法,諸如電泳檢測堿基組成或大小的差別。
[0191]用于定位克隆的標志物的檢測
[0192]在某些實施方案中,核酸探針用于檢測包含標志物序列的核酸。例如,除測定乳腺癌表型中的作用外,這類探針還可以用于定位克隆以便分離與標志物核苷酸序列連接的核苷酸序列。并非意圖將本發明的核酸探針限于任何特定的大小。在某些實施方案中,核酸探針至少為20個核苷酸長度,或可選擇地,至少50個核苷酸長度,或可選擇地,至少100個核苷酸長度,或可選擇地,至少200個核苷酸長度。
[0193]例如,根據待檢測的標記物的不同,使用放射自顯影術、熒光照相術或其它類似檢測技術檢測雜交的探針。特異性雜交方案的實例為本領域中廣泛可利用的,例如參見Berger, Sambrook 和 Ausubel,均在本文中。
[0194]轉基因細胞的產生
[0195]本發明還提供了用依照本發明鑒定的QTL所對應的核酸轉化的細胞。例如,這類核酸包括編碼對應于乳腺癌表型的QTL或與乳腺癌表型的QTL連鎖的基因的cDNA、0RF、基因、和/或染色體間隔(例如,基因組片段)。另外,本發明提供了影響乳腺癌表型的多肽的生產方法。例如,它可用于影響乳腺癌和產生轉基因細胞。這些細胞提供了具有影響相關表型的確定基因的商業上有用的細胞系,由此提供了篩選表型的潛在調控劑的平臺以及針對所關注基因各自作用機理的基礎研究。此外,基因療法可以用于將期望基因導入其個體或群體。這類基因療法可以用于提供治療由個體表現出的病癥的方法或可以用作預防處于風險中的個體發生這類病癥的預防措施。
[0196]描述用于克隆和操作核酸和生產所編碼的多肽的分子生物學技術的一般教科書包括Berger矛口KimmeI,Guide to Molecular Cloning Techniques,Methods in Enzymologyvolumel52Academic Press, Inc., San Diego, CA (Berger) ;Sambrook 等,MolecularCloning-A Laboratory Manual(3rd Ed.), Vol.1~3, Cold Spring Harbor Laboratory,Cold Spring Harbor, New York,2001(〃Sambrook〃)和 Current Protocols in MolecularBiology, F.M.Ausubel 等,eds., Current Protocols, Greene Publishing Associates,Inc.與John ffiley&Sons, Inc.的合作項目(增補至2004或以后)(〃Ausubel〃))。這些教科書描述了誘變,載體,啟動子和許多其它與例如產生包含所關注的核酸的克隆相關的主題的應用,例如,基因、標志物基因座、標志物探針、與標志物基因座分離的QTL等。
[0197]宿主細胞用本發明載體(例如,載體,諸如包含衍生自QTL或與之相關的基因或ORF的表達載體)遺傳改造(例如,轉導、轉染、轉化的等),所述本發明的載體可以為,例如克隆載體、穿梭載體或表達載體。這類載體為,例如質粒、曬菌粒、農桿菌(agrobacterium)、病毒、裸多核苷酸(線性或環狀)、或偶聯多核苷酸的形式。可以將載體導入細菌,尤其是為了增殖和擴增的目的。有關核酸導入方法的額外詳細描述可以在下文的Sambrook,Berger和Ausubel中找到。將本發明的核酸導入宿主細胞的方法對本發明而言并不關鍵,并且并非意圖將本發明限于任何將外源性遺傳物質導入宿主細胞的特定方法。因此,可以使用任何合適的方法并且應用于本發明,例如,包括,但不限于本文提供的方法,這些方法提供了將核酸有效導入細胞或原生質體。
[0198]可以在根據諸如,例如活化啟動子或選擇轉化體這類活動的需要而改良的常規營養培養基中培養改造后的宿主細胞。除全部在下文中的Sambrook, Berger和Ausubel外,Atlas 和 Parks (eds)The Handbook of Microbiological Media(1993)CRC Press,Boca Raton, FL 和可得至Ij 的商業文獻,諸如 Life Science Research Cell CultureCatalogue (2004) Sigma-Aldrich, Inc (St Louis,MO) ("Sigma-LSRCCC")提供了額外的詳細描述。
[0199]使標志物與表型建立相關性
[0200]本發明的一個方面在于描述圖1和/或2中注意到的多態性與乳腺癌表型之間的相關性。對這些相關性的理解可以用于本發明,以便建立有關一組確定個體或樣品所具有的多態性的信息與他們有可能展示的表型之間的相關性。此外,考慮了一種或多種不同基因中的等位基因組合的高級相關性也可以用于評價與表型的相關性。
[0201]可以通過任何方法建立這些相關性,所述的方法可以鑒定等位基因與表型或等位基因組合與表型組合之間的相關性。例如,圖1和/或2中的基因或基因座中的等位基因可以與一種或多種乳腺癌表型相關。最一般的情況是,這些方法包括參照查閱表,該表包含多態性的等位基因與表型之間的相關性。該表可以包括多個等位基因-表型相關性的數據并且例如,通過使用統計學工具,諸如主要成分分析、啟發算法等考慮到了多個等位基因-表型相關性的疊加或其它高級作用。
[0202]標志物與表型 的相關性任選包括對相關性進行一種或多種統計學檢驗。許多統計學檢驗為已知的且大部分為計算機執行的以便于分析。測定表型性狀與生物學標志物之間的關聯性/相關性的各種統計學方法為公知的并且可以應用于本發明。關于該主題的介紹,參見 Hartl (1981) A Primer of Population Genetics Washington University,Saint Louis Sinauer Associates, Inc.Sunderland, MA ISBN:0-087893-271_2。各種適當的統計學模型描述在 Lynch 和 Walsh (1998) Genetics and Analysis of QuantitativeTraits, Sinauer Associates, Inc.Sunderland MA ISBN0-87893-481-2。例如,這些模型可以提供基因型與表型值之間的相關性,表征基因座對表型的影響,分類環境與基因型之間的相關性,測定基因的顯性或外顯率,測定母體和其它后生效應,測定分析中的主要成分(通過主要成分分析或〃PCA")等。這些教科書中引述的參考文獻提供了有關使標志物與表型建立相關性的統計學模型的大量額外詳細描述。
[0203]除用于測定相關性的標準統計學方法外,通過模式識別和訓練,諸如使用遺傳算法測定相關性的其它方法也可以用于測定標志物與表型之間的相關性。這在鑒定多個等位基因與多個表型之間的高級相關性時特別有用。為了解釋,可以將神經網絡法與遺傳算法型編程結合應用于啟發式開發結構-功能數據空間模型,該模型測定遺傳信息與表型結果之間的相關性。例如,NNUGA(Neural Network Using Genetic Algorithms)為可利用的程序(例如,在環球網cs.bgu.ac.1l/~omri/NNUGA上,它結合了神經網絡和遺傳算法。例如,可以在 Kevin Gurney, An Introduction to Neural Networks, UCL Press (1999)和環球網 shef.ac.uk/psychology/gurney/notes/index, html 上找到有關神經網絡的介紹。額外有用的神經網絡的參考書包括上述有關遺傳算法的那些,并且例如有Bishop,NeuralNetworks for Pattern Recognition, Oxford University Press (1995)和 Ripley 等,Pattern Recognition and Neural Networks, Cambridge University Press (1995)。顯不例示性數據集,包括某些統計學分析的兩個表如圖1和/或2中所示。
[0204]可用于理解利用和建立相關性的數據分析應用、分析的主要成分、神經網絡建模等的額外參考書包括,例如,Hinchliffe, Modeling Molecular Structures, John Wileyand Sons (1996):Gibas和.Tambeck,Bioinformatics Computer Skills,0’Reilly(2001);Pevzner, Computational Molecular Biology and Algorithmic Approach, The MITPress (2000) ;Durbin 等,Biological Sequence Analysis!Probabilistic Models ofProteins and Nucleic acids, Cambridge University Press (1998);和 Rashidi 和Buehler, Bioinformatic Basics:Applications in Biological Science and Medicine.CRC Press LLC(2000)。
[0205]在任何情況下,任何統計學檢驗基本上均可以通過標準編程法或使用任何各種〃架外〃軟件包應用于計算機執行的模型,所述的〃架外〃軟件包執行這類統計學分析,包括,例如,上述那些和商購的那些,例如,來自Partek Incorporated (St.Peters, Missouri ;www.partek.com),例如,其提供用于模式識別的軟件(例如,提供Partek Pro2000PatternRecognition Software),它可以應用于遺傳算法以便進行多變量數據分析、交互式顯現、可變選擇、神經網絡和統計學建模等。例如,可以通過主要成分分析(PCA)作圖的散點圖和雙點圖(biplot)、多維標定(Mult1-Dimensional Scaling, MDS)、多維標定(MDS)作圖的散點圖、星狀圖等分析相關性。用于進行相關性分析的可利用的軟件包括SAS、R和MathLab。
[0206]標志物無論是多態性還是表達模式均可以用于任何`不同的遺傳分析。例如,一旦鑒定出標志物,正如本例中的那樣,就可以將它們用于相關研究的許多不同測定法。例如,可以為查詢這些標志物而設計微陣列的探針。其它例示性測定法包括,例如,Taqman測定法和上文所述的分子信標測定法以及常規的PCR和/或測序技術。
[0207]有關相關性研究的額外詳細描述可以在如下文獻中找到:2002年3月26日提交的 10/106,097,標題為"Methods for Genomic Analysis" ;2002 年 I 月 7 日提交的10/042, 819,標題為"Genetic Analysis Systems and Methods" ;2002 年 10 月 31 日提交的 10/286,417,標題為"Methods for Genome Analysis" ;2004 年 I 月 30 日提交的 10/768, 788,標題為"Apparatus and Methods for Analyzing and CharacterizingNucleic Acids Sequences" ;2003 年 5 月 28 日提交的 10/447,685,標題為〃Liver RelatedDisease Compositions and Methods" ;2004 年 10 月 20 日提交的 10/970,761,標題為"Improved Analysis Methods and Apparatus for Individual Genotyping〃(用于個體基因分型的方法);2004年9月30日提交的10/956,224,標題為〃Methods for GeneticAnalysis'
[0208]在某些實施方案中,標志物數據用于進行相關性研究以便顯示標志物與表型之間的相關性。這可以通過測定具有所關注表型的個體(即,展示出所關注表型的個體或群體)中的標志物特征并且比較這些個體中標志物的等位基因頻率或其它特征(表達水平等)與對照組個體中等位基因頻率或其它特征來進行。可以基于全基因組進行這類標志物測定或可以將這類標志物測定集中于基因組的特定區(例如,所關注的單倍型段)。在一個實施方案中,對與圖1和/或2中基因或基因座連鎖的標志物評價與一種或多種特定乳腺癌惡病質表型的相關性。
[0209]除本文披露的本發明方法的其它實施方案外,所述的方法還能夠"切開"表型。即特定的表型可以(并且一般確實)由兩種或多種不同遺傳堿基產生。例如,在一種個體中的易感性表型可能是圖1和/或2中的基因中的"缺陷"(或單純是特定等位基因一在易感性表型方面的"缺陷"是語境依賴性的,例如,表型在指定環境中是個體需要的還是不需要的)的結果,而在不同個體中相同的基礎表型可能是圖1和/或2中多個基因中的多個〃缺陷〃的結果。如此,掃描多個標志物(例如,作為在基因組或單倍型段掃描中)能夠切開類似(或分級的(graduated))表型的不同遺傳堿基。
[0210]如上述段落中所述,進行相關性研究的一種方法在于比較具有所關注表型的個體("病例組")中的等位基因頻率(或表達水平)與對照組個體中的等位基因頻率。在一種方法中,信息SNP用于進行SNP單倍型模式比較(〃信息SNP"為遺傳SNP標志物,諸如基因組或單倍型段中趨向于區分一種SNP、基因組或單倍型模式與其它SNP、基因組或單倍型模式的SNP或SNP子集(一種以上))。使用信息SNP的方法具有勝過本領域中知道的其它全基因組掃描或基因分型方法的優點,以便代替讀取每一個體基因組的所有30億個堿基一或乃至讀取可能發現的3-4百萬個常見SNP —僅來自樣品群的信息SNP需要檢測。讀取這些特定信息SNP提供了足夠的信息以便能夠如上所述從特定實驗群體中提取統計學上精確的相關性數據。
[0211 ] 如此,在測定遺傳相關性的一種方法的實施方案中,對未展不出表型的對照群體的基因組測定信息SNP的等位基因頻率。還對確實展示出表型的群體的基因組測定了信息SNP的等位基因頻率。比較信息SNP等位基因頻率。例如,可以通過測定每一群體中各信息SNP位置上的等位基因頻率(群體中特定等位基因的實例數除以等位基因總數)并且比較這些等位基因頻率進行等 位基因頻率比較。選擇展示出對照與病例群體/組中的等位基因出現頻率之間差異的信息SNP用于分析。一旦選擇了信息SNP,就鑒定包含信息SNP的SNP單倍型段,繼而鑒定與表型相關的所關注的基因組區。例如,可以通過本領域中公知的遺傳或任何生物學方法分析基因組區,以便用作藥物研發靶標或診斷標志物。
[0212]用于鑒定乳腺癌表型的系統
[0213]執行上述相關性建立的系統也為本發明的特征。一般而言,該系統包括使等位基因的存在與否(例如,無論是直接檢測的還是通過表達水平檢測的)與預測表型建立相關性的系統指令。該系統指令可以比較有關等位基因序列或表達水平的檢測信息與包括等位基因與相關表型之間相關性的數據庫。如上所述,該數據庫可以為多維的,由此包括等位基因組合與相關表型之間的高級相關性。可以將這些相關性儲存在任何數目的查閱表中,例如,采用電子數據表形式(例如,Excel?電子數據表)或數據庫,諸如Access?、SQL?、Oracle?, Paradox?或類似數據庫。該系統包括用于例如通過自動化或用戶界面輸入有關等位基因檢測信息的樣品特異性信息并且用于比較該信息與查閱表的條款。
[0214]任選該系統指令還可以包括接受與任何檢測的等位基因信息相關的診斷信息,例如,具有相關等位基因的受試者具有特定表型的診斷的軟件。該軟件本質上可以為啟發式的,使用這類輸入的相關性來改善查閱表的準確性和/或由該系統解讀查閱表。各種這類方法,包括神經網絡、馬爾可夫建模和其它統計學分析如上所述。
[0215]本發明提供了用于檢測一種或多種可檢測遺傳標志物的數據采集模塊(例如,包含一種或多種生物分子探針的一種或多種陣列、檢測器、流體處理器等)。這類數據采集模塊的生物分子探針可以包括適合于檢測生物學標志物,例如寡核苷酸探針、蛋白質、適體、抗體等的任意種。它們可以包括樣品處理器(例如,流體處理器)、機器人、微流體系統、核酸或蛋白質純化模塊、陣列(例如,核酸陣列)、檢測器、熱循環儀或其組合,例如,用于獲取樣品、稀釋或等分樣品、純化標志物材料(例如,核酸或蛋白質)、擴增標志物核酸、檢測擴增的標志物核酸等。
[0216]例如,可以并入所述系統的自動化裝置用于評價各種生物現象,包括,例如基因應答所選刺激物的表達水平(Service (1998) "Microchips Arrays Put DNA on theSpot^Science282:396-399)、高通量 DNA 基因分型(Zhang 等(1999) "Automated andIntegrated System for High-Throughput DNA Genotyping Directly from Blood"Anal.Chem.71:1138-1145)等。類似地,還可利用進行混合實驗、DNA擴增、DNA測序等的集成系統。例如,參見 Service (1998) "Coming Soon:the Pocket DNA Sequencer//Science282:399-401 o例如,各種自動化系統部件可購自Caliper Technologies (Hopkinton,MA),其使用各種Zymate系統,它們一般包括,例如機器人和流體處理模塊。類似地,用于各種實驗室系統,例如,用于微量滴定托盤操作的常用ORCA?機器人也可商購,例如,購自BeckmanCoulter, Inc.(Fullerton, CA)。類似地,可以用作本發明系統部件的商購微流體系統包括來自Agilent technologies和Caliper Technologies的那些。此外,專利和技術文獻包括微流體系統的大量實例,包括可以直接與微孔板相連以進行自動化流體操作的那些。
[0217]任何各種液體處理和/或陣列結構可以用于本文的系統。一種用于本文系統的常用形式是微量滴定板,其中陣列或液體處理器包括微量滴定托盤。這類托盤為商購的并且可以按照各種孔大小和每個托盤的孔數目定購,以及各種功能化表面,用于測定法或陣列成分的結合。常用的托盤包括普遍的96孔板,還有常用的384和1536孔板。可以在這類托盤上處理樣品,其中所有處理步驟在所述托盤上進行。還可以在微流體設備或微量滴定和微流體設備的組合中處理樣品。
[0218]除液相陣列外,·還可以將成分儲存在固相陣列中或在固相陣列上進行分析。這些陣列以空間可及的模式(例如,行和列柵格)將物質固定在固相基質,諸如膜(例如尼龍或硝化纖維素)、聚合物或陶瓷表面、玻璃或改性二氧化硅表面、金屬表面等上。例如,可以通過雜交、通過局部再水化(例如使用移液管或其它流體處理部件)和流體轉移、或通過刮取陣列或切下陣列上所關注的位置評價成分。
[0219]所述的系統還可以包括使用本文所述的任何方法檢測等位基因信息的檢測儀器。例如,可以將為檢測實時PCR產物配置的檢測器(例如,光學檢測器,諸如熒光檢測器)或陣列讀取器并入該系統。例如,可以為檢測來自包含所關注的等位基因的雜交或擴增反應的光發射配置檢測器,其中所述的光發射指示所述等位基因的存在與否。任選提供檢測器與包含上述系統指令的計算機之間的可操作連接,從而能夠向計算機自動輸入檢測到的等位基因特異性信息,例如,計算機可以儲存數據庫信息和/或執行系統指令以便比較檢測到的等位基因特異性信息與查閱表。
[0220]還可以將用于產生由檢測器檢測的信息的探針與任何其它硬件或軟件一起并入系統,以便使用該探針檢測擴增子。它們可以包括熱循環儀部件(例如,用于進行所述探針檢測的等位基因的PCR或LCR擴增)、探針在其上排成陣列和/或雜交的陣列等。用于處理樣品的上述流體處理部件可以用于移動樣品材料(例如,待檢測的模板核酸和/或蛋白質)、引物、探針、擴增子等從而彼此接觸。例如,該系統可以包括一組為檢測一種或多種與表型相關的基因或連鎖基因座中的至少一種等位基因而配置的標志物探針或引物,其中所述的基因編碼圖1和/或2中的多態性。配置檢測器組件是為了檢測從該組標志物探針或引物輸出的一種或多種信號或由該組標志物探針或引物產生的擴增子,由此鑒定等位基因的存在與否。
[0221]所分析的樣品任選為系統的組成部分或可以考慮與其分開。樣品任選包括,例如,如本文所述的基因組DNA、擴增的基因組DNA、cDNA、擴增的cDNA、RNA、擴增的RNA、蛋白質等。在一個方面中,樣品衍生自哺乳動物,諸如人類患者。
[0222]任選提供用于與用戶形成界面的系統部件。例如,該系統可以包括顯示計算機執行的系統指令的輸出的用戶可視顯示器、用于輸入用戶命令和激活該系統的用戶輸入裝置(例如,鍵盤或點擊裝置,諸如鼠標)等。一般而言,所關注的系統包括計算機,其中各種計算機執行的系統指令在計算機軟件中具體實施,例如,儲存在計算機可讀介質上的。
[0223]標準臺式應用軟件,諸如文字處理軟件(例如Microsoft Word?或CorelWordPerfect?)和數據庫軟件(例如電子數據表軟件,諸如Microsoft Excel?、CorelQuattro Pro? 或數據庫程序,諸如 Microsoft Access? 或 Sequel?、Oracle?、Paradox?)可以通過輸入對應于本文等位基因或等位基因與表型之間相關性的字符串而適合于本發明。例如,系統可以包括具有適當字符串信息的軟件,例如,它與用戶界面(例如,在標準操作系統,諸如Windows、Macintosh或LINUX系統中,為⑶I)聯合以處理字符串。還可以將專用的序列對比程序,諸如BLAST并入本發明的系統以便對核酸或蛋白質(或相應的字符串)進行序列對比,例如,用于鑒定多個等位基因并且建立相關性。
[0224]正如注意到的,系統可以包括具有適當數據庫和本發明等位基因序列或相關性的計算機。用于對序列以及輸入軟件系統的、包含任何本文序列的數據集進行序列對比的軟件可以為本發明的特征。計算機可以為,例如,PC(基于Intel X86或奔騰芯片兼容DOS?、0S2?、IND0WS?, WINDOWS NT?, WIND0WS95?, WIND0WS98?, WIND0WS2000, WINDOffSME 或 LINUX的機器,MACINTOSH?,Power PC或基于UNIX的(例如,SUN?工作站或基于LINUX的機器)或其它商購的本領域技術人員公知的常用計算機。用于輸入并且對比或以其它方式操作序列的軟件可得到,例如,BLASTP和BLASTN,或易于由本領域技術人員使用標準編程語言,諸如 Visualbasic、Fortran、Basic、Java 等構建。
[0225]鑒定調控劑的方法
[0226]除提供用于鑒定乳腺癌惡病質等的各種診斷和預后標志物外,本發明還提供了鑒定乳腺癌表型調控劑的方法。在這些方法中,使潛在的調控劑接觸對應于圖1和/或2中的基因座的相關蛋白質或接觸編碼這類蛋白質的核酸。檢測潛在調控劑對基因或基因產物的作用,由此鑒定潛在調控劑是否調控表型潛在的分子基礎。
[0227]此外,所述的方法可以包括,例如,將一種或多種推定的調控劑施用于展示出相關表型的個體并且測定該推定的調控劑是否例如在臨床試驗或治療環境中調控個體中的表型。這繼而測定了推定的調控劑是否在臨床上有用。
[0228]調控劑接觸的基因或基因產物可以包括本文所述的任何等位基因形式。與不良表型正相關的等位基因形式,無論是基因還是蛋白質,為調控劑篩選的優選靶標。[0229]可以篩選的所關注的作用包括:(a)在有調控劑存在下圖1和/或2中基因或基因產物的表達升高或降低;(b)表達時間或位置的改變;或(C)在有調控劑存在下對應于圖1和/或2中基因座的蛋白質定位的改變。
[0230]調控劑篩選的精確形式當然根據檢測的作用和可利用的設備的不同而改變。Northern分析、定量RT-PCR和/或基于陣列的檢測形式可以用于區分上述基因的表達水平。還可以使用可利用的方法,諸如Western印跡、ELISA分析、抗體雜交、BIAcore等檢測蛋白質表達水平。任何這些方法均可以用于區分因潛在調控劑導致的表達水平的改變。[0231]因此,可以對潛在調控劑篩選活性或表達。例如,可以使潛在調控劑(小分子、有機分子、無機分子、蛋白質、激素、轉錄因子等)接觸包含所關注的等位基因的細胞,并且可以在施用潛在表達調控劑之前和之后,例如,通過Northern分析或定量(任選實時)RT-PCR檢測對對應于圖1和/或2中基因座的基因或蛋白質活性或表達(或它們兩者)的作用。類似地,可以使不同基因的啟動子區(例如,一般是轉錄起始位點區中的序列,例如,在起始位點的5kb內,例如,Ikb或以下,例如,在起始位點的500bp或250bp或IOObp內)與報道構建體(CAT、i3-半乳糖苷酶、螢光素酶或任何其它可利用的報道分子)偶聯并且可以類似地測試潛在調控劑的表達活性調控。在任一情況中,按照高通量方式,例如,使用自動化流體處理和/或檢測系統按照順序或平行方式進行測定。類似地,可以使用本文的任何活性檢測方法通過使潛在調控劑接觸合適的細胞測試活性調控劑,不管檢測的活性是否為活性調控、表達調控或它們兩者的結果。
[0232]用于檢測調控劑活性檢測的生物傳感器也為本發明的特征。它們包括包含對應于圖1和/或2的基因座的基因或基因產物的裝置或系統,其與讀出器偶聯,所述的讀出器測量或展示所述基因或產物的一種或多種活性。如此,可以通過可操作地偶聯適當的測定部件與讀出器將任何上述測定部件配置為生物傳感器。該讀出器可以為光學的(例如,檢測細胞標志物或細胞存活)、電的(例如,與FET、BIAcore或任何各種其它部件偶聯)、光譜的等,并且可以任選包括用戶可視的顯示器(例如,CRT或光學觀測站)。該生物傳感器可以與機器人或其它自動化裝置偶聯,例如,微流體系統,其使推定的調控劑直接與本發明的蛋白質接觸,例如,用于對推定的調控劑活性進行自動化高通量分析。可以適用于本發明的生物傳感器的各種自動化系統為商購的。例如,可以制造自動化系統以便評價各種生物現象,包括,例如,基因應答所選刺激物的表達水平(Service (1998) "Microchips Arrays Put DNAon the Spot〃Science282:396-399)。實驗室系統還可以進行例如重復流體處理操作(例如移液),以便將材料轉移至或轉移出包含陣列的試劑儲存系統,諸如微量滴定托盤或其它芯片托盤,它們用作各種自動化實驗室方法的基礎容器部件。類似地,所述的系統操作例如微量滴定托盤并且控制各種環境條件,諸如溫度、對光或空氣的暴露等。許多這類自動化系統為商購的并且在本文中描述,包括上述那些。它們包括各種Zymate系統、ORCA?.機器人微流體裝置等。例如,Caliper Technologies, Mountain View, CA 的 LabMicrofluidic裝置⑧高通量篩選系統(HTS)可以適用于本發明以便篩選調控劑活性。
[0233]一般而言,用于檢測蛋白質表達水平和活性的方法和傳感器為可得到的,包括在上述各種參考文獻中教導的那些,包括R.Scopes, Protein Purification,Springer-Verlag, N.Y.(1982) ;Deutscher, Methods in Enzvmology Vol.182:Guide toProtein Purification,Academic Press,Inc.N.Y.(1990):Sandana(1997)Bioseparationof Proteins, Academic Press, Inc.;Bollag 等(1996)Protein Methods, 2lhEdition,ffiley-Liss, NY:ffalker(1996)The Protein Protocols Handbook, Humana Press, NJ ;Harris 和 Angal(1990)Protein Purification Applications:A Practical Approach,IRL Press, Oxford, Oxford, England ; Harr is 和 Angal Protein Purification Methods:A Practical Approach IRL Press, Oxford, Oxford, England:Scopes (1993)ProteinPurification:Principles 和 PracticeSriEdition, Springer Verlag, NY ;Janson和 Ryden(1998)Protein Purification:Principles.High Resolution Methods andApplications, Second Edition, ffiley-VCH, NY ; 和 Walker(1998)Protein Protocolson CD-ROM, Humana Press, NJ ;和 Satinder Ahuja ed.,Handbook of Bioseparations,Academic Press (2000) 0描述了同時檢測許多蛋白質的〃蛋白質組〃檢測方法并且也如上所述,包括各種多維電泳方法(例如,2-d凝膠電泳)、基于質譜的方法(例如,SELD1、MALD1、電噴射等)或表面等離振子共振法。它們還可以用于示蹤蛋白質活性和/或表達水平。
[0234]類似地,可以使用任何可利用的方法,包括Northern分析、定量RT-PCR等檢測核酸表達水平(例如,mRNA)。足以通過這些方法指導本領域技術人員的參考文獻易于得到,包括 Ausubel, Sambrook 和 Berger。
[0235]篩選對表達和/或活性的作用的潛在調控劑文庫是可得到的。這些文庫可以是隨機的或可以是靶向的。
[0236]靶向文庫包括使用任何形式的合理設計技術設計的那些,其選擇支架或構件來產生組合文庫。這些技術包括用于設計和組合合成祀聚焦文庫(targe-focused librairy)的大量方法,包括用生物等排轉化變形(morphing with bioisosteric transformation)、靶標特異性特有結構 的分析等。一般而言,如果有關圖1和/或2的結構基因或基因產物的信息可得到,那么,有可能可以使用例如靈活停靠方法(flexible docking approach)等設計結合配偶體。類似地,各種基礎化學支架有隨機文庫。在任一情況中,化學文庫的數以千計的支架和構件是可獲得的,包括具有多肽、核酸、碳水化合物和其它骨架的那些。商購的文庫和文庫設計服務包括 Chemical Diversity (San Diego, CA)、Affymetrix (SantaClara, CA)、Sigma(St.Louis MO)、ChemBridge Research Laboratories(San Diego, CA)、TimTec (Newark, DE)、Nuevolution A/S (Copenhagen, Denmark)等提供的那些。
[0237]用于治療乳腺癌表型的試劑盒可以包括如上所述鑒定的調控劑和用于將該化合物施用于患者以便治療乳腺癌的說明書。
[0238]調控某因的某因表汰
[0239]可以使用本領域公知的各種技術中任意種調控與圖1和2中多態性連鎖的任何基因的基因表達(例如轉錄和/或翻譯)。例如,可以使用反義核酸或干擾RNA抑制基因表達。抑制特定細胞類型中的表達可以用于進一步研究這些基因的體外或體內作用和/或作為治療過表達連鎖基因導致的疾患和/或治療這類基因的特定等位基因導致的顯性效應的機理。基因表達調控劑為一類本發明提供的調控劑,例如應用于調控乳腺癌表型的調控劑。
[0240]例如,反義核酸的應用為本領域眾所周知的。反義核酸具有與靶核酸,例如,靶基因、mRNA或cDNA互補的區。一般而言,將包含相對于內源性基因的編碼(有義)序列呈互補、反義方向的核苷酸序列的核酸導入細胞。反義核酸可以為RNA、DNA、PNA或任何其它合適的分子。雙鏈體可以在反義序列與其互補有義序列之間形成,導致基因失活。反義核酸可以通過與轉錄自基因的RNA形成雙鏈體、通過與雙鏈體DNA形成三鏈體等抑制基因表達。例如,對于編碼序列為已知的或可以通過許多充分確立的技術測定的任何基因,均可以產生反義核酸(例如,反義RNA或寡聚核苷酸(任選包括增加對降解的抗性或改善細胞攝取的修飾的核苷酸和/或鍵)的化學合成或體外轉錄)。例如,下列文獻中描述了反義核酸及其應用=Haselton和Alexander的USP6,242,258(2001年6月5日),標題為"Methods for the selective regulation of DNA and RNA transcriptionand translation by photoactivation" ;USP6,500,615 ;USP6,498,035 ;USP6,395,544 ;USP5,563,050 ;E.Schuch 等(1991)Symp Soc.Exp Biol45:117-127:de Lange 等(1995)Curr Top Microbiol Immunol197:57-75:Hamilton 等(1995)Curr Top MicrobiolImmunol 197:77-89 ;Finnegan等(1996) Proc Natl Acad Sci USA93:8449-8454 ;Uhlmann和 A.Pepan (1990)Chem.Rev.90:543 ;P.D.Cook(1991)Ant1-Cancer Drug Design6:585 ;J.Goodchild,Biocon jugate Chem.1 (1990) 165:和 S.L Beaucage 和 R.P.1yer (1993),Tetrahedron49:6123 ;和 F.Eckstein,Ed.(1991),Oligonucleotides and Analogues-APractical Approach, IRL Press0
[0241]還可以通過RNA沉默或干擾抑制基因表達。〃RNA沉默〃意指細胞中單鏈或一般為雙鏈RNA的存在導致對靶基因表達的抑制的任何機制,所述的靶基因包含與RNA相同或近似相同的序列,包括,但不限于RNA干擾、抑制轉錄自靶基因的靶mRNA翻譯但不改變mRNA的穩定性、和轉錄沉默(例如,導致靶mRNA轉錄抑制的組蛋白乙酰化和異染色質形成)。
[0242]術語"RNA干擾〃 ("RNAi",有時稱作RNA介導的干擾、轉錄后基因沉默、或鎮壓(quelling))意指細胞中RNA,一般為雙鏈RNA的存在導致基因表達抑制的現象,所述的基因包含與所述雙鏈RNA相同或近似相同的序列。誘導RNAi的雙鏈RNA稱作〃干擾RNA"。基因表達由如下所述的RNAi機制抑制,其中干擾RNA的存在導致轉錄自基因的mRNA降解且由此mRNA和任何所編碼的蛋白質水平降低。
[0243]RNAi機制已經和正在廣泛在大量真核生物體和細胞類型中研究。例如,參見如下綜述:McManus 和 Sharp (2002) 〃Gene silencing in mammals by small interferingRNAs^Nature Reviews Genetics3:737-747 ;Hutvagner 和 Zamore (2002)〃RNAi:Natureabhors a double strand^Curr Opin Genet&Dev200:225-232 ;Hannon (2002)"RNAinterference〃Nature418:244-251 ;Agami(2002)〃RNAi and related mechanismsand their potential use for therapy〃Curr Opin Chem Biol6:829-834 ;Tuschl和 Borkhardt(2002)"Small interfering RNAs:A revolutionary tool for theanalysis of gene function and gene therapy〃Molecular Interventions2: 158-167 ;Nishikura(2001)〃A short primer on RNAi:RNA-directed RNA polymerase acts as akey catalyst〃Celll07:415-418 ;和 Zamore(2001) 〃RNA interference !Listening tothe sound of silence〃Nature Structural Biology8:746_750。RNAi 還描述在專利文獻中;例如,參見 Kreutzer 和 Li_er 的 CA2359180,標題為"Method and medicament forinhibiting the expression of a given gene" ;Beach等的 W001/68836,標題為"Methodsand compositions for RNA interference" ;Graham 等的 W001/70949,標題為"Geneticsilencing";和 Tuschl 等的 W001/75164,標題為"RNA sequence-specific mediators ofRNA interference"o
[0244]簡言之,例如,用稱作Dicer的RNA酶III樣酶將導入細胞(例如導入細胞質)的雙鏈RNA處理成較短的雙鏈片段,稱作小干擾RNA (siRNA,也稱作短干擾RNA)。產生的siRNA的長度和性質依賴于細胞種類,不過,一般siRNA為21-25個核苷酸長度(例如,siRNA可以具有19個堿基對的雙鏈體部分,在每端上帶有2個核苷酸的3’懸垂)。類似地,可以在體外產生siRNA(例如,通過化學合成或體外轉錄)并且將其導入細胞以便誘導RNAi。siRNA與RNA誘導的沉默復合物(RISC)結合。任選發生siRNA的有義和反義鏈的分離,及siRNA反義鏈與其靶mRNA通過互補堿基配對相互作用的相互作用。最終mRNA裂解和降解。
[0245]由此可以通過將適當選擇的雙鏈RNA導入細胞特異性抑制靶基因在細胞中的表達。用于設計合適的干擾RNA的指導原則為本領域技術人員公知的。例如,一般針對外顯子序列,而非內含子或非翻譯區設計干擾RNA。高效干擾RNA的表征可能因細胞類型而改變。例如,盡管siRNA可能需要3’懸垂和5’磷酸以便最有效地誘導果蠅細胞中的RNAi,但是哺乳動物細胞中缺乏5’磷酸的平末端siRNA和/或RNA誘導RNAi可以與有3’懸垂和/或5’憐酸的siRNA誘導RNAi同樣有效(例如,參見Czauderna等(2003) "Structural variations and stabilizing modifications of synthetic siRNAs in mammaliancells〃Nucl Acids Res31:2705-2716)。作為另一個實例,由于大于30-80個堿基對長度的雙鏈RNA活化哺乳動物細胞中的抗病毒干擾素應答并且導致非特異性沉默,所以用于哺乳動物細胞的干擾RNA —般小于30個堿基對(例如,Caplen等(2001) "Specificinhibition of gene expression by small double-stranded RNAs in invertebrateand vertebrate systems"Proc.Natl.Acad.Sc1.USA98:9742-9747 ;Elbashir 等(2001)"Duplexes of21-nucleotide RNAs mediate RNA interference in culturedmammalian cells〃Nature411:494-498 ;和 Elbashir 等(2002)"Analysis of genefunction in somatic mammalian cells using small interfering RNAs〃Methods26:199-213其描述了 21個核苷酸的siRNA在特異性抑制哺乳動物細胞系中的基因表達中的應用 JPKim 等(2005) "Synthetic dsRNA Dicer substrates enhance RNAi potency andefficacy〃Nature Biotechnology23:222_226,其描述了 25-30 個核苷酸雙鏈體的應用)。siRNA的有義和反義鏈一般但非一定在siRNA雙鏈區內(不包括任何懸垂)彼此完全互補。反義鏈一般在相同區內與靶mRNA完全互補,不過,可以耐受一些核苷酸取代(例如,反義鏈與mRNA之間的一個或兩個核苷酸錯配仍然可以產生RNAi,不過,效率降低)。雙鏈區的末端一般比中部更耐受取代;例如,已經證實在具有19bp雙鏈區的21聚物環境內反義鏈與革巴mRNA之間的互補性小至15bp (堿基對)可產生功能性siRNA(例如,參見Czauderna等
(2003)"Structural variations and stabilizing modifications of synthetic siRNAsin mammalian cells〃Nucl Acids Res31:2705-2716)。任何懸垂可以但非一定與革巴 mRNA互補;例如,TT (兩個2’ -脫氧胸苷)懸垂頻繁應用于降低合成成本。
[0246]盡管最初認為需要雙鏈RNA(例如,雙鏈siRNA)啟動RNAi,但是幾個近期的報導表明這類siRNA的反義鏈足以啟動RNAi。單鏈反義siRNA可以通過與雙鏈siRNA相同的途徑啟動RNAi(正如所證實的,例如,根據特異性mRNA內切核酸降解裂解片段的出現)。就雙鏈干擾RNA而言,高效單鏈siRNA的特征可以因細胞類型的不同而改變(例如,在反義鏈上可能需要5’磷酸以便有效誘導某些細胞類型中的RNAi,而游離5’羥基在能夠使羥基磷酸化的其它細胞類型中是足夠的)。例如,參見Martinez等(2002) 〃Single_strandedantisense siRNAs guide target RNA cleavage in RNAi^CellllO:563-574 ;Amarzguioui等(2003)"Tolerance for mutations and chemical modifications in a siRNA^Nuc1.Acids Res.31:589-595 ;Holen 等(2003)"Similar behavior of single-strand anddouble-strand siRNAs suggests that they act through a common RNAi pathway^Nuc1.Acids Res.31:2401-2407 ;和 Schwarz 等(2002)Mol.CelllO:537_548。
[0247]由于在對應于指定靶mRNA不同區的siRNA之間的效率差異,所以一般設計幾種siRNA并且對靶mRNA測試以便確定那種siRNA最為有效。還可以產生小發夾RNA(shRNA,也稱作短發夾RNA)形式的干擾RNA,它們在細胞中被處理成啟動RNAi的siRNA樣分子(例如,參見 Siolas 等(2005) "Synthetic shRNAs as potent RNAi triggers ^NatureBiotechnology23:227-231)。
[0248]細胞中RNA,特別是雙鏈RNA的存在可以通過非RNAi的機制導致基因表達抑制,所述的基因包含與RNA相同或接近相同的序列。例如,與靶mRNA部分互補的雙鏈RNA可以抑制mRNA翻譯,但不影響其穩定性。作為另一個實例,雙鏈RNA可以誘導組蛋白甲基化和異染色質形成,從而導致包含與RNA相同或接近相同的序列的基因轉錄沉默(例如,參見 Schramke 和 Allshire (2003) "Hairpin RNAs and retrotransposon LTRs effectRNAi and chromatin-based gene silencing〃Science301:1069-1074 ;Kawasaki 和 Taira
(2004)"Induction of DNA methylation and gene silencing by short interferingRNAs in human cells〃Nature431:211-217 ;和 Morris 等(2004)"Small interferingRNA-1nduced transcriptional gene silencing in human cells〃Science305:1289-1292)。
[0249]已經在不同種類中鑒定了稱作microRNA(miRNA)的短RNA。一般而言,這些內源性RNA各自轉錄為長RNA,然后加工成約60-75個核苷酸的形成有缺陷發夾(莖-環)結構的前-miRNA。前-miRNA —般隨后例如被Dicer裂解成成熟miRNA。成熟miRNA —般約為21-25個核苷酸長度,但可以改變,例如,約14 一約25或以上個核苷酸。盡管并非全部,但是已經證實某些miRNA抑制具有部分互補序列的mRNA的翻譯。這類miRNA包含一個或多個針對相應mRNA的內部錯配,預計它們在miRNA反義鏈與mRNA結合形成的雙鏈體中心產生凸起。miRNA—般與mRNA形成約14-17個沃森-克里克堿基對;還可以形成額外的擺動(wobble)堿基對。此外,已經證實包含對相應mRNA的中心錯配的短合成雙鏈RNA(例如,與siRNA類似)抑制mRNA翻譯(但不會啟動降解)。例如,參見Zeng等(2003)"MicroRNAs and small interfering RNAs can inhibit mRNA expression bysimilar mechanisms"Proc.Natl.Acad.Sc1.USA100:9779-9784 ;Doench 等(2003)"siRNAscan function as miRNAs"Genes& Dev.17:438-442 ;Bartel 和 Bartel (2003) "MicroRNAs:At the root of plant development?^?Iant Physiologyl32:709-717 ;Schwarz 和Zamore(2002)"Why do miRNAs live in the miRNP?"Genes&Dev.16:1025-1031 ;Tang 等(2003)〃A biochemical framework for RNA silencing in plants〃Genes&Dev.17:49-63 ;Meister 等(2004)^Sequence-specific inhibition of microRNA-and siRNA-1nducedRNA silencing"RNA10:544-550 ;Nelson 等(2003)"The microRNA world:Small ismighty〃Trends Biochem.Sc1.28:534-540 ;Scacheri 等(2004)^Short interferingRNAs can induce unexpected and divergent changes in the levels of untargetedproteins in mammalian cells〃Proc.Natl.Acad.Sc1.USAlOl: 1892-1897 ;Sempere等(2004)"Expression profiling of mammalian microRNAs uncovers a subset ofbrain-expressed microRNAs with possible roles in murine and human neuronaldifferentiation^Genome Biology5:R13 ;Dykxhoorn 等(2003) "Killing the messenger:Short RNAs that silence gene expression^Nature Reviews Molec.and Cell Biol.4:457-467 ;McManus (2003)"MicroRNAs and cancer"Semin Cancer Biol.13:253-288 ;和Stark 等(2003)"Identification of Drosophila microRNA targets〃PLoS Biol.1:E60o[0250] 涉及部分互補RNA(例如,某些miRNA)對mRNA翻譯抑制的細胞機制似乎與涉及RNAi的部分交疊,不過,正如注意到的,mRNA的翻譯但并非其穩定性受到影響,并且mRNA —般不會降解。
[0251 ] 在RNA的反義鏈結合mRNA時形成的凸起的位置和/或大小可以影響RNA抑制mRNA翻譯的能力。類似地,RNA自身內任何凸起的位置和/或大小也可以影響翻譯抑制效率。例如,參見上述參考文獻。一般而言,翻譯抑制在RNA反義鏈與mRNA3’非翻譯區(3’UTR)互補時最為有效。與RNA反義鏈互補的序列的多次重復,例如,串聯重復也可以提供更有效的翻譯抑制;例如,被內源性miRNA以翻譯方式抑制的某些mRNA在其3’ UTR上包含miRNA結合序列的7-8個重復。值得注意的是翻譯抑制似乎比RNA干擾更依賴于RNA濃度;認為翻譯抑制涉及各自抑制性RNA對單一 mRNA的結合,而認為RNAi涉及單一 siRNA-RISC復合物對mRNA多個拷貝的切割。
[0252]為抑制指定靶mRNA翻譯而設計合適的RNA的指導原則可以在文獻中(例如,上述參考文獻和 Doench 和 Sharp (2004) "Specificity of microRNA target selectionin translational repression〃Genes&Dev.18:504-511 ;Rehmsmeier 等(2004)"Fastand effective prediction of microRNA/target duplexes^RNA 10: 1507-1517 ;Robins等(2005)"Incorporati·ng structure to predict microRNA targets〃Proc NatlAcad Sci102:4006-4009 ;和 Mattick 和 Makunin(2005)"Small regulatory RNAs inmammals〃Hum.Mol.Genet.14:R121_R132等)和本文中找到。然而,由于不同結構(例如,凸起大小、序列和/或位置)的RNA與對應于靶mRNA的不同區的RNA之間翻譯抑制效率的差異,所以任選設計幾種RNA并且對祀mRNA測試以便確定哪種對抑制祀mRNA翻譯最為有效。
[0253]針對基因產物的抗體
[0254]另一類調控劑為結合與本文基因座連鎖的基因產物的抗體。這些抗體可以用于檢測和/或純化基因產物,例如在原位監測基因產物。抗體還可以用于在體內、原位或體外阻斷基因產物的功能。本文所用的術語"抗體"包括,但不限于多克隆抗體、單克隆抗體、人源化或嵌合抗體和生物學功能性抗體片段,它們為足以使抗體片段結合蛋白質的那些片段。
[0255]為了產生針對相關基因產物的抗體,可以通過注射多肽或其部分對各種宿主動物中的任意種免疫接種。舉例而言,這類宿主動物可以包括,但不限于家兔、小鼠和大鼠。根據宿主種類的不同,各種佐劑可以用于加強免疫應答,包括,但不限于弗氏(完全和不完全)佐劑、礦物凝膠諸如氫氧化鋁、表面活性物質諸如溶血卵磷脂、Pluronic多元醇、聚陰離子、肽、油乳劑、匙孔蟲戚血藍蛋白、二硝基酚和潛在有用的人佐劑,諸如BCG(卡介苗)和短小棒狀桿菌(Corynebacterium parvum)。
[0256]多克隆抗體為衍生自免疫接種了抗原,諸如靶基因產物或其抗原功能性衍生物的動物血清的抗體分子的異質性群體。為了產生多克隆抗體,可以通過注射補充了也如上所述的佐劑的所編碼的蛋白質或其部分對諸如上述那些宿主動物免疫接種。
[0257]可以通過任何提供由培養物中連續細胞系產生抗體分子的技術獲得針對特定抗原的抗體同質性群體,即單克隆抗體(mAb)。這些技術包括,但不限于雜交瘤技術(Kohler和 Milstein, Nature256:495-497,1975;和美國專利 US4, 376,110)、人 B 細胞雜交瘤技術(Kosbor 等,Immunology Today4:72,1983 ;Cole 等,Proc.Nat,I Acad.Sc1.USA80:2026-2030,1983)和 EBV 雜交瘤技術(Cole 等,Monoclonal Antibodies and CancerTherapy, Alan R.Liss, Inc.,pp.77-96,1985)。這類抗體可以屬于任何免疫球蛋白類型,包括IgG、IgM、IgE、IgA、IgD及其任何的亞類。可以在體外或體內培養產生本發明mAb的雜交瘤。在體內產生高滴度的mAbs使得它成為目前優選的生產方法。
[0258]此外,可以使用為通過剪接來自具有適當抗原特異性的小鼠抗體分子的基因與來自具有適當生物學活性的人抗體分子的基因生產〃嵌合抗體〃研發的技術(Morrison等,Proc.Nat’ 1.Acad.Sc1.USA81:6851-6855,1984 ;Neuberger 等,Nature312:604-608,1984 ;Takeda等,Nature314:452-454,1985)。嵌合抗體為如下分子,其中不同的部分衍生自不同的動物種類,諸如具有衍生自鼠mAb的可變區或高變區和人免疫球蛋白恒定區的那些。類似地,還可以使用可利用技術生產人源化抗體。
[0259]可選擇地, 為生產單鏈抗體描述的技術(美國專利US4,946,778 ;Bird,Science242:423-426,1988 ;Huston 等,Proc.Nat’ I Acad.Sc1.USA85:5879-5883,1988 ;和Ward等,Nature334:544-546,1989)可以適合于生產差異表達的基因-單鏈抗體。單鏈抗體如下形成,即經氨基酸橋連接Fv區的重鏈和輕鏈片段,從而產生單鏈多肽。
[0260]在一個方面中,可用于生產〃人源化抗體〃的技術可以適合于生產針對蛋白質、其片段或衍生物的抗體。這類技術披露在美國專利US5, 932,448 ;5,693,762 ;5,693,761 ;5,585,089 ;5,530,101 ;5,569,825 ;5,625,126 ;5,633,425 ;5,789,650 ;5,661,016 ;和5,770,429 中。
[0261]可以通過公知技術產生識別特定表位的抗體片段。例如,這類片段包括,但不限于可以通過對抗體分子進行胃蛋白酶消化產生的F(ab’)2片段和可以通過還原F(ab’)2片段的二硫鍵產生的Fab片段。可選擇地,可以構建Fab表達文庫(Huse等,Science246:1275-1281,1989)以便能夠快速和便利地鑒定具有所需特異性的單克隆Fab片段。
[0262]使用上述抗體檢測和測定基因產物表達的方案為本領域眾所周知的。這類方法包括,但不限于斑點印跡、Western印跡、競爭性和非競爭性蛋白質結合測定法、酶聯免疫吸附測定法(ELISA)、免疫組織化學、熒光活化細胞分選(FACS)和其它常用且廣泛描述在科學和專利文獻中的方法以及許多商業上使用的方法。
[0263]易于檢測的一種方法為夾心式ELISA,其存在大量變化形式,所有這些均意圖包括在本發明內。例如,在典型的正向測定法中,將未標記的抗體固定在固相基質上并且使測試樣品接觸所結合的分子并且孵育足以形成抗體-抗原二元復合物的時間。此時,隨之加入使用能夠誘導可檢測信號的報道分子標記的第二抗體并且孵育,使得時間足以形成抗體-抗原-標記抗體的三元復合物。洗去任何未反應的物質并且通過觀察信號確定抗原的存在,或可以通過與包含已知量抗原的對照樣品進行比較對抗原進行定量。正向測定法的變化形式包括:同時測定法,其中同時將樣品和抗體加入到所結合的抗體;或反向測定法,其中首先合并標記抗體和測試樣品,孵育并加至未標記的表面結合抗體。這些技術為本領域技術人員眾所周知的并且微小變化的可能性顯而易見。本文所用的"夾心式測定法"意圖包括基礎雙位點技術(basic two-site technique)的所有變化形式。就本發明的免疫測定法而言,唯一的限制性因素在于經過標記的抗體為對所關注的基因表達的蛋白質具有特異性的抗體。
[0264]在這種類測定法中最常用的報道分子為酶、含熒光團分子或含放射性核素分子。就酶的免疫測定法而言,通常通過戊二醛或高碘酸鹽使酶與第二抗體偶聯。然而,正如易于公認的,存在本領域技術人員眾所周知的各種不同的連接技術。常用的酶包括辣根過氧化物酶、葡萄糖氧化酶、β -半乳糖苷酶和堿性磷酸酶等。一般為通過相應酶水解時產生可檢測顏色改變而選擇與特定酶一起使用的底物。例如,磷酸對硝基苯酯適用于堿性磷酸酶偶聯物;就過氧化物酶偶聯物而言,常用1,2-苯二胺或甲苯胺。還可能使用熒光底物,其產生熒光產物,而非上述顯色底物。然后將包含合適底物的溶液加至所述的三元復合物。使底物與連接至第二抗體的酶反應,得到定性可視信號,其通常可以進一步通過分光光度法將其定量,以便評價存在于血清樣品中PLAB的量。
[0265]可選擇地,可以通過化學方式使熒光化合物,諸如熒光素和若丹明與抗體偶聯而不改變其結合能力。當通過用特定波長的光照射活化時,熒光染料標記的抗體吸收光能,誘導分子中的激發態,隨后在較長的特征性波長處發射光。發射表現為可使用光學顯微鏡檢測到的可視特征性顏色。免疫熒光和EIA技術均為本領域中充分確立的并且為特別優選用于本發明的方法。然而,也可以使用其它報道分子,諸如放射性同位素、化學發光或生物發光分子。如何改變規程以適合于所需的應用對本領域技術人員而言是顯而易見的。
[0266]細朐挽救(cell rescue)復蘇和治療件給藥
[0267]本發明在一個方面中包括挽救在圖1和/或2的一種或多種內源性基因或多肽的功能方面存在缺陷(由此賦予所關注的相關表型例如乳腺癌易感性、抗性等)的細胞。這可以單純通過將基因(或表達相關蛋白質的異源性核酸),即具有所需等位基因的基因的新拷貝導入細胞來進行。還可以實施其它方法,諸如同源重組以修復缺陷基因(例如通過嵌合成形術(chimeraplasty))。在任何情況下,例如,可以在本文所述的任何測定法中測量功能的挽救。實際上,該方法可以用作在體外對細胞篩選圖1和/或2任何基因或基因產物的表達或活性的一般方法。因此,體外功能挽救可用于上述大量體外篩選方法的環境中。挽救的細胞可以包括培養物(包括來自患者的原代或繼代細胞培養物以及充分確立細胞的培養物)中的細胞。如果從患者中分離細胞,那么它具有確立哪種基因或產物在呈現相關表型的患者中存在缺陷的額外診斷功用。
[0268]在另一個方面中,細胞挽救在患者,例如人中發生,例如以便修補缺陷。因此,本發明的一個方面在于修補缺陷的基因療法。在這些應用中,任選將本發明的核酸克隆入適當的基因療法載體(和/或單純作為裸核酸或脂質體偶聯的核酸遞送),然后任選與適當的載體或遞送劑一起遞送。還可以直接遞送蛋白質,但一般優選在需要穩定表達的應用中遞送核酸。類似地,可以在治療上使用本文方法鑒定的任何缺陷的調控劑。[0269]例如,給藥組合物包含治療有效量的調控劑、基因療法載體或其它相關核素和藥學上可接受的載體或賦形劑。這類載體或賦形劑包括,但不限于鹽水、緩沖鹽水、右旋糖、水、甘油、乙醇、和/或其組合。制備適合于給藥方式的制劑。一般而言,局部應用的基因療法載體的給藥方法為本領域眾所周知的并且可以應用于給藥本發明的核酸。
[0270]任選在一種或多種適當的體外和/或體內疾病動物模型中測試包含本發明一種或多種調控劑或基因療法核酸的治療性組合物,以便按照本領域眾所周知的方法證實功效、組織代謝和估算劑量。特別地,最初可以根據制劑的活性、穩定性或其它合適的度量來確定劑量。
[0271]給藥通過常用于將分子與細胞緊密接觸的任何途徑進行。可以以任何合適的方式,任選使用一種或多種藥學上可接受的載體給藥調控劑和/或編碼相關序列的核酸。對患者給藥本發明上下文中的這類核酸的合適方法是可得到的,并且盡管可以將一種以上的途徑用于給藥特定的組合物,特定的途徑通常可以提供比另一種途徑更迅速和更有效的作用或反應。
[0272]部分根據給藥的特定組合物以及用于給藥組合物的特定方法來確定藥學上可接受的載體。因此,存在極其多種本發明藥物組合物的合適制劑。可以通過許多途徑給藥組合物,包括,但不限于:口服、靜脈內、腹膜內、肌內、透皮、皮下、表面、舌下或直腸給藥。可通過脂質體(例如,表面的)或通過裸DNA或病毒載體的表面遞送來給藥組合物。這類給藥途徑和合適的制劑一般為本領域技術人員公知的。
[0273]還可以將單獨的組合物或與其它合適的成分聯用的組合物制成氣溶膠制劑(即它們可以〃霧化〃)以便通過吸入給藥。可以將氣溶膠制劑置于加壓可接受的推進劑中,諸如二氯二氟甲烷、丙烷、氮等 。適合于諸如,例如通過關節內(在關節中)、靜脈內、肌內、真皮內、腹膜內和皮下途徑進行胃腸外給藥的制劑包括:可以包含抗氧化劑、緩沖劑、抑菌劑和賦予該制劑與指定接受者血液等滲的溶質的水性和非水性等滲無菌注射溶液;和可以包括懸浮劑、增溶劑、增稠劑、穩定劑和防腐劑的水性和非水性無菌混懸液。可以將包裝好的核酸的制劑在單劑或多劑密封容器中提供,諸如安瓿和小瓶。
[0274]在本發明的上下文中,對患者的給藥劑量足以隨著時間的過去對患者產生有益治療應答。根據特定載體或其它制劑的功效,表達的多肽的活性、穩定性或血清半衰期,和患者的狀況以及所治療患者的體重或表面積確定劑量。劑量的大小還根據伴隨患者中特定載體、制劑等給藥的任何不良副作用的存在、性質和程度來確定。在確定在治療疾病時給藥的載體或制劑的有效量時,醫師評價局部表達或循環血漿水平、制劑毒性、相關疾病的進展和/或重要時,針對多核苷酸編碼的蛋白質的抗體的產生。例如,對70千克的患者,給藥劑量范圍一般與目前使用的治療性蛋白質的劑量相當,根據相關組合物改變的活性或血清半衰期進行調整。本發明的載體可以通過任何公知的常規療法補充治療條件。
[0275]為了給藥,可以以根據相關制劑的LD-50和/或本發明載體在不同濃度下(例如應用于大的(mass)或表面遞送區域)的任何副作用的觀察結果和患者的總體健康狀況確定的速率給藥本發明的制劑。可以通過單劑或分劑進行給藥。
[0276]如果進行治療的患者發生發熱、發冷或肌痛,那么他/她接受適當劑量的阿司匹林、布洛芬、對乙酰氨基酚或其它疼痛/發熱控制藥。對組合物有反應,諸如發熱、肌痛和發冷的患者在輸注前30分鐘進行前驅用藥,即阿司匹林、對乙酰氨基酚、或例如苯海拉明。哌替啶(meperidine)用于更嚴重的發冷和肌痛,這些癥狀對解熱藥和抗組織藥沒有快速響應。治療根據反應嚴重性的不同而減緩或中斷。
[0277]診斷和預后測定法
[0278]核酸、多肽、抗體和本文的其它組合物可以用作乳腺癌表型易感性或抗性的預后和診斷試劑(例如,在預包裝試劑盒中)。可以將這些方法對已知具有乳腺癌表型一種或多種癥狀的受試者實施作為其它疾病的差異診斷或預后組成部分。這些方法還可以對具有已知乳腺癌表型易感性的受試者實施。這類個體的多態性特征譜可以升高或降低對易感性的評價。例如,已知,具有兩個乳腺癌同胞的個體比一般群體對疾病的易感性增加。發現有利于易感性的額外因素增加了風險,而發現有利于抗性的因素降低了這種風險。
[0279]本發明提供了測定個體在本發明一種或多種SNP處的多態性特征譜的方法。SNP包括圖1和2中所示的那些和與之連鎖不平衡的那些。與之連鎖不平衡的那些通常發生在相同基因中或相同基因的100或50或20kb內。可以通過單倍型作圖確定與本文圖中SNP連鎖不平衡的SNP。可以通過融合來自不同種類的二倍體細胞測定單倍型。所得細胞為部分單倍體,從而能夠確定單倍體染色體上的單倍型(例如,參見US20030099964)。可選擇地,可以通過與下文實施例中所述類似的結合研究確定與例示SNP連鎖不平衡的SNP。
[0280]多態性特征譜由占據個體各種多態性位點上的多態形式構成。在二倍體基因組中,兩種多態形式,彼此相同的或不同的,通常占據每個多態位點。如此,在位點X和Y處的多態性特征譜可以表示為x(xl,Xl)和Y(yl,y2)形式,其中xl、xl表示占據位點X的等位基因xl的兩個拷貝,而yl、y2表不占據位點Y的雜合等位基因。
[0281]可以通過與占據本文圖中所示每一位點處的、與乳腺癌表型抗性或易感性相關的多態形式比較對個體的多態性特征譜評分。可以對至少例如,1、2、5、10、25、50或全部多態位點和任選與之連鎖不平衡的其它位點進行比較。可以與其它多態位點組合分析多態位點。然而,通常分析的多態·位點總數少于10,000、1000、100、50或25個并且可以為約10個或以下、約5個或以下、或約2個或以下。
[0282]可以以疊加的方式合并存在于特定個體中的抗性或易感性等位基因的數量或形成比例以便提供有關個體對乳腺癌表型遺傳傾向的總體評價(參見USSN60,566,302,2004年 4 月 28 日提交;USSN60/590, 534,2004 年 7 月 22 日提交;USSN10/956, 224,2004 年 9 月30日提交;和PCT US05/07375,2005年3月3日提交)。可以任意將抗性等位基因各自評分為+1并且將易感性等位基因評分為-1 (或反之亦然)。例如,如果將個體對本發明的100個多態位點分型并且在其所有位點上的抗性而言為純合的,那么可以將他指定為對乳腺癌表型的抗性的遺傳傾向得分為100%或對乳腺癌表型的易感性的傾向為0%。如果個體對所有易感性等位基因而言為純合的,則為相反的結果。更典型的是,個體對某些基因座上的抗性等位基因而言為純合的,對某些基因座上的易感性等位基因而言為純合的,并且對其它基因座上的抗性/易感性等位基因而言為雜合的。可以通過將所有抗性等位基因的評分指定為+1,并且將所有易感性等位基因的評分指定為-1 (或反之亦然),并且合并評分,對這類個體的乳腺癌表型遺傳傾向進行評分。例如,如果個體具有102個抗性等位基因和204個易感性等位基因,那么可以將該個體評分為具有33%的抗性遺傳傾向和67%的易感性遺傳傾向。可選擇地,可以將純合抗性等位基因的評分指定為+1,將雜合等位基因的評分指定為0,并且將純合易感性等位基因的評分指定為-1。還可以將抗性等位基因和易感性等位基因的相對數目表示為百分比。如此,對30個多態位點處的抗性等位基因而言為純合的、對60個多態位點處的易感性等位基因而言為純合的、且剩余63個多態位點處為雜合的個體指定為33%的抗性遺傳傾向。作為另一種可替代選擇,可以將易感性純合性評分為+2,雜合性評分為+1,而抗性純合性評分為O。
[0283]個體評分和多態性特征譜性質可用于個體對乳腺癌表型易感性的預后或診斷。任選可以告知患者通過遺傳特征譜表示的乳腺癌表型易感性。可以將對乳腺癌表型的高遺傳傾向的存在作為警告來對待,以開始預防性或治療性處理。例如,可以不同地監測具有發生乳腺癌表型的風險升高的個體(例如,更頻繁的乳房照相術)或可以預防性處理(例如,使用一種或多種藥物)。對乳腺癌表型的高度傾向的存在還指示進行第二測試,諸如活檢的有益性。
[0284]例如,多態性特征制譜可用于選擇在指定個體中實現乳腺癌表型治療或預防的藥劑劑。具有類似多態性特征譜的個體有可能以類似的方式響應藥劑。[0285]多態性特征制譜還可用于對測試藥劑在治療乳腺癌表型或相關疾患方面的能力的臨床試驗中的個體進行分層。這類試驗對具有類似或相同多態性特征譜的治療或對照群體進行(參見EP99965095.5),例如,所述多態性特征譜指示個體具有發生乳腺癌表型的風險增加。遺傳匹配的群體的應用消除或減少了因遺傳因素導致的治療效果的變異,從而導致對潛在藥物功效的評價更為準確。計算機執行的算法可以用于鑒定遺傳上更同質的亞群,其中治療或預防具有顯著作用,不過,治療或預防在更異質的更大群體中無效。在這類方法中,對具有乳腺癌表型的、用藥劑治療的第一群體和也具有乳腺癌表型、但用安慰劑治療的第二群體提供了數據。測定在選自圖1和/或2中所示基因中的至少一個多態位點或IOOkb或50kb或20kb內兩個群體中個體的多態性特征譜。還提供了群體中每位患者是否達到表示成功治療或預防的所需終點的數據。然后選擇第一和第二群體中的亞群,使得亞群中的個體彼此具有大于原始第一和第二群體中個體的多態性特征譜相似性。存在可以評價相似性的許多標準。例如,一項標準在于要求亞群中的個體在上述基因的至少10個上各自具有至少一個易感性等位基因。另一項標準在于亞群中個體對測定了多態性特征譜的各多態位點而言具有至少75%的易感性等位基因。與用于評價相似性的標準無關,比較亞群的終點數據以便確定治療或預防是否在亞群中實現了統計學顯著的結果。作為計算機執行的結果,可以分析億萬相似性標準以便鑒定表現出統計學顯著性的一個或幾個亞群。
[0286]多態性特征制譜還可用于從臨床試驗中排除無乳腺癌表型惡病質的個體。在試驗中包括這類個體增加了獲得統計學顯著效果所需的群體的大小。可以通過如上所述測定多態性特征譜中抗性和易感性等位基因的數目鑒定無乳腺癌表型惡病質的個體。例如,如果受試者在與乳腺癌表型相關的本發明10個基因的10個位點上基因分型,那么總計測定了20個等位基因。如果其中超過50%且優選超過60%或75%為抗性基因,那么該個體不太可能發生乳腺癌表型并且可以將他/她從試驗中排除。
[0287]在其它實施方案中,可以使用多態性特征制譜與其它分層方法的組合進行臨床試驗中個體的分層,所述的其它分層方法包括,但不限于家族史、風險模型(例如,Gail得分、Claus模型)、臨床表型(例如,非典型損害和乳腺密度)和特定候選生物標志物(例如,IGFU IFG2、IGFBP3、Ki_67和雌二醇)。例如,在包括基于多態性特征譜的分層的化學預防試驗中較高風險度的分層可以改善結果。特別地,與FGFR2連鎖的標志物可以用于對抗VEGF或抗血管發生療法應答的分層,并且與PKHDl連鎖的標志物可以用于對抗EGF療法功效(抗EGF療法在具有多囊腎和肝病的患者中有活性)的分層。
[0288]還可以在完成臨床試驗后使用多態性特征譜來闡明對指定治療的響應差異。例如,多態性組可以用于將登記患者分層為疾病亞型或類型。還有可能使用多態性鑒定具有類似多態性特征譜的患者亞組,他們對治療具有不常見的(高或低)的響應或根本無響應(不響應者)。在這種方式中,有關影響對治療的響應的潛在遺傳因素的信息可以用于研發治療的許多方面(它們從新靶標的鑒定到經新試驗的設計到產物標記和患者靶向)。另外,多態性可以用于鑒定牽涉對治療的不良響應(不良事件)的遺傳因素。例如,表現出不良響應的患者可能具有比預計為偶然的更類似的多態性特征譜。這容許早期鑒定并且從治療中排除這類個體。還提供了可以用于理解不良事件的生物學原因和改進治療以避免這類后果的信息。
[0289]多態性特征譜還可以用于其它目的,包括如US6,525,185中所述的親子鑒定和法醫分析。在法醫分析中,將來自犯罪現場的樣品的多態性特征譜與嫌疑人的進行比對。兩者之間的匹配是嫌疑人實際犯罪的證據,而缺乏匹配就可排除嫌疑人。提出的多態位點可以用于這類方法,正如用于人類基因組中的其它多態位點一樣。
實施例
[0290]提供下列實施例是為了例證,并非限制請求保護的發明。本領域技術人員將認出各種可以在本發明范圍內改變的非關鍵性參數。
[0291]實施例1:鑒定乳腺癌標志物的策略
[0292]前言:鑒定常見的遺傳變體
[0293]在鑒定乳腺癌標志物等位基因中存在公眾健康的重要應用。如果遺傳變異是因許多基因座所致,那么個體的風險 度就會廣泛變化,這取決于在易感性基因座上遺傳得到的高危等位基因的數目。我們基于Antoniou等13的模型的分析提示在群體的前、后20%之間可能存在多達40倍的風險度差異。在相同的模型中,所有乳腺癌中的半數發生在12%的最高風險度女性中,并且這些女性在到70歲時有8位中至少I位的風險度。相反,在50%的最低風險度女性中僅有12%的癌癥,并且個體風險度低于30位中I位14。鑒定為與乳腺癌風險相關的基因可以用于評估相關的和個別的風險度。這種風險度評估的實際結果是重要的。
[0294]賦予中度風險的常見遺傳變體在群體水平上各自具有重要的作用。例如,個體風險度僅增加1.5倍的、具有20%頻率的常見變體占負載癌癥的群體的15%。與在心血管疾病中血壓或膽固醇中度升高具有相似性。如果該變體指示切實可行的干預機制,那么這也為靶向干預提供了新的可能性。
[0295]在這些實際結果外,癌癥易感性基因的鑒定有助于澄清致癌機理(正如已經發生的例如BRCAl和BRCA2)。超越已知候選物擴展至整個基因組檢索具有全新機制出現的巨大優點。這些機制還提供了新的治療靶。
[0296]最終,易感性基因的知識能夠使我們通過使用例如EPIC分組調查法(cohort)研究基因與這些危險因素的組合的作用來澄清生活方式危險因素。
[0297]乳腺癌[0298]盡管對許多癌癥中的相關性研究可能存在爭論,但是存在幾個為何特別適合于在乳腺癌中進行研究的原因。它是女性中最常見的癌癥并且其病因學仍然了解甚少。對該病遺傳基礎比對任何其它常見的癌癥研究得更充分。作為結果,有利于多基因基礎的證據比對其它癌癥更清楚。長期研究組合了足夠大系列的病例以便可靠地鑒定易感性基因座。此外,具有明顯家族史的病例可通過癌遺傳學臨床獲得,并且可以在相關性研究的有效性中提供顯著收獲(參見“Research Proposal") ο最終,存在可以對發現處于風險度增加的女性提供的干預。例如,預防性卵巢切除術可以明顯降低隨后乳腺癌的風險度15。近期研究提示通過MRI的篩選可以提供遠高于乳房X線攝影術的靈敏度,但成本明顯較高16。
[0299]研究設計
[0300]對一組400個家族性乳腺癌病例和來自EPIC組的400個對照測定200,000個單核苷酸多態性(SNP)的基因型;這些SNP中顯示最強相關性的5%在基于額外群體的4,600個病例和4,600個對照系列中進行分析。在額外的大量病例-對照系列中證實了這一階段的正相關性。
[0301]在乳腺癌終點外,許多定量表型可以在對照組中獲得并且提供遺傳分析的額外數據。它們包括與癌癥風險相關的表型(例如乳房照相圖式、激素水平)。
[0302]收率
[0303]掃描評價了重復序列外全基因組間10%或10%以上頻率(且某些在5-10%的范圍)的單核苷酸多態性。它在占乳腺癌總體遺傳成分中2%或2%以上的這些區中具有約80%檢測任何常見變體的可 信度(power)。
[0304]用于尋找常見易感性變體的研究設計
[0305]鑒定常見低風險度等位基因的有效設計為病例/對照研究。與易感性相關的變體通過其在癌癥病例中明顯高于為遺傳背景匹配的對照中的出現頻率來鑒定。在本研究中,變體為單核苷酸多態性(SNP)。最常見的是,并不了解可能與疾病易感性相關的活性或功能性變體,且由此研究依賴于可以報告推定的(但未知的)活性變體的一組“標簽” SNP。
[0306]病例-對照相關性研究方法已經廣泛應用于基于“候選基因”的乳腺癌。先前已經以這種方式研究了接近100個基因的編碼區和內含子中的多態性。這些基因包括,例如,涉及性類固醇激素代謝、細胞周期控制和DNA修復的基因。盡管已經對常見變體提示了某些相關性,但是無一得到最終確立。迄今為止的結果提示乳腺癌風險中的大部分變異并非因可以作為乳腺癌候選物第一選擇的基因的基因內DNA中的變體所致。此外,對候選基因方法存在嚴重限制。它緩慢并且相對昂貴,依賴于基于SNPXSNP的、對測試的每一基因開發的測定法;它甚至對候選基因的覆蓋不完全,特別是在大部分情況中忽略了潛在的調控變異;并且它限于對疾病生物學目前的知識。作為對比,全基因組搜索具有在沒有任何現有功能或位置知識的情況下鑒定活性常見變體的潛能。
[0307]某閔纟目掃描SNP
[0308]對基因組掃描的要求在于確定在報告基因組間所有其它SNP組時提供完整性與成本之間最佳折衷的一組SNP。Perlegen Sciences (www.perlegen.com)已經通過對在人/嚙齒類動物體細胞雜合物中分離的20-50個單倍體基因組中的人基因組的非重復序列進行再測序鑒定了 110萬個常用SNP標志物(密度為每2kb有I個SNP)。這種SNP搜索基于與在Patil等17報導的第21條染色體研究中報導的類似的策略。他們由此使用動態編程算法18確定了一組200,000個標簽SNP,它們明確地報告了超過80%的由完整組110萬個SNP確定的常見單倍型。在本實施例中使用的就是該組的200,000個標簽SNP。
[0309]SNP在Affymetrix研發的高密度寡核苷酸陣列上分型,這些陣列已經在常規應用中得到了廣泛驗證。簡言之,陣列設計使用80個特征(25聚物寡核苷酸)以查詢每一 SNP。80個特征包含10個交疊特征組,其中每個特征組包括對參比等位基因特異的4個特征(I個完全匹配和3個錯配特征)和針對可選(alternative)等位基因的4個類似特征。通過比較參比等位基因的完全匹配特征的熒光強度與為可選等位基因的完全匹配的那些,可以區分三種可能的SNP基因型(常見的純合子、雜合子和罕見純合子)。為了進行基因分型測定,使用多重(78路)短程PCR特異性擴增樣品基因組包含所關注SNP的區。合并來自每一個體的PCR產物并且用生物素標記以便生成靶DNA。使靶DNA與SNP分型高密度寡核苷酸陣列雜交。在過夜雜交后,洗滌陣列,染色并且掃描熒光強度。
[0310]在本實施例中,將用于對200,000個SNP進行基因分型的特征排列在一系列6個高密度陣列上,要求具有約30,000個SNP的復雜性的靶DNA用于雜交。這一復雜性的靶物產生97.3%的呼叫率(call rate)。高密度陣列基因分型技術與其它技術(實時PCR和熒光極化)的比較顯示了在大約20,000個基因分型中99%以上的一致索引(concordance),有多至20個不同的SNP。這項技術已經在使用來自多個合作臨床和研究實驗室的DNA時證實為確實的,并且在使用基因組擴增的DNA時良好地起作用。
[0311]在本研究中使用的200,000個標簽SNP的特性在于其“報告”基因組內所有其它SNP變體的能力。就指定的可信度(power)而言,所需的樣本大小與1/r2成正比,其中r為所尋找的功能性變體與最緊密連鎖的標簽SNP之間的連鎖不平衡系數19。
[0312]根據經驗通過對在28個無關個體(56條染色體)中基因組DNA的4Mb區內均勻間距的1608個SNP基因分型測定非標簽SNP與其相應標簽SNP之間的r2分布:參見表1。對所有988個測試SNP而言(每個的最低等位基因頻率>10%),平均r2為67%,69%的SNP具有大于0.5的r2。
[0313]M I`
[0314]表1:在不同于用于SNP發現的那些的28個個體的第21條染色體4Mb區段中測定的417個選擇的“標簽” SNP與988個“測試” SNP之間的r2值分布。整組SNP的15%具有最低等位基因頻率1-10% ;85%具有大于10%的頻率,在10-50%之間均勻分布。所有測試SNP具有最低等位基因頻率>10%。417個的標簽SNP組的平均間距為每IOkb有I個,與用于基因組掃描的200,000個的SNP組類似。
[0315]表1
r2_測試SNP的%
0.9-1.034%
[0316]
0.8-0.8910%
0.7-0.799%
【權利要求】
1.用于鑒定SNPID1990126處多態性的探針或引物在制造用于對人鑒定乳腺癌表型形成風險的組合物或系統中的用途,其中所述的鑒定包括: 檢測來自所述人的生物學樣品中的多態性或與之緊密連鎖的基因座,所述的多態性為SNP ID1990126,其中所述的多態性與乳腺癌表型相關;并且 將所述的多態性或基因座與所述的表型形成風險建立相關性。
2.權利要求1所述的用途,其中所述的檢測包括擴增多態性或連鎖基因座,并且檢測所得擴增子。
3.權利要求2所述的用途,其中所述的擴增包括: i) a)混合擴增引物或擴增引物對與分離自所述人的核酸模板,其中所述的引物或引物對與鄰近或包含所述的多態性或連鎖基因座的區互補或部分互補,并且能夠在所述核酸模板上由聚合酶啟動核酸聚合;和 b)使引物或引物對在包括聚合酶和模板核酸的DNA聚合反應中延伸以便生成擴增子;或 ii)進行聚合酶鏈反應(PCR)、逆轉錄酶PCR(RT-PCR)或連接酶鏈反應(LCR),其中使用所述的核酸作為PCR、RT-PCR或LCR中的模板。
4.權利要求2或3所述的用途,其中通過包括如下一個或多個步驟的方法檢測所述的擴增子:使該擴增子與陣列雜交;用限制酶消化該擴增子;或實時PCR分析。
5.權利要求2或3所述的用途,包括對所述的擴增子進行部分或完全測序。
6.權利要求1至5任一項所述的用途,其中所述的鑒定進一步包括: ⑴檢測在FGFR2、A2BP1、TNRC9、H19和FSTL5每種中的至少一個多態性;或 (ii)檢測SNP ID2312116、SNP ID1622530、SNP ID3712013、SNP ID1509710、和 SNPID843029每種的至少一個多態性;或 (iii)檢測如下每種的至少一個多態性:SNPID2312116、SNP ID1622530、SNPID3712013、SNP ID1509710、SNP ID843029、SNP ID604819、SNP ID3025734、SNP ID1152499、SNP ID4415909、 SNP ID1732681、 SNP ID4281579、 SNP ID4454457、 SNP ID2616199、SNP ID1720694、 SNP ID4077723、 SNP ID3711990、 SNP ID3337858、 SNP ID4093095、SNP ID4213825、SNP ID3488617、SNP ID3610210、SNP ID3451239、SNP ID1582533、SNPID3488150、SNP ID2770052、SNP ID4141351、SNP ID1335030、SNP ID2211665、和 SNPID4538418 ;或如下每種中的至少一個多態性:FGFR2、A2BP1、TNRC9、H19、FSTL5、LSPUL0C388927、UNQ939 UHCNU L0C441192、TNRC9、NR3C2、KIAA0826、FLJ31033、AACS、FRMD4A 和SEC31L2。
7.權利要求1至6任一項所述的用途,其中所述的連鎖基因座為距離所述多態性約5cM或5cM以下的緊密連鎖基因座。
8.權利要求1至7任一項所述的用途,其中將所述多態性或連鎖基因座與所述乳腺癌表型形成風險建立相關性包括參閱查閱表,該查閱表包含所述多態性或連鎖基因座的等位基因與所述乳腺癌表型形成風險的相關性的信息。
9.用于鑒定SNPID843029處多態性的探針或引物在制造用于對人鑒定乳腺癌表型形成風險的組合物或系統中的用途,其中所述的鑒定包括: 檢測來自所述人的生物學樣品中的多態性或與之緊密連鎖的基因座,所述的多態性為SNP ID843029,其中所述的多態性與乳腺癌表型相關;并且 將所述的多態性或基因座與所述的表型形成風險建立相關性。
10.用于鑒定SNP ID1152499處多態性的探針或引物在制造用于對人鑒定乳腺癌表型形成風險的組合物或系統中的用途,其中所述的鑒定包括: 檢測來自所述人的生物學樣品中的多態性或與之緊密連鎖的基因座,所述的多態性為SNP ID1152499,其中所述的多態性與乳腺癌表型相關;并且 將所述的多態性或基因座與`所述的表型形成風險建立相關性。
【文檔編號】C12Q1/68GK103710430SQ201310524916
【公開日】2014年4月9日 申請日期:2006年11月29日 優先權日:2005年11月29日
【發明者】戴維.考克斯, 丹尼斯.巴林杰, 布魯斯.龐德, 道格.伊斯頓 申請人:劍橋企業有限公司