輕度骨關節炎生物標志物及其用途
【專利摘要】本發明涉及新生物標志物的鑒定和選擇以及新生物標志物組合的鑒定和選擇,與未患骨關節炎的個體相比,所述新生物標志物和新生物標志物組合在患輕度骨關節炎的個體中差異表達。與本發明生物標志物的產物特異性和/或選擇性雜交的多核苷酸和蛋白質也包括在本發明的范圍內,還包括用于診斷輕度骨關節炎的含有所述多核苷酸和蛋白質的試劑盒。本發明還包括多核苷酸和蛋白質用于監測個體中疾病消退和監測治療方案的效力的用途,所述多核苷酸和蛋白質與本發明生物標志物的產物特異性和/或選擇性雜交。本發明還提供了本發明生物標志物的產物用于鑒定骨關節炎中新治療靶標的方法。
【專利說明】輕度骨關節炎生物標志物及其用途
[0001]本申請是申請號為200680011050.3的中國專利申請的分案申請,原申請是國際申請PCT/US2006/003926的中國國家階段申請。
1.【技術領域】
[0002]本發明涉及新輕度OA生物標志物的鑒定和選擇以及新生物標志物組合的鑒定和選擇,與未患骨關節炎的個體相比,所述新生物標志物和新生物標志物組合在患輕度骨關節炎的個體中差異表達。測量本發明生物標志物和組合生物標志物產物的表達在OA疾病早期患者的診斷中展示出特別的優點。應該理解,為了測量本發明生物標志物的產物,與本發明生物標志物的產物特異性和/或選擇性雜交/結合的多核苷酸和蛋白質也包括在本發明的范圍內,還包括含有所述多核苷酸和蛋白質、用于診斷個體患有輕度骨關節炎(0A, osteoarthritis)的試劑盒。本發明還提供在鑒定結合本發明生物標志物基因和/或調節其活性的化合物中使用本發明生物標志物產物的方法。通過這些方法鑒定的化合物可用于開發研究骨關節炎和骨關節炎進程的分析技術。此外,通過這些方法鑒定的化合物還可用作開發預防和治療組合物的先導化合物,所述組合物用于預防、治療、控制和/或改善骨關節炎或其癥狀。
2.【背景技術】
[0003]骨關節炎(OA)是關節軟骨隨時間逐漸退化的慢性疾病,所述關節軟骨覆蓋在骨末端,形成關節的關節面。據信有許多因素使患者易患骨關節炎,包括遺傳易感性、肥胖癥、 意外或運動創傷、手術、藥物和重體力需求。骨關節炎被認為是從關節軟骨的損傷開始的。 最普遍的兩種對關節的損傷是運動相關損傷和長期“反復使用”關節損傷。最經常受骨關節炎影響的關節是膝、髖和手。在多數情況下,由于膝和髖必要的承重功能,這些關節中的骨關節炎比手骨關節炎更易導致殘疾。隨著軟骨退化的發展,關節中和關節周圍的其他組織(包括骨、肌肉、韌帶、半月板和滑膜)中發生次級變化。軟骨組織初級衰竭和其他組織次級損傷的凈效應是患者發生疼痛、腫脹、虛弱和患病關節喪失機能。這些癥狀經常發展到具有嚴重影響的程度,即,使患者喪失勞動力和/或生活質量的后果。
[0004]關節軟骨主要由軟骨細胞、II型膠原、蛋白聚糖和水組成。關節軟骨沒有血或神經分布,軟骨細胞是該組織中僅有的細胞類型。軟骨細胞負責制造形成軟骨基質的II型膠原和蛋白聚糖。其后該基質又具有允許用水使基質飽和的物理化學特性。這種結構-功能關系的凈效應是關節軟骨具有特殊的耐磨特征,并且關節軟骨面之間發生幾乎無摩擦的移動。在未患骨關節炎時,關節軟骨經常在甚至高需求的身體條件下提供終生的無痛承重和無限制的關節移動。
[0005]與所有的活組織一樣,關節軟骨持續地經歷更新過程,其中去除(分解代謝活性)“老”細胞和基質組分并產生(合成代謝活性)“新”細胞和分子。相對于多數組織, 關節軟骨的合成代謝/分解代謝周轉率較低。成熟軟骨結構完整性的長期維持依賴于基質合成和降解之間適當的平衡。軟骨細胞通過應答于來自其環境中的化學和機械刺激維持基質平衡。軟骨細胞對這些刺激合適并有效的應答是軟骨動態平衡所必需的。通過合成代謝活性不足或分解代謝活性過剩破壞動態平衡可引起軟骨降解和骨關節炎(Adams等,1995, Nature377Suppl:3-174)。多數受到損傷和分解代謝活性提高的組織能夠啟動增強的合成代謝應答,允許組織復原。不幸的是,關節軟骨應答于軟骨基質損傷或消耗而上調其合成代謝活性以及提高合成蛋白聚糖和II型膠原的能力非常有限。[0006]目前沒有已知的醫學治療能逆轉這種軟骨損傷的效應。所有目前的骨關節炎療法都是針對治療其癥狀。此外,由于骨關節炎隱匿式發生并且發展緩慢,因此骨關節炎經常在疾病發展的晚期才得到鑒定,而不是潛在治療可能更有效的疾病發展早期。因此預防、改變或治療骨關節炎疾病過程中的進一步發展嚴重依賴于鑒定疾病的早期診斷標志物,從而允許早期干涉。
[0007]“輕度骨關節炎”目前非常難于診斷。醫師主要依賴患者的病史和身體檢查來進行骨關節炎的診斷,X光不顯示特定關節的早期改變。目前沒有公認的生化標志物可用于證實輕度骨關節炎的診斷。癥狀如發作性關節痛是早期骨關節炎的普遍表現。在發作時關節疼痛,疼痛可持續幾天至幾周并自發緩解。然而這些癥狀經常不與軟骨損傷的病理階段良好相關。“輕度”骨關節炎更可靠的度量可通過測定關節損傷的程度來獲得,然而目前沒有測量相對非侵襲性的關節衰退的方法。
3.
【發明內容】
[0008]本發明涉及新輕度OA生物標志物的鑒定和選擇、新輕度OA生物標志物組合的鑒定和選擇以及選擇新生物標志物組合的方法,與未患OA的個體相比,所述新輕度OA生物標志物和新輕度OA生物標志物組合在患輕度骨關節炎的個體中差異表達。測量本發明生物標志物或生物標志物組合的產物的表達在診斷個體為患輕度OA中展示出特定的優勢。應該理解,為了測量本發明生物標志物產物的表達,與本發明生物標志物及其衍生物的產物特異性和/或選擇性雜交/結合的多核苷酸和蛋白質也包括在本發明的范圍內,還包括用于診斷個體為患有輕度OA的含有所述多核苷酸和蛋白質的試劑盒。本發明還包括與本發明生物標志物的產物特異性和/或選擇性雜交的多核苷酸和蛋白質用于監測個體中疾病發展和監測治療方案的效力的用途。本發明還提供鑒定在骨關節炎新治療靶標的鑒定中使用本發明生物標志物的產物的方法。本發明還提供在與本發明基因結合和/或調節其活性的化合物的鑒定中使用本發明生物標志物產物的方法。通過這些方法鑒定的化合物可用于開發研究骨關節炎和骨關節炎發展的測定技術。此外,通過這些方法鑒定的化合物可在本發明預防和治療組合物的開發中用作先導化合物,所述組合物用于預防、治療、控制和/或改善骨關節炎或其癥狀。
[0009]本發明包括含有至少兩種分離多核苷酸的組合物,其中每種分離的多核苷酸與生物標志物選擇性雜交,所述生物標志物選自表1或表4列出的生物標志物,并且其中組合物允許測量至少兩種所述生物標志物的表達水平。
[0010]分離的多核苷酸可以是單鏈或雙鏈RNA或DNA。
[0011]本發明還包括含有至少兩種分離的多核苷酸的組合物,其中每種分離的多核苷酸與生物標志物的RNA產物和/或RNA產物的互補多核苷酸序列選擇性雜交,所述生物標志物選自表1或表4列出的生物標志物,并且其中組合物允許測量至少兩種所述生物標志物的RNA表達水平。
[0012]本發明的特征還在于包含兩種或更多分離多核苷酸集合的組合物,其中每種分離的多核苷酸與表3或表5中列出的RNA序列和/或該RNA序列的互補多核苷酸序列選擇性雜父。
[0013]本發明還包括包含至少兩種表6和/或表8中列出的生物標志物特異性引物的組合物。本發明還包括包含至少兩種表8中列出的多核苷酸探針的組合物。
[0014]本發明還包括包含兩種或更多分離蛋白質集合的組合物,其中每種分離的蛋白質與生物標志物的蛋白質產物選擇性結合,所述生物標志物選自表1或表4中列出的生物標志物,并且其中所述組合物用于測量至少兩種所述生物標志物的表達水平。表7中列出了本發明范圍內的分離蛋白質的實例。
[0015]分離的蛋白質可以是配體,其中所述配體包括抗體及其片段。單克隆抗體和多克隆抗體均在本發明范圍內。
[0016]包含至少兩種抗體的組合物也涵蓋在本發明的范圍內,其中每種抗體與生物標志物的蛋白質產物選擇性結合,所述生物標志物選自表1或表4中列出的生物標志物,并且其中所述組合物允許測量至少兩種所述生物標志物的表達水平。表7列出了本發明包括的抗體實例。
[0017]抗體可包括單克隆抗體和多克隆抗體。
[0018]本發明還涉及診斷或檢測個體中輕度OA的方法,其包括:測定來自個體的血樣中一種或多種生物標志物(包括表1和/或表4中列出的生物標志物)的RNA產物水平;將來自所述個體的血樣中RNA產物的水平與對照中相同RNA產物的水平進行比較,其中相同 RNA產物在個體與對照之間的差異表達指示個體中的輕度0A。血樣可以是全血、一滴全血或裂解血。
[0019]所述方法還可包括從血樣中分離RNA的步驟。
[0020]測定所述RNA產物水平的步驟可以使用定量RT-PCR(QRT-PCR)進行,任選地包括將與所述一種或多種RNA產物或其互補物雜交的引物與該RNA產物或其互補物雜交的步驟。引物的長度可以在約4-40個、優選8-35個、優選10-30個核苷酸之間,并且更優選引物的長度為15-25個核苷酸。此外,通過將第一組分離多核苷酸(對應于一種或多種RNA 轉錄物)與包含第二組分離多核苷酸的陣列雜交來進行測定每種RNA產物水平的步驟。第一個多核苷酸群任選地包括RNA、DNA、cDNA、PCR產物或EST。陣列上的第二組分離多核苷酸可包括對應于表1和/或表4中一種或多種生物標志物的多核苷酸。
[0021]在另一實施方案中,可以通過將所述分離RNA與包含多種分離多核苷酸的陣列雜交來進行測定RNA產物水平的步驟。陣列可任選地包括多種分離的多核苷酸,包括RNA、 DNA、cDNA、PCR產物或EST。陣列上的第二組分離多核苷酸可包括對應于表1和/或表4中一種或多種生物標志物的多核苷酸。
[0022]在一個實施方案中,對照來自未患輕度OA的個體。
[0023]本發 明還包括用于診斷或檢測輕度OA的試劑盒,其包括任一種上述組合物和使用說明書。 [0024]本發明還包括用于診斷或檢測輕度OA的試劑盒,其包括至少兩組生物標志物特異性引物,其中每組生物標志物特異性引物與選自表1和/或表4的獨特生物標志物產生雙鏈DNA互補性;其中所述組的每種第一引物含有與所述生物標志物之一互補的RNA、cDNA或EST選擇性雜交而產生延伸產物,所述組的每一所述第二引物能與所述延伸產物選擇性雜交。該試劑盒還可包括具有逆轉錄酶活性的酶、具有熱穩定DNA聚合酶活性的酶或標記手段。
[0025]本發明還涉及診斷或檢測個體中輕度OA的方法,其包括:測定來自個體的血樣中一種或多種生物標志物的蛋白質產物水平,所述生物標志物選自表1和/或表4中列出的生物標志物;將來自所述個體的血樣中蛋白質產物的水平與對照中相同蛋白質產物的水平進行比較,其中相同蛋白質產物在個體與對照之間的差異表達指示個體中的輕度0A。蛋白質產物的水平可以使用抗體或其片段進行檢測,包括表7中列出的抗體。抗體可包括單克隆抗體或多克隆抗體。
[0026]本發明還包括包含至少兩種分離多核苷酸的組合物,其中每種分離多核苷酸與表
1、表2和/或表4中所示的生物標志物選擇性雜交,并且其中組合物允許測量至少兩種生物標志物的表達水平,至少一種所述生物標志物選自表1或表4。
[0027]本發明還包括包含至少兩種分離多核苷酸的組合物,其中每種分離的多核苷酸與生物標志物的RNA產物和/或RNA產物的互補多核苷酸序列選擇性雜交,所述生物標志物選自表1、表2或表4列出的生物標志物,其中組合物允許測量至少兩種生物標志物的RNA表達水平,并且其中至少一種所述生物標志物選自表1或表4。
[0028]本發明還包括包含至, 少兩種抗體的組合物,其中每種抗體與生物標志物的蛋白質產物選擇性雜交,所述生物標志物選自表1、表2或表4列出的生物標志物,其中組合物允許測量至少兩種生物標志物的表達水平,并且其中至少一種所述生物標志物選自表1或表4。
[0029]本發明還涉及包含含有兩種或更多分離多核苷酸集合的組合物,其中每種分離多核苷酸與選自表1或表4所列生物標志物的生物標志物選擇性雜交。該組合物允許測量至少兩種生物標志物的表達水平,其中生物標志物能使用ROC曲線分析測定確定個體是否患有輕度0A。優選地,ROC曲線下面積大于0.5,優選大于約0.6,0.7,0.8或大于約0.9。
[0030]本發明還涉及檢測個體是否患有輕度OA的方法,包括測定來自患者的血樣中一種或多種生物標志物(包括表1、表2和/或表4列出的生物標志物)的RNA產物或蛋白質產物的水平;進行ROC曲線分析和測量ROC曲線下面積,其中如果ROC曲線下面積大于約0.5、優選大于約0.6,0.7,0.8或優選大于約0.9,則結論為在個體中檢測到輕度0A。
[0031]本發明提供了待測試其預防、治療、控制或改善骨關節炎或其癥狀能力的化合物的鑒定方法。該方法包括以下步驟:使一種或多種本發明生物標志物的蛋白質產物或其片段或者一種或多種本發明生物標志物的RNA產物或其片段與測試化合物接觸;檢測該測試化合物與蛋白質產物或RNA產物結合的能力,從而如果化合物與蛋白質產物或RNA產物結合,則將該化合物鑒定為待測試其預防、治療、控制或改善骨關節炎能力的化合物。
[0032]本發明還提供了待測試其預防、治療、控制或改善骨關節炎或其癥狀能力的化合物的鑒定方法。該方法包括以下步驟:使表達一種或多種本發明生物標志物的蛋白質或RNA產物的細胞與測試化合物接觸;在孵育期后,使用上文所述的任何組合物測定接觸測試化合物的細胞中存在的蛋白質或RNA產物的量;與未接觸測試化合物的相應對照細胞中存在的蛋白質或RNA產物的量進行比較,從而如果蛋白質或RNA產物的量相對于對照中的量發生改變,則將該化合物鑒定為待測試其預防、治療、控制或改善骨關節炎能力的化合物。
[0033]本發明還提供了待測試其預防、治療、控制或改善骨關節炎或其癥狀能力的化合物的鑒定方法。該方法包括以下步驟:使無細胞提取物(如軟骨細胞提取物)與核酸序列和測試化合物接觸,所述核酸序列編碼一種或多種本發明生物標志物的蛋白質或RNA產物;測定無細胞提取物中存在的蛋白質或RNA產物的量;與未接觸測試化合物的相應對照中存在的蛋白質或RNA產物的量進行比較,從而如果蛋白質或RNA產物的量相對于對照中的量發生改變,則將該化合物鑒定為待測試其預防、治療、控制或改善骨關節炎能力的化合物。
[0034]3.1 定義
[0035]對于以下書面描述中使用的特定術語,提供以下定義。
[0036]本文使用的術語“3’末端”指mRNA的至多后1000個核苷酸或1/3的mRNA末端,其中3’末端核苷酸為與多聚A尾(如果存在)相鄰的編碼區或非翻譯區末端核苷酸。即,mRNA的3’末端不包括多聚A尾(如果存在)。基因的“3’區”指位于基因3’末端中的多核苷酸(雙鏈或單鏈),包括但不限于3’非翻譯區(如果存在)和基因的3’蛋白質編碼區。3’區的長度不小于8個核苷酸,長度不大于1000個核苷酸。3’區的其他可能長度包括但不限于10、20、25、50、100、200、400和500個核苷酸。
[0037]本文使用的術語“5’末端”指mRNA的至多前1000個核苷酸或1/3的mRNA末端(其中mRNA的全長不包括多聚A尾),從mRNA的第一個核苷酸開始。基因的“5’區”指位于基因5’末端中的多核苷酸(雙鏈或單鏈),包括但不限于5’非翻譯區(如果存在)和基因的5’蛋白質編碼區。5’區的長度不小于8個核苷酸,長度不大于1000個核苷酸。5’區的其他可能長度包括但不限于10、20、25、50、100、200、400和500個核苷酸。[0038]本文使用的術語“擴增”指由模板核酸產生一種或多種核酸序列的一個或多個拷貝的過程,優選通過聚合酶鏈式反應的方法(Mullis和Faloona, 1987, MethodsEnzymol.155:335)。“聚合酶鏈式反應”或“PCR”指用于擴增一種或多種模板序列的體外方法。PCR反應包括重復串聯的溫度循環,一般在50-100 Ul的體積中進行。反應混合物包含dNTP(四種脫氧核苷酸dATP、dCTP、dGTP和dTTP中的每一種)、引物、緩沖液、DNA聚合酶和核酸模板。PCR反應包括提供至少一個多核苷酸引物組,其中第一種引物含有待擴增的核酸模板序列一條鏈中區域的互補序列,并引發互補DNA鏈的合成,第二種引物含有待擴增的特定靶核酸序列另一鏈中區域的互補序列,并引發互補DNA鏈的合成;使用核酸聚合酶作為模板依賴性聚合劑在允許以下PCR循環步驟的條件下擴增核酸模板序列:(i)使擴增所需引物與模板序列中含有的靶核酸序列退火,(ii)延伸引物,其中核酸聚合酶合成引物延伸產物,以及任選的變性步驟。“多核苷酸引物組”或“PCR引物組”可包含2種、3種、4種或更多種引物。在一個實施方案中,使用外-DNA聚合酶在PCR反應中擴增核酸模板。其他擴增方法包括但不限于連接酶鏈式反應(LCR)、基于多核苷酸特異性的擴增(NSBA)或任何本領域已知的核酸擴增方法。
[0039]本文使用的術語多肽的“氨基端”區指由位于基因5’末端內的多核苷酸序列(雙鏈或單鏈)編碼的多肽序列,包括但不限于基因的5’蛋白質編碼區。本文使用的術語“氨基端”區指由多肽的第一個氨基酸開始、最多為多肽的前300個氨基酸或1/3的多肽氨基末端。多肽的“氨基端”區長度不小于3個氨基酸,長度不大于350個氨基酸。多肽“氨基端”區的其他可能長度包括但不限于5、10、20、25、50、100和200個氨基酸。[0040]本文在蛋白質類物質(如蛋白質、多肽、肽和抗體)的上下文中使用的術語“類似物”指這樣的蛋白質類物質:其與第二種蛋白質類物質具有相似或相同的功能,但不一定包含與所述第二種蛋白質類物質相似或相同的氨基酸序列或具有與第二種蛋白質類物質相似或相同的結構。具有相似的氨基酸序列的蛋白質類物質指滿足以下至少一項的第二種蛋白質類物質:(a)具有與第二種蛋白質類物質的氨基酸序列至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99% —致性的氨基酸序列的蛋白質類物質;(b)由核苷酸序列編碼的蛋白質類物質,所述核苷酸序列在嚴謹條件下與編碼第二種蛋白質類物質的至少5個連續氨基酸殘基、至少10個連續氨基酸殘基、至少15個連續氨基酸殘基、至少20個連續氨基酸殘基、至少25個連續氨基酸殘基、至少40個連續氫基酸殘基、至少50個連續氨基酸殘基、至少60個連續氨基酸殘基、至少70個連續氨基酸殘基、至少80個連續氨基酸殘基、至少90個連續氨基酸殘基、至少100個連續氨基酸殘基、至少125個連續氨基酸殘基或至少150個連續氨基酸殘基的核苷酸序列雜交;和(c)由核苷酸序列編碼的蛋白質類物質,所述核苷酸序列與編碼第二種蛋白質類物質的核苷酸序列有至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99% —致性。與第二種蛋白質類物質結構相似的蛋白質類物質指具有與第二種蛋白質類物質相似的二級、三級或四級結構的蛋白質類物質。蛋白質類物質的結構可以通過本領域技術人員公知的方法測定,包括但不限于肽測序、X線晶體衍射、核磁共振、圓二色性和晶體電子顯微術。[0041]為了測定兩個氨基酸序列或兩個核酸序列之間的百分比一致性,以最佳比較的目的比對序列(例如為了與一個氨基酸或核酸序列最佳比對,可以在另一氨基酸或核酸序列中引入缺口)。接著比較相應氨基酸位置或核苷酸位置上的氨基酸殘基或核苷酸。當第一個序列中的位置被第二個序列中相應位置上的相同氨基酸殘基或核苷酸占據時,則所述分子在該位置上是相同的。兩序列之間的百分比一致性是序列間共享的相同位置數的函數(即%—致性=相同的重疊位置數/位置總數乘以100%)。在一個實施方案中,兩個序列的長度相同。
[0042]也可以使用數學算法實現兩序列間百分比一致性的測定。用于比較兩個序列的數學算法的優選非限制性實例為 Karlin 和 Altschul, 1993,Proc.Natl.Acad.Sc1.U.S.A.90:5873-5877 改良的 Karlin 和 Altschul, 1990,Proc.Natl.Acad.Sc1.U.S.A.87:2264-2268的算法。這樣的算法整合在 Altschul 等,1990,J.Mol.Biol.215:403 的 NBLAST 和 XBLAST程序中。可以使用NBLAST核苷酸程序的參數組(如評分=100,字長=12)進行BLAST核苷酸搜索,以獲得與本發明核酸分子同源的核苷酸序列。可以使用XBLAST核苷酸程序的參數組(如評分=50,字長=3)進行BLAST蛋白質搜索,以獲得與本發明蛋白質分子同源的氨基酸序列。為了獲得用于比較目的的缺口比對,可以使用Altschul等,1997,NucleicAcids Res.25:3389-3402 所述的 Gapped BLAST。或者,可以使用 PS1-BLAST 進行迭代搜索,其檢測分子間的遠緣關系(Id.)。使用BLAST、Gapped BLAST和PS1-BLAST程序時,可使用各個程序(如XBLAST和NBLAST)的默認參數(參見如NCBI網址)。用于序列比較的另一優選非限制性實例為Myers和Miller,1988,CAB10S4:11-17的算法。這樣的算法整合在ALIGN程序(2.0版)中,后者是GCG序列比對軟件包的一部分。使用ALIGN程序比較氨基酸序列時,可使用PAMI20的權重殘基表、12的缺口長度罰分和4的缺口罰分。可以允許或不允許缺口地使用與上述類似的技術測定兩序列之間的百分比一致性。在百分比一致性的計算中一般僅計數準確匹配。
[0043]在非蛋白質類類似物的上下文中,本文使用的術語“類似物”指具有與第一種有機或無機分子相似或相同的功能并在結構上與第一種有機或無機分子相似的另一種有機或無機分子。
[0044]本文使用的術語“生物標志物”指在患輕度OA個體和未患輕度OA的個體之間差異表達的基因。
[0045]本文使用的術語“生物標志物特異性引物”指引發合成本發明生物標志物RNA產物部分的互補DNA的引物。例如,引物可包括第一種引物(它是能與本發明生物標志物區域的互補RNA、cDNA或EST選擇性雜交以產生延伸產物的序列)和能與延伸產物選擇性雜交的第二種引物,它們用于產生與本發明生物標志物區域互補的雙鏈DNA。本發明包括用于測量本發明生物標志物RNA產物表達的引物。表8提供了引物的代表性種類。
[0046]本文使用的術語“生物標志物特異性探針”指能與本發明生物標志物序列或其互補RNA、cDNA或EST選擇性雜交的核酸探針。例如,探針可以附在陣列(包括微陣列)上,或者探針可以與生物標志物特異性引物聯合使用,以允許進行定量實時RT-PCR(例如TaqMan (|)或Molecular Beacon 探針)。表8提供了可用于本發明的TaqMan⑩:探針以及相應引物的代表種類。生物標志物特異性探針能與生物標志物序列或其互補物序列的一部分(例如至少約8個連續核酸殘基)、最多為(且包括)生物標志物的完整序列選擇性雜交。例如生物標志物特異性探針能與生物標志物或其互補物的至少約8、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100或更多、最多為(且包括)完整序列選擇性雜父。
[0047]本文使用的術語“數據”或“生物標志物數據”通常指反映血樣中可見的生物標志物產物豐度的數據。
[0048]本文使用的術語“患者樣品”指來自患者的生物學樣品,可以在其中檢測輕度OA的生物標志物。患者樣品包括但不限于血、血清、唾液、尿、滑液、組織等樣品。優選地,患者樣品為血樣。
[0049]本文使用的術語“血核酸樣品”指得自血的核酸,可包括得自全血、離心裂解血、無血清全血或分級血(包括外周血白細胞(PBL)或本文所述的其他血級分)的核酸。全血指未分級血,例如一滴血,其中一滴血包括5ii1、i0ia、i5ia、20ii1、25ia、30ia的體積。離心裂解血或“裂解血”指如本文所述與裂解緩沖液混合并離心的全血(見實施例2)。無血清血指如本文所述通過離心去除了血清或血漿的全血(見實施例2)。優選地,血核酸樣品為全血或離心裂解血,并且為總RNA、mRNA或者為對應于mRNA的核酸,例如從所述血中分離的cANA。血核酸樣品還可包括得自總RNA、mRNA或cDNA的PCR產物。
[0050]本文使用的術語多肽的“羧基端”區指由位于基因3’末端內的多核苷酸序列(雙鏈或單鏈)編碼的多肽序列,包括但不限于基因的3’蛋白質編碼區。本文使用的術語“羧基端”區指從多肽的最后一個氨基酸開始最多為多肽的300個氨基酸或1/3的多肽羧基末端。“3’末端”不包括多聚A尾(如果存在)。
[0051]多肽的“羧基端”區長度不小于3個氨基酸,長度不大于350個氨基酸。多肽“羧基端”區的其他可能長度包括但不限于5、10、20、25、50、100和200個氨基酸。
[0052]本文使用的術語“軟骨核酸樣品”指來自軟骨的核酸。優選地,軟骨核酸樣品為總RNA、mRNA或者為對應于RNA的核酸,例如cDNA。軟骨核酸樣品還可包括得自總RNA、mRNA或cDNA的PCR產物。
[0053]本文使用的術語“本發明生物標志物組合”指表1或表4公開的任何一種或多種生物標志物以及表1和/或表2公開的任何兩種或更多生物標志物的任何組合,只要所述組合中至少一種生物標志物來自表1。術語“本發明生物標志物組合”指表4和/或表2公開的任何兩種或更多生物標志物的任何組合,只要所述組合中至少一種生物標志物來自表4。術語“本發明生物標志物組合”指表1和表4和/或表2公開的任何兩種或更多生物標志物的任何組合,只要所述組合中至少一種生物標志物來自表1或表4。
[0054]本文使用的術語“化合物”和“物質”可互換使用。
[0055]本文使用的“基本由......組成”指用于診斷輕度骨關節炎的生物標志物基因的
最大數目。在一個實施方案中,用于診斷輕度骨關節炎的生物標志物基本由表1和/或表4 的生物標志物中最多 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、100、150種中至少任一項或最多全部組成。在另一實施方案中,用于診斷輕度骨關節炎的生物標志物基本由表1和/或表4的生物標志物中最多1、2、3、4、5、6、7、8、
9、10、11、13、15、20、25、30、35、40、45、50、100、150 種中至少任一項與申請號 10/915,680 中公開并在表2中公開的生物標志物中最多1、2、3、4、5、6、7、8、9或10、15、20、30、40、50種中至少任一項或最多全部的組合組成。在一個實施方案中,用于診斷輕度骨關節炎的生物標志物基本由表 4 的生物標志物中最多 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、
19、20、25、30種中至少任一項或最多全部組成。
[0056]在診斷輕度骨關節炎的上下文中,本文使用的術語“對照”或“對照樣品”指使用除本發明生物標志物以外的手段從確定未患骨關節炎(即“正常對照”)或確定患輕度骨關節炎(即“輕度OA對照”)的個體或個體組中分離的一種或多種樣品。術語對照或對照樣品還可指數據的匯編,所述數據來自分類為未患骨關節炎(即“正常對照”)或患輕度骨關節炎(即“輕度OA對照”)的一個或多個個體的樣品。在篩選預防或治療劑的上下文中,本文使用的術語“對照”指用于測定或方法的標準品或參照,可以對其比較其他條件。
[0057]在蛋白質類物質(如蛋白質、多肽、肽和抗體)的上下文中,本文使用的術語“衍生物”指蛋白質類物質,其包含已通過引入一個或多個氨基酸殘基的替換、缺失和/或添加進行了改變的氨基酸序列。本文使用的術語“衍生物”還指經修飾的蛋白質類物質,例如通過在該蛋白質類物質上共價附加任何類型的分子進行修飾。例如(但不僅限于)抗體可以通過糖基化、乙酰化、聚乙二醇化、磷酸化、酰胺化、通過已知保護/封閉基團的衍生化、蛋白質水解切割、與細胞配體或其他蛋白質連接等進行修飾。蛋白質類物質的衍生物可以使用本領域技術人員公知的技術通過化學修飾產生,包括但不限于特異性化學切割、乙酰化、甲酰化、衣霉素的代謝合成等。此外,蛋白質類物質的衍生物可含有一種或多種非經典氨基酸。蛋白質類物質的衍生物具有與其衍生自的蛋白質類物質相似或相同的功能。
[0058]本文使用的術語“分類器”用于描述數學模型由其區分兩種或更多表型性狀(如患或未患輕度OA的個體)的輸出。
[0059]在非蛋白質類物質的上下文中,本文使用的術語“衍生物”指基于一種有機或無機分子結構形成的另一種有機或無機分子。有機分子的衍生物包括但不限于經修飾的分子,例如通過添加或缺失羥基、甲基、乙基、羧基或胺基進行修飾。有機分子還可以酯化、烷基化和/或磷酸化。
[0060]根據本發明的一個方面,本文使用的術語“診斷輕度0A”或“輕度OA診斷”指確定個體是否患有輕度OA的方法。在一個具體實施方案中,“診斷輕度OA”或“輕度OA診斷”指在兩種選擇之間進行確定,即個體患輕度OA或個體未患輕度0A。在另一具體實施方案中,“診斷”指在三種選擇之間進行確定,個體患輕度0A、個體未患輕度OA或者不能以充分的確定度確定個體患輕度OA還是未患輕度0A。本領域技術人員會理解,在該上下文中,“充分的確定度”取決于診斷的靈敏度和特異性。更具體地,充分的確定度包括高于50%的靈敏度和域特異性、高于60 %的靈敏度和/或特異性、高于70 %的靈敏度和/或特異性、高于80 %的靈敏度和/或特異性、高于90%的靈敏度和/或特異性和100%的靈敏度和/或特異性。
[0061]本文使用的術語“差異表達”指一種或多種本發明生物標志物的RNA和/或蛋白質產物表達水平的差異,其以RNA或蛋白質的量或水平衡量。對于RNA,它可包括第一種樣品中生物標志物的mRNA和/或一種或多種mRNA剪接變體的表達水平與第二種樣品中相同的一種或多種本發明生物標志物以RNA (包括mRNA和/或一種或多種mRNA剪接變體)量或水平衡量的表達水平之間的差異。“差異表達的”或“差異表達”還可包括與本發明生物標志物的蛋白質(包括一種或多種蛋白質變體)表達量或水平相比,測量樣品或樣品群中本發明生物標志物編碼的蛋白質或一種或多種蛋白質變體。可以如本文所述和本領域技術人員的理解測定差異表達。術語“差異表達的”或“表達水平的改變”指樣品中以RNA量和/或蛋白質量衡量的生物標志物給定產物可測量表達水平與第二種樣品中生物標志物給定產物的可測量表達水平相比的提高或降低。所述第一種樣品與第二種樣品不一定來自不同的患者,而是可以為在不同時間點取自同一患者的樣品。術語“差異表達的”或“表達水平的改變”還可以指樣品群中給定生物標志物可測量表達水平與第二個樣品群中生物標志物的可測量表達水平相比的提高或降低。涉及單個樣品時,本文使用的術語“差異表達的”可使用所述樣品中給定生物標志物表 達水平與對照樣品中給定生物標志物平均表達水平的比例來衡量,其中比例不等于1.0。差異表達的還可用于包括使用表達水平比或使用p值將樣品的一個群與樣品的另一個群進行比較,或者將單個樣品與樣品群進行比較。使用P值時,當P值低于0.1、低于0.05、低于0.01、低于0.005、低于0.001等時,將核酸轉錄物(包括hnRNA和mRNA)鑒定為在第一種和第二種群中差異表達。基于基因產物表達水平的比例測定差異表達時,如果第一個樣品中其RNA或蛋白質產物表達水平與第二個樣品中相比高于或低于1.0,則RNA或蛋白質基因產物差異表達。例如,基因RNA或蛋白質產物的比例高于1(例如 1.2、1.5、1.7、2、3、4、10、20)或比例低于 I (例如 0.8,0.6,0.4,0.2,0.1.0.05)將指示差異表達。在本發明的另一實施方案中,如果核酸群中第一種轉錄物的平均表達水平與第二個群的平均表達水平相比比例高于或低于1.0,則核酸轉錄物(包括hnRNA和mRNA)差異表達。例如,比例高于I (例如1.2、1.5、1.7、2、3、4、10、20)或比例低于I (例如0.8、0.6、
0.4、0.2、0.1.0.05)將指不差異表達。在本發明的另一實施方案中,如果第一種樣品中其表達水平與第二個群的平均值相比高于或低于1.0,包括比例高于I (例如1.2、1.5、1.7、2、3、4、10、20)或比例低于I (例如0.8、0.6、0.4、0.2、0.1.0.05),則核酸轉錄物(包括hnRNA和mRNA)差異表達。“提高的差異表達”指相對于標準品如第二個群中的平均表達水平為1.1倍、1.2倍、1.4倍、1.6倍、1.8倍或更高。“降低的差異表達”指相對于標準品如第二個群中的平均表達水平低于1.0倍、0.8倍、0.6倍、0.4倍、0.2倍、0.1倍或更低。
[0062]本文使用的術語“藥物效力”指藥物的有效性。“藥物效力” 一般通過已經接受或正在接受藥物治療的患者的臨床反應來衡量。如果實現了期望的臨床結果(例如像本說明書中所述降低了骨關節炎的癥狀或防止了骨關節炎的發展),則認為藥物具有高效力水平。可以使用吸收的藥物量來預測患者的反應。一般的規則為隨著藥物劑量的提高可見患者中更高的效果,直至達到最高的期望效果。如果在達到最高點之后施用更多藥物,則副作用一般會提聞。
[0063]本文使用的術語“有效量”指足以降低或改善骨關節炎或其一種或多種癥狀的發展、嚴重性和/或持續時間、骨關節炎或其一種或多種癥狀的復發或發生、防止骨關節炎或其一種或多種癥狀的進展或者增強或改善其他治療的預防或治療效果的化合物的量。
[0064]在蛋白質類物質的上下文中,本文使用的術語“片段”指肽或多肽,其包含多肽或蛋白質的氨基酸序列中至少5個連續氨基酸殘基,至少10個連續氨基酸殘基、至少15個連續氨基酸殘基、至少20個連續氨基酸殘基、至少25個連續氨基酸殘基、至少40個連續氨基酸殘基、至少50個連續氨基酸殘基、至少60個連續氨基酸殘基、至少70個連續氨基酸殘基、至少80個連續氨基酸殘基、至少90個連續氨基酸殘基、至少100個連續氨基酸殘基、至少125個連續氨基酸殘基、至少150個連續氨基酸殘基、至少175個連續氨基酸殘基、至少200個連續氨基酸殘基或至少250個連續氨基酸殘基的氨基酸序列。在一個具體實施方案中,蛋白質或多肽的片段保留該蛋白質或多肽的至少一種功能。在另一實施方案中,蛋白質或多肽的片段保留該蛋白質或多肽的至少一種、兩種、三種、四種或五種功能。優選地,抗體的片段保留與抗原免疫特異性結合的能力。
[0065]本文使用的術語“融合蛋白”指包含第一種蛋白質或多肽或其片段、其功能性片段、其類似物或其衍生物的氨基酸序列和異源蛋白質、多肽或肽(即與第一種蛋白質或其片段、類似物或其衍生物不同的第二種蛋白質或多肽或其片段、類似物或衍生物)的氨基酸序列的多肽。在一個實施方案中,融合蛋白包含與異源蛋白質、多肽或肽融合的預防或治療劑。根據該實施方案,所述異源蛋白質、多肽或肽是或不是另一種類型的預防或治療劑均可。
[0066]本文使用的術語“基因表達模式”、“基因表達譜”和“核酸陣列表達譜”可互換使用,包含與非OA個體或正常個體相比,多種靶核酸序列與輕度OA個體陣列上多種核酸探針雜交的雜交模式。“基因表達模式”、“基因表達譜”和“核酸陣列表達譜”還可指對應于兩種或更多本發明生物標志物的RNA和/或蛋白質豐度水平的模式,其通過本領域已知用于測量所述RNA和/或蛋白質水平的方法測定。例如,所述模式可以是模式的數學呈現,如數學等式、矢量等。
[0067]本文使用的術語“與......雜交”和“雜交”指與互補核酸的序列特異性非共價
結合相互作用,例如靶核酸序列與陣列上核酸成員之間的相互作用。
[0068]本文使用的術語“免疫球蛋白”指基本由免疫球蛋白基因編碼的一種或多種多肽組成的蛋白質或其抗原結合片段。公認的人免疫球蛋白基因包括Ha (IgAl和IgA2)、Y (IgGl、IgG2、IgG3、IgG4)、S、e和y恒定區基因以及眾多的免疫球蛋白可變區基因。全長免疫球蛋白“輕鏈”(約25Kd或214個氨基酸)在NH2-端(約110個氨基酸)由可變區基因編碼,在COOH-端由K和\恒定區基因編碼。類似地,全長免疫球蛋白“重鏈”(約50Kd或446個氨基酸)由可變區基因(約116個氨基酸)和其他上述恒定區基因之一(如Y)編碼(編碼約330個氨基酸)。
[0069]涉及治療時,本文使用的術語“組合”指使用一種以上的治療(如一種以上的預防劑和/或治療劑)。術語“組合”的使用不限制對受試者施用治療(如預防和/或治療劑)的順序。可以在對受試者施用第二種治療(如第二種預防或治療劑)之前(如之前5分鐘、15分鐘、30分鐘、45分鐘、I小時、2小時、4小時、6小時、12小時、24小時、48小時、72小時、96小時、I周、2周、3周、4周、5周、6周、8周或12周)、同時、或之后(如之后5分鐘、15分鐘、30分鐘、45分鐘、I小時、2小時、4小時、6小時、12小時、24小時、48小時、72小時、96小時、I周、2周、3周、4周、5周、6周、8周或12周)施用弟一種治療(如弟一種預防或治療劑)。
[0070]涉及表達模式時,本文使用的“疾病或病癥的指示”表示這樣的表達模式:所述表達模式可診斷疾病或病癥(如存在輕度0A)或者指示有輕度OA風險,使得該表達模式在患所述疾病或病癥的患者中比在無該疾病或病癥的患者中顯著更頻繁地發現(使用置信水平設置為最低70%、75%、80%、85%、90%、95%等的常規統計學方法測定)。優選地,作為疾病指示的表達模式可見于至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或更多患該疾病的患者,并可見于10%以下、8%以下、5%以下、2.5%以下或1%以下未患該疾病的患者。“疾病指示”還表示這樣的表達模式:所述表達模式可診斷疾病,從而與無該疾病個體的對照表達模式相比,用患病個體的對照表達模式可以對該表達模式更適當地進行分類,其中使用本領域技術人員了解的用于分類預測的統計學算法,參閱如以商業提供的程序,如Silicon Genetics提供的程序(如GeneSpring?)。
[0071]本文使用的術語基因的“內部編碼區”指位于本文定義的基因5’區與3’區之間的多核苷酸(雙鏈或單鏈)。“內部編碼區”的長度不小于8個核苷酸,長度可達1000個核苷酸或更長。“內部編碼區”的其他可能長度包括但不限于10、20、25、50、100、200、400和500個核苷酸。5’、3’和內部區是不重疊的,可以(但不必須)是連續的,可以(但不必須)加在一起成為相應基因的全長。
[0072]本文使用的術語多肽的“內部多肽區”指位于本文定義的多肽氨基端區與羧基端區之間的多肽序列。多肽的“內部多肽區”長度不小于3個氨基酸,長度可達350個氨基酸或更長。多肽“內部多肽區”的其他可能長度包括但不限于5、10、20、25、50、100和200個
氨基酸。
[0073]多肽的氨基端、羧基端和內部多肽區是不重疊的,可以(但不必須)是連續的,可以(但不必須)加在一起成為相應多肽的全長。
[0074]涉及核酸使用時,本文使用的術語“分離的”或“純化的”指天然存在的序列已從其正常的細胞(如染色體)環境中移出或在非天然環境中合成(如人工合成的)。因此,“分離的”或“純化的”序列可以在無細胞溶液中或置于不同的細胞環境中。術語“純化的”不暗示該序列僅存在核苷酸,而是其基本不含(約90-95%純度)與其天然共存的非核酸物質,由此區別于分離的染色體。
[0075]在蛋白質類物質(如肽、多肽、蛋白質或抗體)的上下文中,本文使用的術語“分離的”和“純化的”指這樣的蛋白質類物質:其基本不含細胞物質,在一些實施方案中基本不含來自其來源細胞或組織源的異源蛋白質類物質(如污染蛋白),或者在化學合成時基本不含化學前體或其他化學品。“基本不含細胞物質”一語包括蛋白質類物質的制備物,其中所述蛋白質類物質與其分離或重組產生的細胞中的細胞組分分開。因此基本不含細胞物質的蛋白質類物質包括含有低于約30%、20%、10%或5% (以干重計)異源蛋白質類物質(如蛋白質、多肽、肽或抗體,也稱為“污染蛋白”)的蛋白質類物質制備物。所述蛋白質類物質重組產生時,還優選基本不含培養基,即培養基占低于約20 %、10%或5 %的蛋白質制備物體積。所述蛋白質類物質通過化學合成產生時優選基本不含化學前體或其他化學品,即其與該蛋白質類物質的合成中涉及的化學前體或其他化學品分開。因此,這些蛋白質類物質制備物含有低于約(以干重計)的化學前體或除目的蛋白質類物質以外的化合物。本文公開的蛋白質類物質優選為分離的。
[0076]本文使用的術語“表達水平”指通過本領域技術人員已知和本文所述的方法測定的給定核酸或蛋白質的可測量。涉及本發明生物標志物對應的RNA、hnRNA、mRNA或mRNA剪接變體時,表達水平可以通過雜交或更多定量測量來測定,例如包括使用SYBR⑩綠、TaqMan ?和分子信標技術的定量實時RT PCR0
[0077]本文使用的術語“配體”是與本發明生物標志物基因之一編碼的多肽特異性結合的分子。配體可以是核酸(RNA或DNA)、多肽、肽或化合物。本發明的配體可以是肽配體,如分支肽、線性肽或環肽。在一個優選的實施方案中,多肽配體為抗體。抗體可以是人抗體、嵌合抗體、重組抗體、人源化抗體、單克隆抗體或其抗原結合片段或者多克隆抗體。抗體可以是完整的免疫球蛋白,如184、1§6、1§£、1§0、1§11或其亞型。抗體可以與功能性部分(如具有生物或化學功能的化合物)綴合,所述功能性部分可以是另一種不同的多肽、治療藥物、細胞毒劑、可檢測部分或固相支持物。本發明的多肽配體(如抗體多肽)以高親和力和特異性與生物標志物之一編碼的多肽相互作用。例如,多肽配體以至少IO7M'優選至少IO8M'IO9IT1或IOkT1的親和常數與生物標志物之一編碼的多肽相互作用。
[0078]本文使用的術語“大多數”指代表組合全部成員的50%以上(如51%、60%、70%、80%、90%或最高100%)的數字。 涉及陣列時,術語“大多數”指穩定結合在陣列固相襯底上的全部核酸成員的50%以上(如51%、60%、70%、80%、90%或最高100% )。
[0079]本文使用的術語“控制”指受試者由治療(如預防或治療劑)產生的有益效果,所述效果不引起骨關節炎的治愈。在某些實施方案中,對受試者施用一種或多種治療以“控制”骨關節炎,從而防止骨關節炎的發展或惡化。
[0080]本文使用的術語“mRNA完整性”指提取自軟骨樣品或血樣的mRNA提取物的質量。使用本領域熟知的方法如RNA瓊脂糖凝膠電泳(如Ausubel等,John ffeley&Sons, Inc.,1997, Current Protocols in Molecular Biology)進行檢查時,具有良好完整性的 mRNA提取物不顯示降解。優選地,mRNA樣品具有良好的完整性(如mRNA的10%以下、優選5%以下、更優選1%以下發生降解),以真實代表由其中提取的軟骨或血樣品中的基因表達水平。
[0081 ] 本文使用的術語“無反應”和“耐受”描述用目前可用的骨關節炎療法(如預防或治療劑)進行治療的患者,所述療法在臨床上不足以緩解其一種或多種相關癥狀。通常,這些患者承受嚴重的持續活動的疾病,需要額外的療法以改善其骨關節炎相關癥狀。
[0082]本文使用的“正常”指未顯示任何OA癥狀(包括關節痛)并且未診斷為關節損傷或OA的個體或個體組。優選地,所述正常個體未使用影響OA的藥物,并且未診斷為患有任何其他疾病。更優選地,正常個體具有與測試樣本相比相似的性別、年齡和體重指標(BMI)。根據本發明,“正常”還指分離自正常個體的樣品,包括分離自正常個體的總RNA或mRNA。取自正常個體的樣品可包括分離自軟骨組織的RNA,其中RNA分離自完整軟骨或一塊軟骨,所述軟骨分離自組織移除時未診斷為OA并且未顯示任何OA癥狀的個體。在本發明的一個實施方案中,在死后14小時分離“正常”軟骨樣品并確認所提取mRNA樣品的完整性。取自正常個體的樣品還可包括分離自血樣的RNA,其中血來自在分離血時未診斷為OA并且未顯示任何OA癥狀的個體。
[0083]本文使用的“核酸”可與術語“多核苷酸”互換使用,通常指任何多聚核糖核苷酸和多聚脫氧核糖核苷酸,可以是未修飾的RNA或DNA或經修飾的RNA或DNA或其任何組合。“核酸”包括但不限于單鏈和雙鏈核酸。本文使用的術語“核酸”還包括如上文所述含有一個或多個修飾堿基的DNA或RNA。因此,為了穩定性或其他原因修飾了骨架的DNA或RNA為“核酸”。本文使用的術語“核酸”包括核酸的這些化學、酶或代謝修飾的形式以及病毒和細胞(包括如簡單細胞和復雜細胞)DNA和RNA特征的化學形式。“核酸”或“核酸序列”還可包括單鏈或雙鏈RNA或DNA的區域或其任何組合,并可包括本發明一些實施方案的表達序列標簽(EST)。EST是通過逆轉錄mRNA區以產生cDNA而產生的基因的一部分表達序列(即序列的“標簽”)。
[0084]本文定義的“核酸陣列”指附加在支持物上的多種獨特核酸(或“核酸成員”),其中每種核酸成員附加在支持物上獨特的預選區域內。在一個實施方案中,附加在支持物表面的核酸成員為DNA。在一個優選的實施方案中,附加在支持物表面的核酸成員為cDNA或寡核苷酸。在另一優選的實施方案中,附加在支持物表面的核酸成員為通過聚合酶鏈式反應(PCR)合成的cDNA。本文使用的術語“核酸”可與術語“多核苷酸”互換使用。在另一優選的實施方案中,“核酸陣列”指用于Southern和/或Northern印跡技術的附加在硝酸纖維素或其他膜上的多種獨特核酸。
[0085]本文使用的“核酸探針”包括能通過一組非共價結合相互作用(包括互補堿基配對相互作用)與陣列上核酸成員的互補序列結合的核酸。本文使用的核酸探針可包含天然(即A、G、C或T)或修飾堿基(7-脫氮鳥苷、肌苷等)。此外,核酸探針中的堿基可以通過磷酸二酯鍵以外的鍵結合,只要它不干擾雜交(即該核酸探針仍在標準嚴謹或選擇性雜交條件下與其互補序列特異性結合)。因此,核酸探針可以為肽核酸,其中組成堿基通過肽鍵而不是磷酸二酯鍵結合。
[0086]本文使用的“核酸靶標”或“核酸成員”定義為能與陣列結合的核酸。核酸靶標可以是對應于基因或其部分的分離核酸序列,或者核酸靶標可以是分離自樣品的總RNA或mRNA。優選地,核酸靶標或核酸標志物來自人軟骨、血或滑液提取物。更優選地,核酸靶標為單鏈或雙鏈DNA、RNA或DNA-RNA雜交體,其來自人軟骨、血或滑液總RNA提取物,優選來自mRNA提取物。
[0087]在一個實施方案中,與陣列結合的“靶”序列的常規核酸陣列可代表完整的人基因組,如AfTymetrix芯片,并且常規陣列應用由兩種或更多生物標志物特異性探針組成或包含兩種或更多生物標志物特異性探針的分離的生物標志物,所述探針對應于表1、表4和/或表2所述基因,只要至少一種生物標志物特異性探針來自表1或表4。[0088]在另一實施方案中,與陣列結合的序列可以是對應于本發明生物標志物的分離寡核苷酸、cDNA、EST或PCR產物,對陣列應用細胞總RNA。
[0089]本文使用的術語“寡核苷酸”定義為包含兩個或更多脫氧核糖核苷酸和/或核糖核苷酸(優選三個以上)的分子。其準確的大小取決于許多因素,所述因素又取決于寡核苷酸最終的功能和用途。寡核苷酸的長度可以從約8至約1000個核苷酸。盡管本發明可使用8至100個核苷酸的寡核苷酸,但優選的寡核苷酸范圍為長度從約8至約15個堿基、長度從約8至約20個堿基、長度從約8至約25個堿基、長度從約8至約30個堿基、長度從約8至約40個堿基或長度從約8至約50個堿基。
[0090]本文使用的“骨關節炎”指關節炎的特定形式,特別是關節軟骨隨時間逐漸退化的慢性疾病,所述關節軟骨覆蓋在形成關節面的骨末端上。
[0091]本文使用的術語“輕度骨關節炎(OA) ”指個體中OA的特定進展或程度,或者根據Marshall 評分系統(Marshall W., 1996, The Journal of Rheumatology, 23:582-584,引入為參考)定義的特定的OA病理學水平。根據該方法,基于特定表面上存在的最嚴重損傷對6個關節面(髕骨、股骨滑車、股骨內側踝、脛骨內側坪、股骨外側踝和脛骨外側坪)中的每一個給予軟骨分級。輕度OA的命名指示了對每個關節面應用以反映該面的軟骨嚴重性級別的分數的總分。例如,如果股骨內側踝最嚴重的軟骨損傷為為I級損傷,則給予I的分值。接著由6個關節面分數的總和產生患者的總分。基于總分將每名患者分入4個OA組中:“輕度”(早期)定義為Marshall分數1_6,“中度”定義為Marshall分數7_12,“顯著”定義為Marshall分數13_18,“重度”定義為Marshall分數高于18。
[0092]本文使用的術語“可藥用鹽”包括但不限于使用本發明方法鑒定的化合物中可存在的酸性或堿性基團的鹽。堿性性質的化合物能與多種無機和有機酸形成多種鹽。可用于制備這些堿性化合物的可藥用酸加成鹽的酸為形成無毒酸加成鹽的酸,所述無毒酸加成鹽即含有可藥用陰離子的鹽,包括但不限于硫酸鹽、檸檬酸鹽、馬來酸鹽、乙酸鹽、草酸鹽、鹽酸鹽、氫溴酸鹽、氫碘酸鹽、硝酸鹽、硫酸鹽、硫酸氫鹽、磷酸鹽、酸性磷酸鹽、異煙酸鹽、乙酸鹽、乳酸鹽、水楊酸鹽、檸檬酸鹽、酸性檸檬酸鹽、酒石酸鹽、油酸鹽、鞣酸鹽、泛酸鹽、酒石酸氫鹽、抗壞血酸鹽、琥珀酸鹽、馬來酸鹽、龍膽酸鹽、延胡索酸鹽、葡糖酸鹽、glucaronate、糖二酸鹽、甲酸鹽、苯甲酸鹽、谷氨酸鹽、甲磺酸鹽、乙磺酸鹽、苯磺酸鹽、對甲苯磺酸鹽和雙羥萘酸(即1,1’ -亞甲基-二(2-羥基-3-萘甲酸))鹽。除上述酸以外,包含氨基部分的化合物還可與多種氨基酸形成可藥用鹽。酸性性質的化合物能與多種可藥用陽離子形成堿鹽。這些鹽的實例包括堿金屬或堿土金屬,特別是鈣、鎂、鈉、鋰、鋅、鉀和鐵鹽。
[0093]本文使用的“多核苷酸”包括長度大于8個核苷酸的雙鏈DNA、單鏈DNA和雙鏈或單鏈RNA。
[0094]本文使用的“由生物標志物編碼的多肽序列”或“生物標志物的蛋白質產物”指本文定義的生物標志物蛋白質編碼區翻譯后獲得的氨基酸序列。每種本發明生物標志物的mRNA核苷酸序列通過其RNA登錄號(見表3或表5)識別,相應的多肽序列通過蛋白質登錄號(見表3和表5)識別。
[0095]在使用蛋白質或蛋白質片段免疫宿主動物時,蛋白質的多個區域均可誘發產生與蛋白質的給定區域或三維結構特異性結合的抗體,這些區域或結構稱為表位或抗原決定簇。本文使用的“抗原片段”指含有一個或多個表位的多肽部分。表位可以是線性的,基本包含來自抗原的線性序列,或者可以是構象的,包含在遺傳上被其他序列隔開、但在結構上在多肽配體的結合位點聚一起的序列。“抗原片段”的長度可以最大為5000、1000、500、400、300、200、100、50、25、20、10或5個氨基酸中的任一種。
[0096]本文使用的“預選區域”、“預定區域”或“獨特位置”指襯底上的局部區域,所述區域用于或意圖用于放置核酸,在本文中也可稱為“選定區域”或簡單地稱為“區域”。預選區域可以是任何方便的性狀,如環形、矩形、橢圓形、楔形等。在一些實施方案中,預選區域小于約Icm2,更優選小于Imm2,更優選小于0.5mm2,并且在一些實施方案中小于0.1mm2。“預選區域”、“預定區域”或“獨特區域”中的核酸成員是這樣的核酸:其身份(如序列)可通過其在區域中的位置或獨特位置確定。
[0097]本文使用的“預防”指由施用一種或多種根據本發明方法鑒定的化合物或施用這些化合物與其他治療的組合而預防輕度骨關節炎或其一種或多種癥狀的發生、復發或產生。
[0098]本文使用的術語“引物”指存在于純化的限制性消化物中或合成產生的寡核苷酸,置于誘導合成與核酸鏈互補的引物延伸產物的條件下時,即存在核苷酸和誘導劑(如DNA聚合酶)以及適當的溫度和PH時,所述寡核苷酸能作為合成的起始點。引物可以為單鏈或雙鏈,并且必須具有足夠的長度,以在誘導劑存在下引發所需延伸產物的合成。引物的確切長度會取決于許多因素,包括溫度、引物來源和使用的方法。例如,就診斷應用而言,取決于靶序列的復雜性,寡核苷酸引物一般含有15-25或更多的核苷酸,盡管也可以含有更少的核苷酸。引物合適長度的確定中涉及的因素為本領域普通技術人員所公知。一般而言,根據本領域熟知的標準方法設計和選擇本發明的引物,參閱Dieffenbach, C.ff., Lowe,T.M.J.,Dveksler,G.S.(1995)General Concepts for PCR Primer Design.《PCR Primer,A Laboratory Manual)) (Dieffenbach, CW 和 Dveksler, G.S.編輯)Cold Spring HarborLaboratory Press,New Yo rk, 133-155 ;Innis,M.A.和 Gelfand,D.H.(1990)Optimizationof PCRs.《PCR protocols, A Guide to Methods and Applications》(Innis, M.A.,Gelfand, D.H.,Sninsky, J.J.和 White, TJ.編輯)Academic Press, San Diego,3-12 ;Sharrocks, A.D.(1994)The design of primers for PCR.《PCR Technology, CurrentInnovations)) (Griffin, H.G.和 Griffin, A.M,編輯)CRC Press, London, 5-11。
[0099]本文使用的術語“探針”表示寡核苷酸及其類似物,指通過與靶序列核苷酸堿基的氫鍵相互作用識別多核苷酸靶序列的一系列化學物質。探針或靶序列可以為單鏈或雙鏈RNA、單鏈或雙鏈DNA或者DNA與RNA堿基的組合。探針的長度至少為8個核苷酸并小于完整基因的長度。探針的長度可以為10、20、30、50、75、100、150、200、250、400、500并多至2000個核苷酸。探針可包含修飾的寡核苷酸,從而含有可通過熒光、化學發光等進行檢測的標簽。探針還可經修飾以同時具有檢測標簽和粹滅分子,例如Taqman K和MolecularBeacon 探針。
[0100]寡核苷酸及其類似物可以為RNA或DNA或者RNA或DNA的類似物,通常稱為反義寡聚物或反義寡核苷酸。這些RNA或DNA類似物包括但不限于2-' 0-烷基糖修飾、甲基膦酸、硫代磷酸、二硫代磷酸、formacetaU' -thioformacetal、砜、氨基磺酸和硝基氧骨架修飾和堿基部分進行了修飾的類似物。此外,寡聚物的類似物可以為這樣的聚合物:其中糖部分經修飾或用其他適當部分進行了替換,產生包括但不限于嗎啉代類似物和肽核酸(PNA)類似物的聚合物(Egholm 等《Peptide Nucleic Acids (PNA)~Oligonucleotide Analogueswith an Achiral Peptide Backbone》, (1992))。[0101]探針還可以是任何寡核苷酸類似物類型與天然DNA或RNA在一起或組合的混合物。同時,寡核苷酸及其類似物可以單獨使用或與一種或多種其他寡核苷酸或其類似物組合使用。
[0102]本文使用的術語“預防劑”指可用于預防骨關節炎的任何化合物。在某些實施方案中,術語“預防劑”指在本文所述篩選測定中鑒定的化合物。在其他某些實施方案中,術語“預防劑”指除本文所述篩選測定中鑒定的化合物以外的物質,其已知可用于、已經用于或目前正用于預防或阻礙骨關節炎或其一種或多種癥狀的發病、發生和/或發展。
[0103]本文使用的術語“預防有效量”指足以引起預防骨關節炎或其一種或多種癥狀的發生、復發或發病的治療(如預防劑)量。
[0104]本文使用的術語“蛋白質”、“多肽”和“蛋白質類物質”可互換使用,指通過肽鍵連接在一起的氨基酸鏈,任選地可包含天然或非天然氨基酸。任選地,蛋白質或多肽可包含除氨基酸以外的其他分子。所述鏈可以為任何長度。在一個具體實施方案中,蛋白質由通過肽鍵連接在一起的少于200個、少于175個、少于150個、少于125個、少于100個、少于50個、少于45個、少于40個、少于35個、少于30個、少于25個、少于20個、少于15個、少于10個或少于5個氨基酸組成。在另一實施方案中,蛋白質由通過肽鍵連接在一起的至少200個、至少250個、至少300個、至少350個、至少400個、至少450個、至少500個或更多氨基酸組成。
[0105]本文使用的“多種”或“一組”指多于2,例如3或更多、10或更多、100或更多、1000或更多或10000或更多。
[0106]在本發明生物標志物RNA產物的上下文中,本文使用的術語“RNA部分”和“其部分”指RNA轉錄物,其包含本發明生物標志物RNA產物的至少6個、至少9個、至少15個、至少18個、至少21個、至少24個、至少30個、至少60個、至少90個、至少99、至少108個、或
更多的核苷酸。
[0107]本文使用的術語“本發明生物標志物的產物”指本發明生物標志物相應基因表達的RNA和/或蛋白質。“本發明生物標志物的RNA產物”包括一種或多種產物,可包括核不均一 RNA( “hnRNA”)、mRNA和mRNA的全部或一些剪接變體,其表達量度可根據本文公開的教導作為生物標志物使用。“本發明生物標志物的蛋白質產物”包括生物標志物的一種或多種產物,可包括蛋白質、蛋白質變體和任何經轉錄后修飾的蛋白質。
[0108]本文使用的術語“選擇性擴增的”或“選擇性擴增”指從模板核酸中選擇性產生特定靶核酸序列的一個或多個拷貝的方法。選擇性擴增與總體擴增相比較,后者可作為方法與例如隨機引物和寡聚T引物組合使用,以擴增核酸序列群(如mRNA)。選擇性擴增優選通過聚合酶鏈式反應進行(Mullis 和 Faloona, 1987, Methods Enzymol.155:335)。
[0109]在本發明包括的蛋白質上下文中,本文使用的術語“選擇性結合”指肽、蛋白質、多肽和抗體中任何兩種的特異性相互作用,其中與任何其他肽、蛋白質、多肽和抗體相比,該相互作用優先在所述肽、蛋白質、多肽和抗體的任何兩種中發生。例如,當兩種分子為蛋白質時,第一種分子上的結構識別并結合第二個分子上的結構而不是其他蛋白質。本文使用的術語“選擇性結合”指分子與其特異性結合伴侶結合的親和力比與非特異性分子的結合至少高2倍,優選親和力至少高10倍、20倍、50倍、100倍或更高。
[0110]在本發明上下文中,本文使用的“選擇性雜交”指本發明包括的多核苷酸與本發明生物標志物的RNA及其互補物或蛋白質產物之間發生的雜交,其中相對于目標基因組中其他基因的RNA產物,所述多核苷酸與本發明生物標志物的RNA產物優先雜交。在一個優選的實施方案中,“選擇性雜交”的多核苷酸為選擇性高于70%、高于80%、高于90%并最優選為100%的多核苷酸(即發生與其他RNA種類的交叉雜交優選低于30%、低于20%、低于10% )。本領域技術人員應該理解,可以考慮長度和組成來確定與本發明生物標志物的RNA產物“選擇性雜交”的多核苷酸。
[0111]本文使用的“特異性雜交”指基本互補(在至少為14至25個核苷酸的一段上至少約65%互補,優選至少約75%互補,更優選至少約90%互補)的兩核酸序列之間發生的雜交。參閱引入本文為參考的Kanehisa,M.,1984,Nucleic acids Res.,12:203。因此,預計某種程度的錯配是可以容忍的。這些錯配很小,例如為單核苷酸、雙核苷酸或三核苷酸。或者,錯配區可以包括環,其定義為其中四個或更多核苷酸的連續串中存在錯配的區域。許多因素影響兩核酸雜交(例如陣列上的核酸成員與靶核酸序列的雜交)的效率和選擇性。這些因素包括核酸成員的長度、核苷酸序列和/或組成、雜交溫度、緩沖液組成和需要核酸成員雜交的區域中的位阻。在核酸長度和核酸與靶序列退火的效率和準確度之間均存在正相關。具體地,較長序列具有比較短序列更高的熔鏈溫度(TM),在給定的靶序列內也更不可能重復,從而使非特異雜交最小。雜交溫度與核酸成員退火效率的變化相反。類似地,雜交混合物中存在的有機溶劑(如甲酰胺)的濃度與退火效率的變化相反,而雜交混合物中鹽濃度的提高可促進退火。在嚴謹退火條件下,較長的核酸比較短的核酸更高效地發生雜交,較短的核酸在更寬容的條件下是充分的。
[0112]本文使用的術語“特異性雜交”指兩分子(如配體與蛋白質或肽或者抗體與蛋白質或肽)的相互作用,其中所述相互作用取決于各自分子上特定結構的存在。例如,當兩分子為蛋白質分子時,第一個分子上的結構識別并結合第二個分子上的結構,而不是蛋白質總體。本文使用的術語“特異性結合”指分子與其特異性結合伴侶結合的親和力比與非特異性分子的結合高至少10倍、20倍、50倍、100倍或更高。
[0113]本文使用的術語“標準嚴謹條件”和“嚴謹條件”指僅在序列間存在至少95 %、優選至少97%—致性時才發生雜交,其中一致性區包含至少10個核苷酸。在一個實施方案中,序列在42°C孵育過夜后在嚴謹條件下雜交,接著進行嚴謹洗滌(0.2XSSC,65°C )。可以通過改變溫度、pH、離子強度、二價陽離子濃度、洗滌體積和持續時間來改變洗滌的嚴謹程度。例如,可以通過在低于探針熔鏈溫度的不同溫度進行雜交來改變雜交的嚴謹度。探針的熔鏈溫度可使用下式計算:
[0114]對于長度為14至70個核苷酸之間的寡核苷酸探針,可以使用下式計算以攝氏溫度計量的熔鏈溫度(Tm) =Tm = 81.5+16.6 (log [Na+])+0.41 (G+C 分數)_ (600/N),其中 N 為寡核苷酸的長度。
[0115]例如,可以在約IM Na+濃度的雜交緩沖液中以5°C的增量從68°C至42°C降低雜交溫度。雜交后,可以在雜交溫度下用2XSSC、0.5% SDS洗滌濾膜。50°C以上的這些條件認為是“中等嚴謹”條件,500C以下是“低嚴謹”條件。“中等嚴謹”條件的具體實例為在55°C進行上述雜交。“低嚴謹”雜交條件的具體實例為在45°C進行上述雜交。[0116]如果在含有甲酰胺的溶液中進行雜交,則可使用以下方程計算退火核酸鏈的熔鏈溫度=Tm = 81.5+16.6 (log[Na+]) +0.41 (G+C 分數)-(0.63% 甲酰胺)-(600/N),其中 N 為探針長度。
[0117]例如,可以在42°C下在含有甲酰胺的緩沖液(如6XSSC)中進行雜交。在這種情況下,可以以5%的增量從50%至0%降低雜交緩沖液中的甲酰胺濃度,以鑒定與探針的同源性水平逐漸下降的克隆。雜交后,可以在50°C用6XSSC、0.5%SDS洗滌濾膜。當雜交液包含25%以上的甲酰胺時,認為雜交條件是“中等嚴謹”條件,當雜交液包含25%以下的甲酰胺時為“低嚴謹”條件。“中等嚴謹”雜交條件的具體實例為在30%甲酰胺中進行上述雜交。“低嚴謹”雜交條件的具體實例為在10%甲酰胺中進行上述雜交。當條件包括如45°C在6 X SSC中雜奪、其后在65°C在0.2XSSC、0.1% SDS中洗滌時,認為雜奪備件是“高嚴謹”。
[0118]本文使用的術語“受試者”、“患者”和“個體”可互換使用,指動物(如哺乳動物、魚、兩棲動物、爬行動物、鳥類和昆蟲)。在一個具體的實施方案中,受試者為哺乳動物(如非人哺乳動物和人)。在另一實施方案中,受試者為寵物(如狗、貓、豚鼠、猴和禽類)、農場動物(如馬、牛、豬、山羊和雞)或實驗室動物(如小鼠和大鼠)。在另一實施方案中,受試者為靈長類(如黑猩猩和人)。在另一實施方案中,受試者為人。
[0119]本文使用的術語“協同”指使用本文所述方法鑒定的化合物與其他治療(如試劑)的組合,所述組合比該治療的加和作用更有效。優選地,這些其他治療已經用于或目前用于預防、治療、控制或改善骨關節炎或其癥狀。治療(如預防或治療劑)組合的協同效應允許對患骨關節炎的受試者使用以較低劑量的一種或多種治療和/或較低給藥頻率的所述治療。使用較低劑量的治療(如預防或治療劑)和/或較低頻率地施用所述治療的能力降低了與對受試者施用所述物質相關的毒性,而不降低所述治療預防、治療、控制或改善骨關節炎的效力。此外,協同效應可引起治療(如物質)在預防、治療、控制或改善骨關節炎中效力的提高。最后,治療(如預防或治療劑)組合的協同效應可避免或降低與單獨使用任一治療相關的不良或不期望的副作用。
[0120]本文使用的“滑液”指每個關節周圍的“滑液囊”中分泌的流體。滑液用于保護關節、潤滑關節并為關節軟骨提供營養。可根據本發明使用的滑液含有細胞,可以根據本文所述領域熟知的方法從所述細胞中分離RNA。
[0121]本文使用的術語“治療劑”指可用于治療、控制或改善骨關節炎或其一種或多種癥狀的任何化合物。在一種具體的實施方案中,術語“治療劑”指提高或降低多核苷酸序列表達的化合物,所述多核苷酸序列如本文定義在來自輕度骨關節炎的細胞中相對于來自正常個體的軟骨細胞差異表達。本發明的治療劑還指提高或降低軟骨細胞合成代謝活性的化合物。本發明提供這樣的“治療劑”,其在對患者施用后,I)預防骨關節炎的發病;2)降低、延緩或消除骨關節炎癥狀如疼痛、腫脹、虛弱和喪失患病關節的功能性能力;3)降低、延緩或消除軟骨退化和/或增強軟骨細胞代謝活性和細胞分裂速率;和/或4)將患者的一種或多種疾病指示性核酸的一種或多種表達譜恢復為更接近正常個體的表達譜。在某些實施方案中,術語“治療劑”指本文所述篩選測定中鑒定的化合物。在其他實施方案中,術語“治療劑”指本文所述篩選測定中所鑒定化合物以外的物質,其已知可用于或已經用于或目前正用于治療、控制或改善骨關節炎或其一種或多種癥狀。
[0122]本文使用的術語“治療有效量”指足以引起骨關節炎或其一種或多種癥狀的改善、預防骨關節炎發生、導致骨關節炎消退或者增強或改善另一治療(如治療劑)的療效的治療(如治療劑)量。在一種具體的實施方案中,治療有效量指降低關節痛或關節腫脹的治療(如治療劑)量。優選地,相對于對照如磷酸鹽緩沖液(“PBS”),治療(如治療劑)的治療有效量降低關節腫脹至少5 %,優選至少10 %、至少15 %、至少20 %、至少25 %、至少30 %、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少100%。
[0123]本文使用的術語“治療”指由施用按照本發明方法鑒定的一種或多種化合物或按照本發明鑒定的一種或多種化合物與其他治療的組合引起的骨關節炎或其一種或多種癥狀的發展、嚴重性和/或持續時間的降低或改善。[0124]在本發明上下文中,本文使用的術語“表達水平的上調”或“增加”指對應于所表達基因的序列,其中序列量的測量證明,與從正常個體或從通過骨關節炎分期確定與骨關節炎不同的已鑒定疾病狀態的個體中分離的軟骨或血中的同一基因相比,所述基因在從患骨關節炎或通過骨關節炎分期確定的骨關節炎已鑒定疾病狀態的個體中分離的軟骨或血中的表達水平增加。根據本發明,“表達水平的增加”為例如通過本發明方法雜交強度測量的至少 1%、2%、3%、4%、5%、6%、7%、8%、9%、10%或更高的表達增加,例如 20%,30%,40%, or50%、60%、70%、80%、90%或更高或者高于I倍,最高為2倍、3倍、4倍、5倍、10倍、50倍、100-倍或更高。例如,上調序列包括與分離自正常個體的軟骨相比,在分離自特征為患輕度、中度、顯著或重度OA的個體的軟骨或血中表達水平增加的序列。上調序列還可包括與其他骨關節炎階段相比,在分離自特征為患某個骨關節炎階段的個體的軟骨或血中表達水平增加的序列(如顯著OA比重度0A)。
[0125]4.圖表說明
【專利附圖】
【附圖說明】
[0126]圖1描述了表4中所列基因所有可能的比例組合的分析結果,其中用于診斷輕度OA的ROC高于0.6。顯示的是ROC面積、靈敏度(假設特異性設置為50%閾值)和特異性(假設靈敏度設置為50%閾值)的圖形描述。其他細節描述于實施例8。
[0127]參考本說明書實施例部分之后包括的表1、表2、表3、表4、表5、表6、表7和表8以及圖1可以更好地理解本發明的目的和特征。
[0128]表1為顯示一個實施方案中的本發明基因、特別是基于其Locus Link ID標識基因的表格。
[0129]表2為顯不申請號10/915,680所公開的生物標志物的具體實施方案的表格。
[0130]表3為顯不一個實施方案中對應于表1標識的生物標志物的RNA產物以及每種RNA產物的核酸參考登錄號和蛋白質參考登錄號的表格。
[0131]表4為顯示一個實施方案中本發明生物標志物的選擇集的表格,所述生物標志物各自獨立地指示輕度OA并可組合使用作為輕度OA的指示。表4通過基因ID (以前的LocusLink ID)標識每種生物標志物,并包括基因符號、備選基因符號和基因描述作為生物標志物的標識符。此外,還顯示了實施例9中進一步描述的特定p值和倍數變化。
[0132]表5為顯不一個實施方案中對應于表4生物標志物的RNA和蛋白質變體的代表性實例的表格。[0133]表6為顯不一個實施方案中引物的選擇集的表格,所述引物用于在選定的表4中列出的RNA種類上進行的定量實時RT-PCR。
[0134]表7為顯示一個實施方案中對表4生物標志物的蛋白質產物具有特異性的商品抗體的表格。
[0135]表8提供T 一個實施方案中引物和TaqMan?探針代表性種類的表格,所述引物和TaqMan?探針用于測量表4列出的生物標志物的rna產物。
[0136]5.發明詳述
【具體實施方式】
[0137]本發明的實施部分使用分子生物學、微生物學和重組DNA技術的常規技術,所述技術在本領域技術人員的能力之內。這些技術在文獻中有完整的解釋。參閱如Sambrook,Fritsch&Maniatis, 1989,((Molecular Cloning:A Laboratory Manual》, 第二版;〈〈Oligonucleotide Synthesis)) (MJ.Gait 編輯,1984):《Nucleic Acid Hybridization))(B.D.Harnes&SJ.Higgins 編輯,1984):《A Practical Guide tOMolecular Cloning))(B.Perbal, 1984):和《Methods in Enzymology》叢書(Academic Press, Inc.): ((ShortProtocols In Molecular Biology)), (Ausubel 等編輯,1995)。本文中上文和下文提到的所有專利、專利申請和公開均以其整體引入本文為參考。
[0138]本文公開的發明鑒定了生物標志物和生物標志物組合,其用于診斷輕度和/或用于區分輕度OA和非0A。為了使用這些生物標志物,本發明教導了這些生物標志物產物的鑒定,其中包括RNA產物和蛋白質產物。本發明還公開了與本發明生物標志物的RNA產物特異性和/或選擇性雜交的寡核苷酸、cDNA、DNA、RNA、PCR產物、合成DNA、合成RNA及其片段或其他天然存在的修飾核苷酸的組合。本發明還公開了與本發明生物標志物的蛋白質產物特異性和/或選擇性雜交的蛋白質、肽、抗體、配體及其片段,包括抗原結合片段。可以使用寡核苷酸進行本發明生物標志物和生物標志物組合的RNA產物的表達測量,所述寡核苷酸對本發明生物標志物的RNA產物具有特異性和/或選擇性,以定量RNA產物的表達。在本發明的一個具體實施方案中,對RNA產物具有特異性和/或選擇性的多核苷酸為探針或引物。在一個實施方案中,這些多核苷酸的形式為能夠與已制造陣列雜交的核酸探針。在另一實施方案中,可以使用商品陣列測量RNA產物的表達,本發明教導了分析哪個基因組合。在另一實施方案中,使用如SYfiH? Green或TaqMtH?或分子信標技術,在比如定量實時RT PCR等技術中以探針和引物的形式使用對本發明生物標志物的RNA產物具有特異性和/或選擇性的多核苷酸,其中所使用的多核苷酸以正向引物、反向引物、TaqMan標記探針或分子信標標記探針的形式使用。在一個具體的實施方案中,可以將測量本發明RNA產物的表達水平所產生的結果輸入本發明的模型,所述模型用于鑒定生物標志物的組合,以確定模型定義的診斷。在一個優選的實施方案中,使用相同的方法產生用于產生數學模型的表達數據,所述模型用于診斷受試個體。
[0139]本發明還包括本文公開以及本領域技術人員已知的蛋白質或多肽用于測量本發明生物標志物的蛋白質產物的用途。接著可以使用本領域技術人員公知的技術(如Western印跡、免疫沉淀、蛋白質微陣列分析等技術)測量對應于本發明生物標志物的蛋白質產物的水平。本領域技術人員會理解,測量本發明生物標志物蛋白質產物的表達水平需要與對應于每種本發明生物標志物的一種或多種蛋白質產物特異性或選擇性結合的蛋白質。接著可以將代表本發明生物標志物的蛋白質產物表達水平的數據輸入模型,產生所述模型以鑒定組合,從而確定該模型定義的診斷。在一個優選的實施方案中,使用相同的方法產生用于產生數學模型的表達數據,所述模型用于診斷測試個體。
[0140]5.1用于本發明的樣品
[0141]除非本文中另外指明,得自任何受試者的任何組織樣品(如軟骨、滑液或血樣)或細胞樣品(如軟骨細胞或血細胞樣品)均可以根據本發明方法使用。可以從中獲得這些樣品并根據本發明方法使用這些樣品的受試者實例包括但不限于無癥狀受試者、表現或顯示
1、2、3、4種或更多骨關節炎癥狀的受試者、臨床診斷為患有骨關節炎的受試者、易患骨關節炎的受試者(如有骨關節炎家族史的受試者、有骨關節炎遺傳易感性的受試者以及生活方式使其易感骨關節炎或提高患骨關節炎可能性的受試者)、懷疑患有骨關節炎的受試者、正接受骨關節炎治療的受試者、患有骨關節炎和至少一種其它疾病的受試者(如具有2、3、4、5種或更多疾病的受試者)、非接受骨關節炎治療的受試者、開業醫生(如醫師)確定為健康或無骨關節炎的受試者(即正常)、已治愈骨關節炎的受試者、正在控制其骨關節炎的受試者和未診斷為骨關節炎的受試者。在一個具體的實施方案中,可獲得樣品并使用的受試者患手、足、脊柱、膝、髖和/或腕骨關節炎。
[0142]在另一實施方案中,可獲得樣品并使用的受試者患輕度0A。在另一些實施方案中,可獲得樣品的受試者為測試個體,所述測試個體是否患有骨關節炎未知和/或該測試個體患何階段的骨關節炎未知。
[0143]為了將患者按疾病狀態分類,可以使用基于軟骨的評分系統,其中使關節鏡操作者的主觀判斷最小化。定義本文所述疾病狀態的評分系統實例為引入本文作為參考的Marshall, 1996, The Journal of Rheumatology23:582-584 中的系統。根據該方法,基于特定表面上存在的最嚴重損傷對6個關節面(髕骨、股骨滑車、股骨內側踝、脛骨內側坪、股骨外側踝和脛骨外側坪)中的每一 個給予軟骨分級。接著應用評分系統,其中每個關節面獲得反映該面軟骨嚴重性分級的骨關節炎嚴重性數值,如表9所述。
表9.關節軟骨分級系貌__
[0144]分級關節軟骨分數
0正常_J_
1表面完整-軟化,水腫I
JI_ 表面破壞-部分厚度損傷(未延伸至骨)—I_
[0145]I Iff I完全厚度損傷-延伸至完整的骨I 3
^IV 骨質糜爛或骨質象牙化 4
[0146]例如,如果股骨內側踝最嚴重的軟骨損傷為為I級損傷,則給予I的分值。接著由6個關節面分數的總和產生患者的總分。基于總分將每名患者分入4個OA組中:“輕度”(早期)定義為Marshall分數1-6,“中度”定義為Marshall分數7_12,“顯著”定義為Marshall分數13-18,“重度”定義為Marshall分數高于18。[0147]在某些實施方案中,得自受試者的樣品為軟骨樣品(包括來自軟骨的細胞樣品)。在另一實施方案中,得自受試者的樣品為滑液樣品(包括來自滑液的細胞樣品)。在另一實施方案中,得自受試者的樣品為血樣(包括來自血的細胞樣品)。
[0148]5.1.1 軟骨
[0149]在一個方面中,根據本領域已知并描述于下文的方法從生存的正常個體或死后14小時以內的軟骨組織獲得軟骨樣品。使用任何已知方法獲得來自成人的正常關節軟骨。在一個具體的實施方案中,軟骨得自接受關節鏡術或全膝置換術的個體,樣品在液氮中保存待用。由于倫理考慮,通常不能從活供體中廣泛采樣真實的正常軟骨。因此,優選地,在14小時的死后窗口中在停止對采樣關節灌注后從死亡供體獲得正常軟骨樣品,以使窗口過后觀察到的RNA降解最小。在另一些實施方案中,“正常”組織在死后14小時內獲得,例如少于或等于死后13、12、11、10、9、8、7、6、5、4、3、2或I小時。優選地,正常軟骨在死后12小時以內獲得。
[0150] 在另一方面中,軟骨得自診斷為輕度骨關節炎的受試者。使用任何已知技術獲得來自骨關節炎個體的人關節樣品。優選地,將關節樣品保存在液氮中待用。在一個具體實施方案中,分離至少0.05g軟骨樣品,以獲得2 ii g總RNA提取物。在另一實施方案中,分離至少0.025g軟骨樣品,以獲得IugS RNA提取物。可根據本發明使用的軟骨樣品為足以檢測一種或多種本發明核酸序列或氨基酸序列的量。
[0151]在根據本發明方法使用前,任選地(但優選)將收集的軟骨保存在低溫如4°C下。在一些實施方案中,在第一時間根據本發明方法使用軟骨樣品的一部分,而將一個或多個剩余的樣品部分保存一段時間以備后用。該段時間可以是I小時或更長、I天或更長、I周或更長、I個月或更長、I年或更長或不確定。就長期保存而言,可以使用本領域熟知的保存方法,例如在冷凍溫度(如低于_60°C)保存。在一些實施方案中,作為保存軟骨的補充或替代,將分離的核酸或蛋白質保存一段時間(如I小時或更長、I天或更長、I周或更長、I個月或更長、I年或更長或不確定)以備后用。
[0152]在本發明的一些實施方案中,使用本領域已知的技術分離軟骨中存在的軟骨細胞,并根據本發明方法使用。軟骨細胞可得自患輕度0A、未患輕度OA的受試者或測試受試者。在用于本發明方法前,可以通過標準技術冷凍軟骨細胞。
[0153]5.1.2 滑液
[0154]在一個方面中,使用本領域熟知的方法從受試者獲得滑液樣品。例如,可以進行關節穿刺。在關節穿刺中,使用無菌針從關節中移出滑液。可以使用關節穿刺從膝、肘、腕、指、髖、脊柱或任何其他關節收集滑液。在一個具體的實施方案中,滑液收集自患骨關節炎或懷疑患骨關節炎的關節。滑液可得自患輕度0A、未患OA的受試者或得自測試受試者。
[0155]可根據本發明使用的滑液樣品為足以檢測一種或多種本發明核酸序列或氨基酸序列的量。在一個具體實施方案中,可根據本發明使用的滑液樣品的量范圍從0.1ml至20ml、0.1ml 至 15m1、0.1ml 至 IOml、0.1ml 至 5ml、0.1 至 2ml、0.5ml 至 20ml、0.5ml 至 15ml、0.5ml至10ml、0.5ml至5ml或0.5ml至2ml。在另一實施方案中,根據本發明使用的滑液樣品為0.1ml或更多、0.5ml或更多、Iml或更多、2ml或更多、3ml或更多、4ml或更多、5ml或更多、6ml或更多、7ml或更多、8ml或更多、9ml或更多、IOml或更多、Ilml或更多、12ml或更多、13ml或更多、14ml或更多、15ml或更多、16ml或更多、17ml或更多、18ml或更多、19ml或更多、或20ml或更多。[0156]在根據本發明方法使用前,任選地(但優選)將收集的滑液保存在低溫如4°C下。在一些實施方案中,在第一時間根據本發明方法使用滑液樣品的一部分,而將一個或多個剩余的樣品部分保存一段時間以備后用。該段時間可以是I小時或更長、I天或更長、I周或更長、I個月或更長、I年或更長或不確定。就長期保存而言,可以使用本領域熟知的保存方法,例如在冷凍溫度(如低于_60°C)保存。在一些實施方案中,作為保存滑液的補充或替代,將分離的核酸或蛋白質保存一段時間(如I小時或更長、I天或更長、I周或更長、I個月或更長、I年或更長或不確定)以備后用。
[0157]在本發明的一些實施方案中,使用本領域已知的方法分離滑液中存在的細胞,并根據本發明方法使用。通常在滑液中可見以下細胞:淋巴細胞(B和T淋巴細胞)、單核細胞、嗜中性粒細胞、滑膜細胞和巨噬細胞。在來自病理狀態(如骨關節炎)的患者的滑液中還可見以下細胞:軟骨細胞、成骨細胞和破骨細胞。可以根據本發明的方法分離并使用這些細胞。在一個具體實施方案中,從滑液樣品中分離淋巴細胞(B和T淋巴細胞)并根據本發明方法使用。在另一實施方案中,從滑液樣品中分離單核細胞或嗜中性粒細胞并根據本發明方法使用。在用于本發明方法前,可以通過標準技術冷凍分離自滑液的細胞。
[0158]5.1.3 血
[0159]在本發明的一個方面中,根據本領域熟知的方法從受試者中獲得血樣。血樣可得自患輕度0A、未患OA的受試者或得自測試個體,所述測試個體是否患有骨關節炎未知和/或該測試個體患何階段的骨關節炎未知。在一些實施方案中,對受試者皮膚進行簡單針刺而收集血滴。在這些實施方案中,由針刺收集的血滴即為全部所需。可以使用本領域技術人員已知的技術(特別是已知的采血方法)從受試者的任何身體部位(如指、手、腕、臂、腿、足、踝、胃和頸)取血。在一個具體的實施方案中,從受試者獲得靜脈血并根據本發明方法使用。在另一實施方案中,獲得動脈血并根據本發明方法使用。靜脈血的組成根據其服務的身體部分的代謝需求而變化。相反,動脈血的組成在整個身體中恒定。常規血測試一般使用靜脈血。
[0160]靜脈血可得自貴要靜脈、頭靜脈或中脈。動脈血可得自橈動脈、肱動脈或股動脈。可以使用真空管、注射器或蝶形針取血。通常清潔針刺部位、在針刺部位上方約3-4英寸處應用止血帶、將針以約15-45度角插入,并且如果使用真空管,則在針穿透靜脈壁后立即將管推入持針器。完成采血后,移去針并保持針刺部位的壓力。通常在收集血的管或瓶中有肝素或其他類型的抗凝血劑,以防止血凝固。收集動脈血時,可以在收集前施用麻醉劑。
[0161]采血量將取決于采血部位、本發明方法需要的量和受試者的舒適度而變化。然而,本發明一個實施方案的優點是實施本發明方法所需要的血量可以很小,使得不需要通過更具侵入性的方法獲得樣品。例如,在一些實施方案中,全部所需僅為一滴血。這滴血例如可以從簡單針刺獲得。在一些實施方案中,收集足以檢測表1列出的1、2、3、4、5、10或更多種基因表達的任意血量。這樣,在一些實施方案中,采血量是Iul或更少、0.5iU或更少、0.1ul或更少或0.01 ill或更少。然而,本發明不僅限于這些實施方案。在一些實施方案中有更多的血可供使用,并且在一些實施方案中,可以使用更多的血來實施本發明的方法。這樣,在多個具體的實施方案中,從受試者收集0.0OlmU0.005ml,0.01mU0.05ml,0.1ml、0.15ml、0.2ml、0.25ml、0.5ml、0.75ml、lml、l.5ml、2ml、3ml、4ml、5ml、10ml、15ml 或更多血。在另一實施方案中,從受試者收集 0.001ml-15ml、0.01ml_10ml、0.lml_10ml、0.lml_5ml、lml_5ml 血。
[0162]在本發明的一些實施方案中,將血保存在K3/EDTA管中。在另一實施方案中,可以使用含有例如美國專利N0.6,617,170 (引入本文為參考)公開的穩定劑的血保存管。在另一實施方案中,可使用Qiagen/BD公司PreAnalytiX提供的PAXgeneTM血RNA系統收集血。在另一實施方案中,可以使用Applied Biosystems提供的TempusTM血RNA收集管。TempusTM收集管提供用于收集全血的含RNA穩定劑的密閉真空塑料管。
[0163]在根據本發明方法使用前,任選地(但優選)將收集的血保存在低溫如4°C下。在一些實施方案中,在第一時間根據本發明方法使用血樣品的一部分,而將一個或多個剩余的樣品部分保存一段時間以備后用。該段時間可以是I小時或更長、I天或更長、I周或更長、I個月或更長、I年或更長或不確定。就長期保存而言,可以使用本領域熟知的保存方法,例如在冷凍溫度(如低于_60°C)保存。在一些實施方案中,作為保存血的補充或替代,將分離的核酸或蛋白質保存一段時間以備后用。這些分子標志物的保存可以為I小時或更長、I天或更長、I周或更長、I個月或更長、I年或更長或不確定。
[0164]在一個方面中,根據本領域熟知的采血方法從正常個體或者從診斷為患骨關節炎或懷疑患骨關節炎的個體取全血。全血包括可直接使用的血,并包括已經根據本領域熟知的方法(例如優選在300-800 X g溫和離心5-10分鐘)除去血清或血漿并且已經從剩余血樣中分離了 RNA或mRNA的血。在一個具體的實施方案中,將得自受試者的全血(即未分級血)與裂解緩沖液(如裂解緩沖液(IL):0.6g EDTA ;1.0g KHCO2,8.2g NH4Cl,用NaOH調整至到pH7.4)混合,離心樣品并保留細胞沉淀,根據本領域熟知的方法提取RNA或mRNA (“裂解血”)(參閱如Samtoook等)。優選使用全血,因為它避免了昂貴耗時的分離血中細胞類型的步驟(Kimoto, 1998,Mol.Gen.Genet258:233-239 ;Chelly J 等,1989,Proc.Nat.Acad.Sc1.USA86:2617-2621 ;Chelly J 等,1988,Nature333:858-860)。
[0165]在本發明的一些實施方案中,將收集自受試者的全血進行分級(即分離成組分)。在本發明的一個具體實施方案中,使用本領域已知技術從收集自受試者的全血分離血細胞。例如,可以對收集自受試者的血進行Ficoll-Hypaque(Pharmacia)梯度離心。這種離心將紅細胞(血紅細胞)與各種類型的有核細胞和血漿分離開。具體地,Ficoll-Hypaque梯度離心可用于分離外周血白細胞(PBL),它們可根據本發明方法使用。
[0166]用于示例而非限制性地,可以如下獲得巨噬細胞。通過用注射器取血其后進行Ficoll-Hypaque梯度離心從受試者的外周血分離單個核細胞。用受試者自身的血清或用AB+人血清預包被組織培養皿并在37°C孵育I小時。吸走未貼壁細胞。向培養皿中存留的貼壁細胞中加入含ImM EDTA的冷(4°C )磷酸鹽緩沖液,將培養皿置于室溫15分鐘。收獲細胞,用RPMI緩沖液洗滌,并重懸于RPMI緩沖液。可以通過在37°C下與巨噬細胞集落刺激因子(M-CSF) —起孵育來獲得數量更多的巨噬細胞。可以通過將親合化合物綴合到這些分子來標記針對巨噬細胞特異性表面標志物(如Mac-1)的抗體,以便于檢測和分離巨噬細胞。可以使用的親合化合物包括但不限于生物素、光生物素、熒光素異硫氰酸酯(FITC)或藻紅蛋白(PE)或本領域已知的其它化合物。然后使用本領域已知技術將保留標記抗體的細胞與不結合這種抗體的細胞分離開,例如但不僅限于各種細胞分選法、親合層析和淘選(panning)。[0167]可以用熒光激活細胞分選儀(FACS)分選血細胞。熒光激活細胞分選(FACS)是已知的基于顆粒物的熒光特性分離顆粒物包括細胞的方法。參閱如Kamarch,1987,MethodsEnzymol 151:150_165。單個顆粒上的熒光部分的激光激發產生小電荷,這允許從混合物中電磁分離正電和負電顆粒。用熒光物質如FITC或藻紅蛋白標記抗體或配體,所述抗體或配體用于檢測特定血細胞的細胞表面上存在的血細胞抗原決定簇。將細胞與熒光標記的抗體或配體充分孵育一段時間,使得標記抗體或配體與細胞結合。通過細胞分選儀處理細胞,使目的細胞與其它細胞分離開。可將FACS分選的顆粒直 接存放在微孔板的單個孔中以便于分離。
[0168]在本發明的一些實施方案中,也可以使用磁珠分離血細胞。例如,可以用磁激活細胞分選(MACS)技術分選血細胞,這是一種基于顆粒結合磁珠(0.5-100m直徑)的能力分離顆粒的方法。可以對磁性微球進行多種有用的修飾,包括共價添加特異性識別細胞-固相表面分子或半抗原的抗體。然后施加磁場,以物理操作選定的磁珠。在一個具體實施方案中,針對血細胞表面標志物的抗體與磁珠偶聯。然后將磁珠與血細胞培養物混合以使之結合。再將細胞通過磁場以分離具有目的血細胞表面標志物的細胞。然后可以分離這些細胞。
[0169]在一些實施方案中,可以用抗體包被培養皿表面,并用稱為淘選的方法分離血細胞。可以使用對特定血細胞具有特異性的抗體包被不同的皿。首先將細胞加入包被目的血細胞特異性抗體的培養皿中。徹底漂洗后,保持結合在皿上的細胞將是表達目的血細胞標志物的細胞。細胞表面抗原決定簇或標志物的實例包括但不限于T淋巴細胞和自然殺傷細胞的⑶2、T淋巴細胞的⑶3、白細胞的⑶11a、T淋巴細胞的⑶28、B淋巴細胞的⑶19、B淋巴細胞的⑶20、B淋巴細胞的⑶21、B淋巴細胞的⑶22、B淋巴細胞的CD23、白細胞的⑶29、單核細胞的⑶14、血小板的⑶41、血小板的⑶61、粒細胞的⑶66、粒細胞的⑶67和單核細胞與巨噬細胞的⑶68。
[0170]全血可以分離成如白細胞、血小板、紅細胞等細胞類型,這些細胞類型可根據本發明方法使用。可以使用標準技術將白細胞進一步分離為粒細胞和無粒細胞,這些細胞可根據本發明方法使用。可以使用標準技術將粒細胞分離為如中性粒細胞、嗜酸性粒細胞和嗜堿性粒細胞的細胞類型,這些細胞可根據本發明方法使用。可以使用標準技術將無粒細胞分離為淋巴細胞(如T淋巴細胞和B淋巴細胞)和單核細胞,這些細胞可根據本發明方法使用。可以使用標準技術將T淋巴細胞和B淋巴細胞分離開,并將輔助性T細胞和細胞毒性T細胞分離開,這些細胞可根據本發明方法使用。在用于本發明方法之前,可以使用標準技術冷凍分離的血細胞(如白細胞)。
[0171]可根據本發明使用的血樣應為足以檢測本發明的一種或多種核酸或氨基酸序列的量。在一個具體實施方案中,可根據本發明使用的血樣量為lul-lOOml,優選10 u l-50ml,更優選 10 u l-25ml,最優選 10 u 1-1ml。
[0172]5.1.4RNA 的制各
[0173]在本發明的一個方面中,從個體分離RNA以測量本發明生物標志物的RNA產物。RNA分離自本文所述的軟骨樣品。樣品可來自單個患者,或者可以是來自多個患者的混合。
[0174]在另一方面中,直接從本文所述患骨關節炎的人的滑液分離RNA。樣品可來自單個患者,或者可以是來自多個患者的混合。
[0175]在另一方面中,直接從本文所述患骨關節炎的人的血樣分離RNA。樣品可來自單個患者,或者可以是來自多個患者的混合。
[0176]根據本領域熟知的方法從軟骨樣品中提取總RNA。在一個實施方案中,根據以下方法在軟骨組織中純化RNA。在從個體或受試者中取出目的組織后,將組織在液氮中速凍以防止RNA降解。加入一定體積的組織胍溶液后,在tissuemizer中以2或3次10秒的脈沖研磨組織樣品。為制備組織胍溶液(IL),將590.Sg異硫氰酸胍溶于約400ml DEPC處理的水中。加入 25ml2M Tris-Cl,pH7.5(0.05M 終濃度)和 20ml Na2EDTA (0.01M 終濃度),將溶液攪拌過夜,體積調整為950ml并加入50ml2-ME。
[0177]將勻漿組織樣品在12°C以12,OOOXg離心10分鐘。在0.1倍體積20%十二烷基肌氨酸鈉(Sarcosyl)存在下以65°C孵育所得上清液2分鐘,在9ml5.7M CsCl (0.1g CsCl/ml)溶液上分層,22°C以113,OOOXg離心過夜進行分離。仔細地移除上清液后,將管倒置控干。將管底(含有RNA沉淀)置于50ml塑料管中并在3ml組織重懸緩沖液(5mM EDTA,0.5% (體積/體積)十二烷基肌氨酸鈉、5% (體積/體積)2-ME)存在下以4°C孵育過夜(或更久),以使RNA沉淀完全重懸。其后連續用25: 24: I的酚/氯仿/異戊醇和之后24: I的氯仿/異戊醇抽提所得RNA溶液,加入3M乙酸鈉、pH5.2和2.5倍體積的100 %乙醇進行沉淀,重懸于 DEPC 水(Chirgwin 等,1979, Biochemistry, 18:5294)。
[0178]或者根據以下的一步式方案從軟骨組織中提取RNA。通過以每IOOmg組織Iml變性液(4M硫代硫酸胍、25mM檸檬酸鈉、pH7.0,0.1M2_ME、0.5% (重量/體積)N-十二烷基肌氨酸)在玻璃特氟龍勻漿器中進行勻漿來制備目的組織。將勻漿轉移至5ml聚丙烯管之后,連續加入0.lml2M乙酸鈉、pH4的Iml水飽和酚和0.2ml49:1的氯仿/異戊醇。在加入每種組分后均混合樣品,并在加入所有組分后在0-4°C孵育15分鐘。4°C以10,OOOXg離心20分鐘分離樣品,加入Iml 100%異丙醇進行沉淀,在-20°C孵育30分鐘并在4°C以10,OOOXg離心10分鐘進行沉淀。將得到的RNA沉淀溶于0.3ml變性液,轉移至微量離心管,在_20°C加入0.3mll00%異丙醇沉淀30分鐘并在4°C以10,OOOXg離心10分鐘。在70%乙醇中洗滌沉淀、干燥并重懸于100-200 u IDEPC處理的水或DEPC處理的0.5% SDS (Chomczynski和 Sacchi,1987, Anal.Biochem.,162:156)。
[0179]優選地,在液氮中將軟骨樣品磨成細粉并使用TRlzul;試劑(GIBC0/BRL)提取總 RNA。
[0180]或者使用以下方案從血中分離RNA。按3份裂解緩沖液比1份血的比例向血樣中加入裂解緩沖液(裂解緩沖液(IL):0.6g EDTA;1.0g KHCO2,8.2g NH4C1,用NaOH調整至PH7.4)。將樣品混合并在冰上放置5-10分鐘至透明。在4°C以1000rpm將裂解樣品離心10分鐘,吸出上清液。將沉淀重懸于5mL裂解緩沖液,并在4°C以1000rpm再離心10分鐘。按每IOml起始血樣約6ml TRIZOI? (GIBC0/BRL)的比例用TRIzol?勻漿沉淀的細胞并充分振蕩。樣品在室溫放置5分鐘。用1.2ml氯仿/lml TRIZOIC珍提取RNA。樣品在4°C以12,OOOXg離心5分鐘并收集上層。按0.5ml/lml TRIzoJ?的比例向上層中加入異丙醇。樣品在_20°C放置過夜或在_20°C放置I小時。根據熟知的方法沉淀RNA,晾干RNA沉淀,并將沉淀重懸于DEPC處理的ddH20中。也可以將RNA樣品保存于75%乙醇中,這樣的樣品在室溫下穩定以供運輸。
[0181]或者使用上文的TRIzol::丨H式劑(GIBC0/BRL)從滑液中分離RNA。[0182]可以通過260/280nm吸光度和瓊脂糖凝膠電泳隨后在紫外光下檢查來評價RNA的
純度和完整性。[0183]5.2本發明的牛物標志物
[0184]在一個實施方案中,本發明提供生物標志物和生物標志物組合,其中所述生物標志物產物的表達水平的量值可指示輕度骨關節炎的存在。在另一實施方案中,本發明提供了生物標志物和生物標志物組合,其中測量所述生物標志物產物的表達水平可用于診斷個體患有輕度OA還是未患0A。
[0185]表1提供本發明生物標志物的基因名稱和相關locus link ID的列表,其中單獨或組合測量所述生物標志物的表達水平可用于診斷個體為患有輕度骨關節炎,或確定個體是否患骨關節炎。本領域技術人員會理解,locus link ID可用于確定對應于本發明生物標志物的所有RNA轉錄物和所有蛋白質的序列。
[0186]表2提供了申請號10/915,680中公開的生物標志物,所述生物標志物可以如本文的教導與表1公開的一種或多種生物標志物組合使用,以診斷輕度OA或區分輕度OA和非OA。
[0187]表3具體顯示了表1列出的生物標志物RNA產物的相應參考登錄號以及生物標志物蛋白質產物的相應參考登錄號。因此本發明包括出于任一上述目的,使用本領域技術人員公知和本文概述的方法測量這些生物標志物和生物標志物組合的表達的用途。
[0188]表4提供了對應于本發明生物標志物選集的基因名和相關locuslink ID(基因ID),其中單獨或組合測量所述生物標志物的表達水平可用于診斷個體患有輕度骨關節炎還是未患骨關節炎。本領域技術人員會理解,locus link ID可用于確定對應于本發明生物標志物的所有RNA轉錄物和所有蛋白質產物的序列。
[0189]表5具體公開了表1列出的生物標志物RNA產物的相應參考登錄號以及生物標志物蛋白質產物的相應參考登錄號。因此本發明包括出于任一上述目的,使用本領域技術人員公知和本文概述的方法測量這些生物標志物和生物標志物組合的表達的用途。
[0190]5.3牛物標志物纟目合
[0191]生物標志物組合
[0192]在一個實施方案中,本發明生物標志物的組合包括表1列出的生物標志物中多至
2、3、4、5、6、7、8、10、20、30、40、50、100種的任何數目或全部生物標志物的任何組合。在另一實施方案中,本發明生物標志物的組合包括表2列出的生物標志物中任一種或多至1、2、3、4、5、6、7、8、10、20、30、40、50、100種的任何數目或全部生物標志物與表1列出的生物標志物中任一種或多至1、2、3、4、5、6、7、8、10、20、30、40、50、100種的任何數目或全部生物標志物的組合,其產物表達的測量可用于診斷個體患有輕度骨關節炎還是未患骨關節炎。在另一實施方案中,本發明生物標志物的組合包括表3列出的RNA和/或蛋白質產物中多至2、
3、4、5、6、7、8、10、20、30、40、50、100種的任何數目或全部的任何組合。在另一實施方案中,本發明生物標志物的組合包括表2列出的生物標志物中任一種或多至1、2、3、4、5、6、7、8、10、20、30、40、50、100種的任何數目或全部與表3列出的RNA和/或蛋白質產物中多至1、
2、3、4、5、6、7、8、10、20、30、40、50、100種的任何數目或全部的任何組合。其產物表達的測量可用于診斷個體患有輕度骨關節炎還是未患骨關節炎。在一個實施方案中,本發明生物標志物的組合包括表4列出的生物標志物中多至2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31種的任何數目或全部的任何組合。在另一實施方案中,本發明生物標志物的組合包括表2列出的生物標志物中任一種或多至1、2、3、4、5、6、7、8、10、20、30、40、50、100種的任何數目或全部與表4列出的生物標志物中任一種或任何數目或全部的任何組合。
[0193]例如,n個基因的亞組m的可能組合的數目描述于Feller, Intro to ProbabilityTheory,第三版,第I卷,1968, J.Wiley編輯,使用以下通式:
[0194]m ! / (n) ! (m_n) !
[0195]在一個實施方案中,當n為2,m為19時,則有:
[0196]19 ! = 19X18X17X16X15X14X13X12X11X10X9X8X7X6X5X4X3X2Xl
[0197]2! (19-2) ! (2X I) (19X 18X 17X 16X 15X 14X 13X 12X 11 X 10X9X8X7X6X5X4X3X2X1) = 1.2161017 = 171
[0198]7.1IIOm
[0199]種獨特的雙基因組合。測定這些雙基因組合中每種基因的表達均可以獨立地用于確定患者是否有骨關節炎。在m為19、n為3的另一實施方案中,有19 ! /3! (10-3) !種獨特的三基因組合。這些獨特的三基因組合中每一種均可獨立地用作確定患者是否患有骨關節炎的模型。
[0200]5.4特別有用的生物標志物組合
[0201]盡管表1和表4中列出的生物標志物的所有組合均可用于診斷輕度0A,來自表2的選定生物標志物與來自表1和/或表4的至少一種或多種生物標志物的生物標志物組合也是如此,本發明還提供了選擇和評估在診斷輕度OA中特別有用的生物標志物組合的方法。
[0202]為了鑒定有用的生物標志物組合,使用本發明的數學模型產生一種或多種分類器,每種分類器使用代表特定生物標志物組合中每種生物標志物的數據將用于輸入模型的訓練群中患輕度骨關節炎的個體(第一種表型亞組)與未患骨關節炎的個體(第二個表型亞組)分開。
[0203]接著可以如5.9節概述的那樣通過測定分類器正確判斷5.5節中所述訓練群中每一個體的能力對產生的分類器進行評估或評分。還通過測定分類器正確判斷“評分群”中一個或多個個體的能力對產生的分類器進行評估或評分。評分群與下文5.5節中所述訓練群相似,但評分群由未用于產生分類器的一個或多個個體組成。這樣,評分群由已診斷為患輕度骨關節炎的個體(第一種表型亞組)和未患骨關節炎的個體(第二個表型亞組)組成。在一個實施方案中,除了未用于訓練群的一個或多個成員以外,評分群還包括訓練群的成員。在一些實施方案中,訓練群成員中5 %或更少、10 %或更少、20 %或更少、30 %或更少、50 %或更少或90 %或更少與評分群共用。
[0204]本領域技術人員會理解,這使得人們可以預測分類器正確表征表型特征未知的個體的能力。
[0205]輸入數學模型的數據可以是代表受評估的生物標志物組合中每種生物標志物產物表達水平的任何數據。在本發明的一個實施方案中,評估了表1中生物標志物的每種可能的組合。在本發明的另一實施方案中,評估了表1中最高為2、3、4、5、10、20、30、等種中任一種的每種可能的組合。在本發明的另一實施方案中,基于個體P值對表1中的生物標志物進行分級,其中P值為每種生物標志物區分患輕度OA成員和未患OA成員的能力的指示,接著評估前40、30、20或10種分級的生物標志物。在本發明的另一實施方案中,評估了表1和表2中可見的生物標志物的每種可能的組合,并選擇包括至少一種表1列出的生物標志物的生物標志物組合。在本發明的另一實施方案中,評估了表1和表2中可見的2、3、4、5、10、20、30、等種生物標志物的每種可能的組合,并選擇其中包括至少一種表1列出的生物標志物的組合。在本發明的另一實施方案中,基于個體P值對表1和表2中的生物標志物進行分級,其中P值為每種生物標志物區分患輕度OA成員和未患OA成員的能力的指示,接著評估了前40、30、20或10種分級的生物標志物,并選擇其中包括至少一種表1列出的生物標志物的組合。在本發明的另一實施方案中,評估了表4中生物標志物的每種可能的組合。在本發明的另一實施方案中,評估了表4中最高為2、3、4、5、10、20、30、等種中任一種的每種可能的組合。在本發明的另一實施方案中,基于個體P值對表4中的生物標志物進行分級,其中P值為每種生物標志物區分患輕度OA成員和未患OA成員的能力的指示,接著評估前40、30、20或10種分級的生物標志物。在本發明的另一實施方案中,評估了表4和表2中可見的生物標志物的每種可能的組合,并選擇包括至少一種表4列出的生物標志物的生物標志物組合。在本發明的另一實施方案中,評估了表4和表2中可見的2、3、4、5、10、20、30、等種生物標志物的每種可能的組合,并選擇其中包括至少一種表4列出的生物標志物的組合。在本發明的另一實施方案中,基于個體P值對表4和表2中的生物標志物進行分級,其中P值為每種生物標志物區分患輕度OA成員和未患OA成員的能力的指示,接著評估了前40、30、20或10種分級的生物標志物,并選擇其中包括至少一種表4列出的生物標志物的組合。在本發明的一個實施方案中,使用的數學模型選自以下:回歸模型、邏輯回歸模型、神經網絡、聚類模型、主成分分析、最近相鄰分類器分析、線性判別分析、二次判別分析、支持向量機、決策樹、遺傳算法、使用bagging的分類器優化、使用boosting的分類器優化、使用隨機子空間法的分類器優化、投影尋蹤和加權投票。
[0206]得到的分類器可用于診斷未知或測試個體,以確定所述測試個體是否患輕度0A。在一個實施方案中,數學模型(如邏輯回歸)產生的一個或多個分類器得到的診斷為兩種結果(患或未患輕度0A)之一。在本發明的另一實施方案中,答案可以為不可確定的答案。需要指出的是,每種分類器均使用生物標志物的組合,并且使用代表每種生物標志物表達水平的數據產生該分類器。因此,例如當使用的數學模型為邏輯回歸時,得到的分類器使用代表組合的10種基因中每一種的表達水平的含權重因子數據。在一個實施方案中,分類器本身可如上文所述用于診斷。然而在另一實施方案中,鑒定的組合(如所述10種基因)可以獨立于鑒定所述基因的分類器使用。例如,可以監測所述10種基因產生的圖譜以評估測試個體,其中將測試個體的圖譜與來自患輕度OA的個體的10基因圖譜以及未患OA的個體中的10基因圖譜進行比較。
[0207]5.5輸入數學模型以鑒定診斷輕度骨關節炎的生物標志物組合的數據
[0208]例如,為了鑒定用于診斷個體患輕度骨關節炎還是未患骨關節炎的生物標志物,使用反映表1、表2和/或表4生物標志物的一種或多種mRNA產物表達水平的數據,所述數據來自患輕度骨關節炎的個體群和未患骨關節炎的另一個體群(“訓練群”)。為了將訓練群劃分進規定的表型亞組這一目的,可以使用任何OA診斷方法。在優選的實施方案中使用本文所述的Marshall評分法。
[0209]在另一實施方案中,為了鑒定用于診斷個體患輕度骨關節炎還是未患骨關節炎的生物標志物組合,使用反映如表3指出的表1中生物標志物的一種或多種mRNA產物表達水平的數據,所述數據來自訓練群中的個體。在另一實施方案中,為了鑒定用于診斷個體患輕度骨關節炎還是未患骨關節炎的生物標志物組合,使用反映如表5指出的表4中生物標志物的一種或多種mRNA產物表達水平的數據,所述數據來自訓練群中的個體。
[0210]在另一實施方案中,使用反映表1、表2和/或表4中生物標志物的一種或多種蛋白質產物表達水平的數據,所述數據來自訓練群中的個體。表1和表4中生物標志物的蛋白質產物的種類分別在表3和表5中指出。
[0211]5.6訓練群
[0212]在一些實施方案中,參照或訓練群包括10-30個之間的受試者。在另一實施方案中,訓練群含有30-50個之間的受試者。在另一些實施方案中,參照群包括2個或更多個群,其中每個群含有50-100個之間、100-500個、500-1000個之間或超過1000個受試者。
[0213]例如,為了鑒定用于診斷個體患輕度骨關節炎還是未患骨關節炎的生物標志物,使用反映表1 (如表3所不)和/或表4 (如表5所不)中生物標志物的一種或多種mRNA產物表達水平的數據,所示數據來自由第一種表型亞組(患輕度骨關節炎的個體)和第二個表型亞組(未患骨關節炎的個體)組成的訓練群。在一些實施方案中,還使用反映表2中生物標志物的一種或多種mRNA產物表達水平的數據。在一個實施方案中,訓練群的每個表型亞組中其他表型性狀(包括年齡、性別、體重指標、同病狀態、醫藥治療等)的分布相同或相似。例如,第一和第二個表型亞組中個體年齡的分布相同或相似。在一個優選的實施方案中,除了患或未患OA以外,訓練集中使用的兩個群的表型特征相似。
[0214]在另一實施方案中,為 了鑒定用于診斷個體患輕度骨關節炎還是未患骨關節炎的生物標志物組合,使用反映表1 (包括表3所示)和/或表4 (包括表5所示)中生物標志物(任選地與表2中一種或多種多至1、2、3、4、5、6、7、8、9、10、20、30、40或全部生物標志物一起)的一種或多種mRNA產物表達水平的數據。
[0215]在另一實施方案中,為了鑒定用于診斷個體患輕度骨關節炎還是未患骨關節炎的生物標志物,使用反映表1 (包括表3所示)和/或表4 (包括表5所示)中任何數目或全部生物標志物的任何數目或全部mRNA產物表達水平的數據,所述mRNA產物在得自患輕度骨關節炎個體的群、和未患骨關節炎個體的第二群的血中表達。
[0216]5.7回歸樽型
[0217]在一些實施方案中,將待測試生物標志物每種組合的表達數據用于回歸模型,優選邏輯回歸模型。這些回歸模型會為測試的每種可能的生物標志物組合確定方程,每個方程提供與反映模型展示的每種個體生物標志物表達水平數據相乘的系數。
[0218]一般而言,目標多重回歸方程可以寫作:
[0219]Y= a + ^1+ 2?+...+ ^ A5+ £
[0220]其中從屬變量Y為存在(Y為正數時)或不存在(Y為負數時)第一種表型性狀(如患輕度骨關節炎)。該模型說明從屬變量Y依賴于k個解釋變量(代表來自訓練群中第一和第二表型亞組受試者的k個選定基因在目的組織中的基因產物水平的測定值),加上涉及多種不明確的忽略因素的誤差項。在上述模型中,參數^表示保持其它解釋變量為常數的條件下,第一解釋變量X1對從屬變量Y的影響。相似地,參數@2表示保持其它解釋變量為常數的條件下,解釋變量X2對Y的影響
[0221]邏輯回歸模型是線性回歸的非線性轉換。邏輯回歸模型被稱為“對數單位” (1git)模型,可以表達為:
[0222]In [p/ (l~p) ] = ct + ^ ^1+ 2\+''" + ^ A+ e 或
[0223][p/(l - p)] = exp a exp躺 expAJfj x …x expAJr* ?tp*
[0224]其中,
[0225]Ln 為自然對數 logexp,其中 exp = 2.71828...,
[0226]p為事件Y發生的概率,p (Y = I),
[0227]p/(l-p)為“比值比”(odds ratio),
[0228]ln[p/(l-p)]是比值比的對數,或“對數單位”,并且
[0229]模型的所有其它分量與上述的一般回歸方程相同。本領域技術人員會理解,a和£項可以合并(fold)為同一常數。事實上,在一個優選的實施方案中,使用單個項代表a和e。“邏輯”分布是S形分布函數。對數單位分布將估計概率(P)限制在0和I之間。
[0230]在本發明的一些實施方案中,邏輯回歸模型用最大可能性估計(MLE)擬合。換言之,系數(如a,@l,@2,...)由最大可能性確定。可能性是條件概率(如P(Y|X),給定X時Y的概率)。可能性函數(L)衡量觀察到相同數據集中發生的從屬變量值(Yl,Y2,...,Yn)特定集的概率。它寫作從屬變量乘積的概率:
[0231]L = Prob(YfY2=I==^Yn)
[0232]可能性函數越大,在樣品中觀察到Ys的概率越高。MLE涉及發現使可能性函數(LL< 0)的對數盡可能大或者可能性函數的對數的-2倍(-2LL)盡可能小的這些系數(a,3 1,0 2,...)。在MLE中,進行參數a,(61,0 2,...的一些初始估計。然后計算給定這些參數估計時的數據可能性。改善參數估計,重新計算數據可能性。重復這一過程,直至參數估計不再有大改變(例如概率的改變小于0.01或0.001)。邏輯回歸和擬合邏輯回歸模型的實例可見于整體引入本文的 Hastie, The Elements of Statistical Learning, Springer,New York,2001,pp.95-100。
[0233]5.8神經網絡
[0234]在另一實施方案中,測定的每種本發明生物標志物的表達可用于訓練神經網絡。神經網絡是兩階段回歸或分類模型。神經網絡具有分層結構,其中包括輸入單元層(和偏置),它經權重層與輸出單元層連接。就回歸而言,輸出單元層通常僅包括一個輸出單元。然而,神經網絡可以無縫式處理多重定量應答。這樣,神經網絡可用于鑒定區分兩個以上群體的生物標志物。在一個具體實施例中,可以用表1 (包括表3)所示生物標志物產物的表達數據訓練神經網絡,以與未患骨關節炎的個體相比而鑒定輕度骨關節炎特異性生物標志物組合。結果,經訓練的神經網絡可用于直接鑒定生物標志物組合,所述組合用于診斷輕度骨關節炎。在一些實施方案中,使用含有十個神經元的單隱藏層(十個隱藏單元)的后向傳播神經網絡(例如見 Abdi, 1994,“A neural network primer”,J.Biol System.2, 247-283),它們可見于 EasyNN_Plus4.0g 版軟件包(Neural Planner Software Inc.)。
[0235]神經網絡描述于整體引入本文的Duda等,2001, ((Pattern Classification)),第二版,John ffiley&Sons, New York ;和 Hastie 等,2001, The ElementsOf StatisticalLearning,Springer-Verlag, New York。
[0236]5.9其他數學模型[0237]上述模式分類和統計技術僅為可用于構建輕度OA分類模型的模型類型的實例,例如整體引入本文為參考的Duda和Hart,《Pattern Classification and SceneAnalysis)), 1973, John ffiley&Sons, Inc., New York 中 211-256 頁描述的聚類分析、主成分分析(參閱引入本文為參考的Jolliffe, 1986,《Principal Component Analysis)),Springer, New York);最近相鄰分類符分析(參閱如 Duda, ((Pattern Classification)),第二版,2001, John Wiley & Sons, Inc ;和 Hastie, 2001,《The Elements of StatisticalLearning》,Springer, New York);
[0238]線性判別分析(參閱如Duda,《Pattern Classification》,第二版,2001, JohnWiley & Sons, Inc ;和 Hastie,2001,《The Elements of Statistical Learning》,Springer, New York ;Venables & Ripley,1997,《Modern Applied Statistics withs-plus)), Springer, New York);支持向量機(參閱如 Cristianini 和 Shawe-Tay I or,2000,《An Introduction to Support Vector Machines》,Cambridge University Press,Cambridge,Boser等,1992," A training algorithm for optimal margin classifiers,《Proceedings of the5th Annual A CM Workshop on Computational Learning Theory》,ACM Press, Pittsburgh, PA, 142-152 頁;Vapnik, 1998, ((Statistical Learning Theory)),Wiley, New York,引入本文為參考)。
[0239]5.10分類器的評估
[0240]一旦使用數學模型計算了一個或多個分類器之后,就可以對分類器進行評估,以確定哪些分類器對于所需目的是有效的。例如,就其將訓練群中每一個體正確表征為患輕度OA或未患OA的能力對每種分類器進行評估或評分。例如,可以使用以下一種或多種方法評價分類器:交叉驗證、留一交叉驗證(leave one out cross validation)、n_倍交叉驗證、用標準統計學方法和公開的刀切法分析。本文使用的評估分類器的方法稱為“評分”。在一些實施方案中,使用訓練群進行評分。在另一些實施方案中,使用本文所述的“評分群”進行評分。在一個實施方案中,除了未用于訓練群的一個或多個成員以外,評分群還包括訓練群中的成員。在一個實施方案中,除了未用于訓練群的一個或多個成員以外,評分群還包括訓練群的成員。在一些實施方案中,訓練群成員中5%或更少、10%或更少、20%或更少、30 %或更少、50 %或更少或90 %或更少與評分群共用。
[0241]在一些實施方案中,使用百分比校正預測統計對每個分類器評分。“百分比校正預測”統計假定若預測的P大于或等于0.5,則期望事件會發生,否則不發生。通過給這些概率指定0和1,可以與訓練群中樣品的值進行比較,以確定訓練群中正確采樣的百分比。
[0242]在一個實施方案中,用于評價分類器正確表征訓練群體每一個體的能力的方法是評價分類器的靈敏度(TPF、真正分數)和1-特異性(TNF,真負分數)的方法。例如,在一個優選實施方案中,使用接受器工作特性(receiver operating characteristic) ( “ROC”)。ROC提供評價所生成方程的診斷結果靈敏度和特異性的若干參數。例如,在一個特別優選的實施方案中,ROC面積(曲線下面積)用于評價方程。在一個優選實施方案中,優選大于0.5,0.6,0.7,0.8,0.9的ROC面積。1.0的完美ROC面積分數表示分類器具有100%靈敏度和100%特異性[0243]本領域技術人員會理解,曲線下面積將ROC曲線中含有的二維信息轉換為一維信息。在另一些實施方案中,直接使用來自ROC曲線二維形狀的信息。例如,ROC曲線還提供關于分類器靈敏度和特異性的信息。在一些實施方案中,基于靈敏度或特異性選擇分類器。這可以是重要的評分指示。例如,在將個體誤診為患病比將個體誤診為正常更安全的情況下,具有高特異性(即更少的假陰性)的診斷分類器可能是很重要的。因此,在一些實施方案中,可以設置靈敏度或特異性的截止值,并基于剩余的變量對分類器進行分級或評分。在一些實施方案中,使用產生數據的任何已知方法對每個分類器產生ROC曲線。在一些實施方案中,使用微陣列產生數據。在一些實施方案中,使用定量RT-PCR產生數據。
[0244]在一些實施方案中,分類器為加權的邏輯回歸模型,其特征為多類別對數單位模型。例如,在一些實施方案中,分類器甄別兩個不同的性狀組。在另一些實施方案中,分類器甄別兩個以上的不同性狀組。對數單位模型包括多類別對數單位模型,其描述于Agresti,《An Introduction to Categorical Data Analysis》,John Wiley & Sons,Inc.,1996,NewYork,第7、8章,其引入本文為參考。表10展示了用于基于對數學模型應用的表達數據形成ROC曲線的數據,所述數學模型使用以下的對數單位:
[0245]In [p/ (1-p) ] = a + ^1+ ^ 2X2+ e.[0246]表10:使用數據組44的對數單位ln[p/ (1-p) ] = a + 3 2X, + e的值
[0247]
In|p/(l-p)]存在/不存在性狀
【權利要求】
1.用于確定測試個體患有輕度骨關節炎之可能性的試劑盒,其包含:對于選自表1或表4所示基因的兩個或更多個基因的組中的每種基因來說,用于特異性擴增所述基因之 cDNA的引物。
2.權利要求1的試劑盒,其中所述試劑盒還包含具有逆轉錄酶活性的酶。
3.權利要求1或2的試劑盒,其中所述試劑盒還包含具有熱穩定DNA聚合酶活性的酶。
4.試劑盒在制備用于確定測試個體患有輕度骨關節炎之可能性的藥物中的用途,其中所述試劑盒包含:對于選自表1或表4所示基因的兩個或更多個基因的組中的每種基因來說,用于特異性擴增所述基因之cDNA的引物。
5.權利要求4的用途,其中所述試劑盒還包含具有逆轉錄酶活性的酶。
6.權利要求4或5的用途,其中所述試劑盒還包含具有熱穩定DNA聚合酶活性的酶。
【文檔編號】C12Q1/68GK103497993SQ201310367166
【公開日】2014年1月8日 申請日期:2006年2月6日 優先權日:2005年2月7日
【發明者】劉宗正, 張宏偉, 亞當·登普西, 托馬斯·耶格爾, 承恩 申請人:基因信息公司