專利名稱:來自基因轉錄產物檢測的具有廣泛基礎的疾病結合的制作方法
來自基因轉錄產物檢測的具有廣泛基礎的疾病結合 臨時專利申請的交叉參考 本專利申請要求2007年4月24日遞交的名為"具有廣泛基礎的疾病結合基因轉 錄產物檢測"的相關臨時專利申請的優先權,該申請在此通過引證全部并入本文。
背景技術:
許多人被遺傳性疾病所折磨,因此遺傳性疾病是許多研究和誤解的主體。 一些遺 傳性紊亂可能是由染色體數失常所引起的,例如,唐氏綜合癥(額外的21染色體)和克蘭 費爾特氏綜合癥(具有2個X染色體的男性)。分別通過改變基因表達或者獲得功能,三聯 體擴增重復突變可以造成X染色體易損綜合癥或亨丁頓舞蹈癥。當某些基因序列不以預期 形式存在時,會發生其他的遺傳性紊亂,例如,患有多發性硬化和II型糖尿病。目前,已知 大約4, 000例遺傳性紊亂,隨著對人類基因組的了解的深入,更多的遺傳性紊亂將會被發 現。大部分疾病是非常罕見的,千百萬人中才會有一例患者,而其他的疾病是較為常見的, 例如囊腫性纖維化,其中大約有5%的美國人攜帶至少一個拷貝的缺陷基因。
人類的遺傳組成是通過脫氧核糖核酸(DNA)來反映的。DNA是一種分子,該分子包 括核酸序列(即,核苷酸),所述核酸序列形成了包括活生物體生長和作用的遺傳指令的密 碼。DNA序列或者遺傳序列是由任意四個具體核酸串聯構成的,代表了真實的或者假設的 DNA分子或DNA鏈的一級結構,具有攜帶信息的能力。如本領域內已知的,可能的核酸(字 母)是A、C、G和T,分別代表了DNA核甘酸亞基鏈一與磷酸骨架共價相連的腺嘌呤、胞嘧啶、 鳥嘌呤和胸腺嘧啶堿基。通常序列之間相鄰打印,中間沒有空格,例如,序列AAAGTCTGAC。 四個以上核苷酸的串聯可以被叫做序列。 核糖核酸(RNA)是一種核酸聚合物,由核苷酸單體組成,作為DNA和核糖體之間 的信使,并且通過編碼氨基酸負責制備蛋白質。RNA多聚核苷酸包括核糖糖基,與DNA不同 的是,DNA包括脫氧核糖糖基。通過叫做核糖核酸聚合酶的酶作用,從DNA中轉錄(合成) RNA,并且通過其他酶進行進一步加工。RNA作為基因翻譯成蛋白質的模板,將氨基酸傳遞給 核糖體產生蛋白質,并同時將轉錄產物轉變成蛋白質。 基因是核酸的一部分,該部分包括產生功能性產品所必須的信息,所述功能性產 品通常指蛋白質。基因包括調節區域、轉錄區域和/或其他的功能性序列區域,調節區域指 令在什么情況下產生產品,轉錄區域指令產品的結構。基因彼此之間相互作用,影響身體發 展和行為舉止。基因有長鏈DNA組成(在某些病毒中由RNA組成),包括一種啟動子和一 種編碼序列,所述啟動子控制基因活性,編碼序列決定產生什么基因。當基因是有活性的時 候,編碼序列被拷貝入叫做轉錄作用的過程中,產生一種基因信息的RNA拷貝。因此,這些 RNA通過遺傳密碼指導蛋白質合成。然而,RNA還可以直接被使用,例如作為核糖體的一部 分直接被使用。由基因表達產生的分子,無論是RNA還是蛋白質,都叫做基因產物。
有機體或者細胞中的總補充基因叫做它的基因組。有機體基因組的大小不嚴 格的取決于他的復雜性。在人類基因組中基因的數目估計是小雨30億個堿基對和大約 20, 000-25, 000個基因。
4
正如前面提到的那樣,某些遺傳性紊亂可能由DNA序列不正確編碼引起。單一核 苷酸多形性或者SNP(有時也叫做"snp")是在同一種類成員間(或者在一個成員的成對染 色體之間)當基因組中單一核苷酸一A、T、G、C不同時發生的DNA序列的變化。例如,來自 不同個體的兩個測序的DNA片段AAGCCTA和AAGCTTA,這兩個片段在單一核苷酸上包含差 異。在這種情況下,該位點被認為具有兩個等位基因C和T。 在一個群體內部,單一核苷酸多形性可以被賦予一種次要的等位基因出現 率 一 在攜帶較少常見變體的群體中的染色體與攜帶較多常見變體的群體中的染色體的比 例。通常,人們希望單一核苷酸多形性具有的次要等位基因出現率^ 1% (或者0.5%等 等),而不是〃 所有的單一核苷酸多形性〃 (太大以至于不實用)。注意到人類群體之間的 變化是非常重要的,因此,在一個區域性或者種族性群體中包含的足夠常見的單一核苷酸 多形性可能在另一個群體中非常罕見。 單一核苷酸多形性可以屬于基因的編碼序列,基因的非編碼序列或者基因間區 域。由于所述遺傳密碼的退化,編碼序列內部的單一核苷酸多形性不會必然改變所產生的 蛋白質的氨基酸序列。能夠導致相同多肽序列的單一核苷酸多形性的兩種形式叫做同義 (有時也叫做靜態突變)-如果產生不同的多肽序列,就是非同義的。不在蛋白質編碼區域 中的單一核苷酸多形性也可以具有基因剪接、轉錄因子結合或者非編碼RNA序列的效果。
人DNA序列的變化能夠影響人類疾病的發展和/或對病原體、化學物質、藥物等等 的反應。然而,已經了解到DNA序列對生物學研究極為重要的一個方面是人類基因組之間 的比較區域(例如,來自相似人的比較DNA序列, 一個患有某種疾病而另一個不患有這種疾 病)。來自AffymetrixTM和lllumina 的技術能夠在幾天之內測定幾十萬單一核苷酸多形 性的基因型,花費通常不超過$1, 000. 00。 微陣列分析技術通常被用于整理分析從DNA、 RNA和蛋白質微陣列試驗中產生的 數據,從而允許研究員在單一實驗中調查大多數基因的表達狀態,在多數情況下,大多數基 因組是指有機體的整個基因組。這種實驗產生非常大量的遺傳數據,難以進行分析,尤其在 缺少有效的基因注解的情況下。大多數微陣列廠家,例如AffymetrixTM,會提供商業可售的 數據分析軟件以及微陣列設備。 用于統計分析的專門化軟件工具能夠確定在微陣列實驗中相對于參考狀態基因 的超表達或不充分表達,這可能會幫助識別與具體表型有關的基因或者基因組。這種統計 標準程序一般會提供所關心的基因或者基因組的用戶信息,包括與數據庫和非冗余集合數 據庫(curated databases)和基因實體論相連,所述數據庫例如NCBI基因銀行,所述非冗 余集合數據庫例如Biocarta。 作為統計分析的結果,有機體的某一方面可能被定型。基因定型涉及使用生物實 驗確定個體基因型的過程。目前進行這一過程的方法包括聚合酶鏈反應、DNA測序和與DNA 微陣列或磁珠雜交。該技術是檢測父親/母親時固有的,也是在調查與疾病有關的基因時 必須的。 個體有機物的表型或者是它的總物理性質和結構,或者是一種特征的特異性表 現,例如,身材、眼睛的顏色、或者個體間有變化的行為。表型很大程度上通過基因型來確 定,或者通過個體在染色體的一個或者一個以上位點攜帶的等位基因一致性來確定。許多 表型通過多重基因來確定并受到環境因素的影響。因此,一個或者幾個已知等位基因的一致性不總是能夠預測表型。 在本技術現有狀態的缺陷中,基因定型過程通常對單一病人或者單一進樣研究樣 品的單一循環中完成,只注意基因定型的特定疾病。因此,這種結果對于其他相似狀態病人 任意可能的比較和分析來講是相對孤立的。因此,這種孤立導致不能在實驗所得結構的診 斷和治療中起作用。目前沒有一種系統允許帶下劃線的數據共享,因此失去了整合數據所 有可能的有益效果。因此,當收集遺傳物質樣品時,只作為一種個體方法來進行,不考慮結 合來自多種樣品來源(例如,人)的各個遺傳樣品數據能夠帶來的有益效果。這里需要一 種具有廣泛基礎的疾病結合基因轉錄產物試驗,以及與此有關的系統和方法,從而允許來 源廣泛的各式各樣數據的同化。
當與所附附圖結合理解時,本發明的前述方面和與之相伴的權利要求的優點將會
變得更容易理解,同時通過參考如下詳細說明,會理解的更為透徹。其中 圖1是一種示意圖,顯示了根據這里公開的本發明的一種實施方案制備微陣列的
方法,所述微陣列在具有廣泛基礎的疾病結合基因轉錄產物試驗中使用; 圖2是一種示意圖,顯示了根據這里公開的本發明的一種實施方案,從若干來源
的樣品中收集遺傳物質樣品并檢測和分離用于分組的遺傳物質鏈的方法; 圖3是一種示意圖,顯示了用于建立數據結構的系統和方法,根據這里公開的本
發明的一種實施方案,所述數據結構在具有廣泛基礎的疾病結合基因轉錄產物試驗中使 用; 圖4顯示了可能與信息數據庫有關的典型的數據排列,根據這里所公開的本發明 的一種實施方案,所述信息數據庫是由具有廣泛基礎的疾病結合基因轉錄產物試驗獲得的 信息數據庫;并且 圖5是一種示意圖,根據這里公開的本發明的一種實施方案,顯示了用于建立具 有廣泛基礎的疾病結合基因轉錄產物試驗的方法和系統。
具體實施例方式
進行下列討論使所屬領域普通技術人員能夠制備并使用這里公開的主題內容。在 不脫離這里所詳細描述的精神和范圍的情況下,這里描述的主要原則可以被應用于除了這 里詳細描述的實施方案和應用之外的實施方案和應用中。這里公開的內容不局限于具體描 述的實施方案,而是與能夠符合這里公開或建議的原則和特點的最寬范圍相一致。
這里公開的主體內容與單一核苷酸多形性(SNP)以及插入/刪除(UD)遺傳性多 態現象的翻譯檢測有關,通過在定制的微陣列基因表達平臺上進行熒光雜交作用完成檢測 RNA序列的成比例分析。單一核苷酸多形性(SNP)可以通過一種專門設計的方法識別(單 一核苷酸多形性(SNP)通常通過脫氧核糖核酸分析進行評價)。這種獨特的試驗涉及的疾 病包括一系列常見的遺傳序列,經過同行評議的文獻中公開了各種已知的疾病都與這一系 列的遺傳序列有關,所述疾病例如愛迪生氏病、貧血、哮喘、動脈粥樣硬化、孤獨癥、乳腺癌、 雌激素新陳代謝作用、巴塞多病(Grave' s disease)、激素代替治療、主要組織相容性復合 體(MHC)基因、傳染性疾病篩選板、存活力、狼瘡、多發性腦脊髓硬化癥、肥胖癥、關節變性病、前列腺癌和2型糖尿病。通過第三方臨床組獲得臨床樣品用于構建發展基礎數據庫,并且部分與Swank MS基礎相關。同時進一步的融合并利用Swank計劃的追隨者的合作和自愿努力,所述Swank計劃如 〃 多發性硬化飲食書〃 (Roy L. Swank所著)的記載。通過一定的試驗服務可以促進對醫生和病人使用的實時表型/基因型結合檢驗的實時在線訪問。
新工藝的各種實施方案和方法包括與疾病相關的遺傳物質樣品的結合和結合、以最適合分析及操作的方式制備具有代表性遺傳物質樣品的微陣列、以及通過計算機網絡傳遞被同化并編輯的數據。下面的圖l-5描述了這些實施方案的各個方面。
圖1表示了全部100種用于制備數據結構(例如,一種微陣列)的方法,根據這里所公開的發明的一種實施方案,所述數據結構可以被用于具有廣泛基礎的疾病結合基因轉錄產物試驗。該方法通常包括從病人體內吸取血液樣品,所述病人在iio步驟預定了基因定型。當然,為了同化與若干疾病相關的包含廣泛的數據庫,通常從多個來源吸取血液樣品。應當注意到,任何適用于獲得遺傳物質(例如,脫氧核糖核酸和/或核糖核酸)的組織都可以被使用,例如肝臟組織。血液細胞可以容易的被收集和容易的被運輸,這是這種脫氧核糖核酸/核糖核酸來源更有效率并更為有效。通常使用適當的血液收集裝置,例如血液收集管來收集血液樣品,所述血液收集管可以從Paxgene 處購得。 該樣品通常被貼上適當的標簽并且通過一種無名但可追蹤的病人識別方法進行標記。說得更精確些,所有的測量都在遵守健康保險便利及責任法案(HIPAA)的規定的情況下進行,因此所述血液樣品可看作是相同的,并且不會偶然泄露特許信息。在收集的時候,可以對血液樣品儲存其他的人口統計學信息(例如,在標簽上記錄,存貯在計算機數據庫中)。這種人口統計學信息可以包括許多不同的描述性表型特征,例如,年齡、性別、國籍、種族、具體的健康問題、職業、誕生地、目前的生活場所,等等。 然后從血液樣品獲得的特異性遺傳物質,例如核糖核酸可以被檢測并在步驟112中使用核糖核酸分離試劑盒分離,所述試劑盒例如從QiagenTM獲得的試劑盒。如上所述,核糖核酸的分離可以再進行收集的實際位點完成,或者可以在收集之后在遠程實驗室中完成。在下面的圖2中更為詳細的描述了所述遺傳物質的分離過程。 在步驟114中,使用熒光過程擴增一種核糖核酸樣品中的特異性序列,其中所述熒光過程對預先確定的核糖核酸鏈具有特異性,所述預先確定的核糖核酸鏈可以從llluminaTM處獲得,商品名為DASl"。在一種作為選擇的實施方案中,脫氧核糖核酸中的特異性序列也可以通過相似的熒光過程擴增,所述熒光過程對預先確定的脫氧核糖核酸鏈具有特異性,所述預先確定的脫氧核糖核酸鏈從llluminaTM處獲得,商品名為Golden GateTM。
遺傳物質的分離之后通常進行熒光標記的拷貝擴增,所述熒光標記的拷貝隨后可能與附著有共同底物,即微陣列的特異性探針雜交。然而,經過收集并分離的樣品可以在適合于分析的任意數據結構中排列并分析。如此,數據可以直接被基于計算機的數據結構,例如一種數據庫所收集并吸收。 在步驟116中,所述被分離并擴增的遺傳物質樣品可以根據識別的遺傳物質鏈進行分組。根據預定格式在微陣列的微珠池中以一種特定的方式排列各個組。這種預定格式可以包括適合于分離的核糖核酸/脫氧核糖核酸鏈中所有識別基因個體分析的標準格式。其他的預定格式可以包括與一種或一種以上參照組樣品的參照組類似基因進行并列式比較。其他的形式可以包括特異性的基因組,所述特異性基因組適合于具有廣泛基礎的疾病結合、多發性腦脊髓硬化癥結合、包含廣泛的診斷法集合、包含廣泛的預示性治療數據庫或 者其他任何樣品基因結合。 一旦以特異性方式制造出微陣列,所述方式或者類似形式的出 現可以為步驟118的分析做好準備。西雅圖WA州的IGD-Intel公司所有的名為"用于制備 疾病結合基因轉錄產物試驗微陣列的方法和系統"的專利申請中更為詳細的描述了每個微 陣列的制備方法,該專利通過引證在此全部并入本文。在微陣列中排列樣品的形式通常符 合與血液樣品分組有關的特異性,入下面圖2所述。 圖2顯示了一種示意圖,顯示了根據這里公開的本發明的一種實施方案,從若干 來源的樣品中收集血液樣品并識別用于分組的遺傳物質鏈的方法。在這里公開的一種方法 的概括中,本領域技術人員可以通過從許多相似來源的樣品種收集許多相似的血液樣品, 作為所述方法的開端,所述血液樣品適用于遺傳密碼分離和分析。然后,檢測并分離每種血 液樣品中遺傳物質可識別的鏈,從而所述遺傳物質鏈可以通過一種基因序列或者核苷酸序 列來識別。 其次,對于各個血液樣品,當出現一種可識別的鏈時,根據其相似的可識別鏈,所 述樣品可以被分成各個樣品組,然后每類遺傳物質分離鏈樣品組可以組成每個血液樣品遺 傳物質組,因此,每組包括來自每種血液樣品的遺傳物質相似的可識別鏈。 一旦完成分組, 每組遺傳物質可能與一種疾病有關,所述疾病與該組所包括的可識別鏈或者其他可有效用 于診斷的相關數據有關。這些包含廣泛的步驟的各個方面如下所述。 在圖2中,一些不同來源的遺傳物質通常可以被用于獲得一些不同的遺傳物質樣 品。這一步驟在圖2中結合步驟200被表達,并且與圖1中單獨的步驟110有關。因此,不 同的并可識別的遺傳物質樣品隨后可以被處理,從而檢測并分離具體的遺傳物質,用于同 化入結合物中。這種過程包括核糖核酸的分離。 在步驟210中,從每個樣品中檢測并分離遺傳物質鏈時可以識別特異性基因序列 (即,核苷酸序列)。在一種結合水平上,每個樣品通常具有第一鏈,例如,鏈A,從而所有可 以被鏈A識別的基因序列都可以被分離,并將樣品從其他鏈中分離出來。同樣的,每個樣品 的鏈B也可以被分離,并且,從而獲得其各自的分離樣品。對于鏈C以及每個樣品中遺傳物 質的每種其他可識別的鏈也是一樣。雖然,圖2只表示了 3個特異性鏈,本領域普通技術人 員應該理解,還有成千的潛在鏈可以被分離。在遞交本申請時,至少有1142種特異性可識 別鏈可以有效用于每種樣品的檢測和分離。 這種分離過程還可以包括根據上述特異性基因序列識別的核糖核酸鏈進行的遺 傳物質的分離。另外,所述遺傳物質的分離還可以基于與顯示疾病的基因表達有關的基因 序列、基于與顯示一種性狀的基因表達有關的基因序列、基于與顯示一種表型的基因表達 有關的基因序列、和/或基于與顯示一種基因型的基因表達有關的基因序列。
在檢測、分離并識別了所有鏈的情況下,所有樣品中的每類鏈(即,所有鏈A分離 作用產生的樣品)都可以在步驟220被集合在一起,用于其他的結合和分析。同樣,所有鏈 A的表達可以被集合入組A 230,所有鏈B的表達可以被集合入組B 231,所有鏈C的表達可 以被集合入組C 232。這種集合考慮了一種結合水平上數據的同化作用,所述同化作用基于 與許多同化數據結合水平比較后的多種基因表達。具體而言,樣品來源的人口統計信息可 能與每個樣品都有關。 另外,與每個血液樣品有關的結合信息可以通過對相似的鏈進行分組完成。這種結合包括將顯示可表達第一疾病的基因序列表達過程的血液樣品與該血液樣品的人口統 計信息相結合,將顯示可表達第一疾病的基因序列表達過程的血液樣品與顯示可表達第一 疾病的基因序列表達過程的另外一種血液樣品相結合;將顯示可表達第一疾病的基因序列 表達過程的血液樣品與顯示可表達第二疾病的基因序列表達過程的另外一種血液樣品相 結合;將顯示可表達第一疾病的基因序列表達過程的血液樣品和與這種第一疾病有關的治 療方法相結合;并且,將顯示可表達第一疾病的基因序列表達過程的血液樣品與一種特異 性多形性相結合。 分組過程產生許多適當的結合,根據一種血液樣品與另一種血液樣品的結合從結 合的血液樣品中獲得的統計數據可以外推。這種統計數據包括表達速率,相互關聯的表達 速率,等等。 使用這種獨特的探針將會提供一種低成本的個體健康狀況基因評定方法,通過一 種新型并有效的臨床診斷獲得個體的健康狀況。另外,添加或者消除與給定疾病相關的探 針,如文獻中出現的新信息的記載,可以進一步增強臨川診斷方法的優勢。根據報道,本領 域技術人員可以理解,增加探針含量是一種設計中的未來方法。但是,進一步地,所達臨床 診斷法也可以被擴大,從而分別檢測各個成分,和/或進行能夠解決不同疾病或者所關心 的生活方式的試驗。 現在可以從分組的遺傳物質中收集的信息可以通過一種電腦服務器被結合入電 腦可讀媒介物中,例如,數據庫。然后,這些數據可以被任何連接的客戶電腦訪問,并因此從 結合的數據庫中,根據客戶電腦向電腦服務器的請求,將信息提供給客戶電腦。
圖3是一種示意圖,顯示了用于建立數據結構的系統和方法,根據這里公開的本
發明的一種實施方案,所述數據結構在具有廣泛基礎的疾病結合基因轉錄產物試驗中使 用。 由于各種來源的遺傳物質的樣品被聚集,每種樣品可以唯一的通過該樣品的來源 來分離。例如,在圖3所示的所有樣品中,(即,樣品X 310到樣品M),通過一種軌跡識別方 法可以唯一的識別出每種樣品。為了得到最后的數據結構,第一樣品可以是樣品X,其他的 可以是樣品Y,如此類推直到最后的樣品,樣品M。本領域技術人員應該知道,這些樣品可以 根據如上圖2所述的一些特異性方法來處理,或者還可以在一種微陣列上被處理,所述微 陣列專門為這里所描述的方法和系統而制備。 —旦通過來源分別確認出所有的樣品,每種樣品可以再具體分為具體的部分,其 中,每個具體部分可能顯示如上所述的特異性基因表達。在這里使用的"部分"是指任意量 的顯示特異性基因表達的遺傳物質樣品。在任何情況下,"部分"都不表示一種具體的遺傳 物質量或數量。因此,每種樣品可以具有許許多多的部分,因此,每個部分顯示一種特異性 基因表達。 在構建數據結構時,每個部分都可以在集合步驟311中進一步的確認為顯示一種 特異性基因表達(或者依情況所示,不表達所述基因)。因此,部分X1可以被確認為具有一 種第一特異性核苷酸序列、部分X2可以被確認為具有一種第二特異性核苷酸序列,等等, 直到最后的部分被確認為具有一種第n特異性核苷酸序列。在將每個部分識別為包括第一 到第n的特異性核苷酸序列的情況下,保留這種來源(即,樣品X)的部分結合。樣品Y到 M中類似的部分也保持有這種來源樣品的特異性結合。簡而言之,樣品Y被分成部分Yi到Yn,分別唯一的顯示特異性第一到第n核苷酸序列。對所有第m樣品進行這種分部分和結合的過程。 其次,在集合步驟312,每個部分都與各自的疾病有關。說得更精確些,部分XrXn與疾病DrDn有關,因此,與各個部分有關的每種疾病唯一的對應于各個部分所顯示的特異性核苷酸序列。同樣的,部分YrYn與疾病DrDn有關,以此類推到第M部分,其中,M1-Mn與疾病Dl-Dn有關。 每種樣品的每種部分都與一種特定的疾病有關,在此基礎上,包含廣泛的疾病結合基因轉錄產物數據可以被保存在單一數據結構330中。適當使用這種數據結構,以外推得到許多不同的結合和數據趨勢。 例如,如果在收集樣品的同時收集樣品來源的人口分布數據,通過將人口分布數
據與每個樣品中顯示這種遺傳疾病表達的部分相結合,可知人口分布數據還可能同時與特
異性基因表達有關。然后,在數據結構內部適當的使用這種數據結合,可以推導出與此相關
的數據,即該數據包括一種第一疾病,這種第一疾病與攜帶有該樣品來源人口統計信息的
樣品某一部分有關。總體來說,人口資料和特異性疾病的特異性趨勢可以被儲存。 作為另一個實施例,其他的趨勢數據可以通過將來自第一來源的樣品部分與來自
第二來源的樣品部分相結合來儲存,其中,所述第一來源的樣品顯示能夠表現出第一疾病
的特異性基因表達,所述第二來源的樣品顯示能夠表現第二疾病的特異性基因表達。然后,
使用這種適當的結合,可以通過推導相關的數據儲存其他趨勢數據,所述相關數據包括來
自第一來源的樣品部分與來自第二來源的樣品部分,其中,所述第一來源的樣品顯示能夠
表現出第一疾病的特異性基因表達,所述第二來源的樣品顯示能夠表現第二疾病的特異性
基因表達。同樣的,這種趨勢數據可以通過將特異性多形性和某種特異性部分相結合來存
儲,所述特異性部分顯示與這種多形性有關的核苷酸序列。 關于多種疾病結合的其他信息可以通過將來自第一樣品的部分和來自第二來源的樣品部分相結合來儲存,其中,所述第一樣品分別顯示與第一和第二疾病有關的特異性基因表達,第二來源顯示與第一或第二疾病有關的特異性基因表達。在這些結合的基礎上,本領域普通技術人員可以推導關于來自第一來源的樣品部分的相關數據,該樣品部分顯示能夠表現第一疾病能夠的特異性基因表達;也可以推導出關于來自第一來源的樣品部分的相關數據,該樣品部分顯示能夠表現出第二疾病的特異性基因表達;還可以推導出關于來自第二來源的樣品部分,所述樣品部分顯示與第一或第二疾病有關的特異性基因表達,從而致力于產生其他的趨勢數據。 在另一個實施例中,可以通過將來自第一來源的樣品部分與關于第一疾病的治療相結合來表達治療數據,所述來自第一來源的樣品部分顯示能夠表現出第一疾病的特異性基因表達。進一步的,這種治療數據還可以從這種相關性中推導得出,所述相關性包括將來自第一來源的樣品部分和與第一疾病有關的治療,所述來自第一來源的樣品部分顯示能夠表現出第一疾病的特異性基因表達。 圖4顯示了一種與信息數據庫有關的典型的數據排列,根據這里所公開的本發明的一種實施方案,所述信息數據庫是由具有廣泛基礎的疾病結合基因轉錄產物試驗獲得的信息數據庫。根據圖4的公開,在數據結構400中可以排列與遺傳物質部分有關的數據,所述遺傳物質部分是從可追蹤的樣品中滋生出來的。在圖4中,所述數據結構可以結合特異性試驗470、 ID 411、多形性412、表達比率413和討論414。 特異性試驗410通常包括已知的核苷酸序列種類,其中,本領域普通技術人員可 以進行試驗確定存在或者不存在特異性遺傳疾病或者遺傳紊亂。根據多形性412和比率 413,討論414會顯示用于診斷的可能性,或者建議對于某種具體疾病的治療方法。
ID 411通常包括能夠去除個體顯著性并將這種個體顯著性替換為相關的表型特 點的獨特的識別測定法。 多形性412通常是指對分析樣品呈遞的特異性核苷酸,這種核苷酸可能與某種疾 病的存在有關。說得更精確些,在多形性412所識別的特異性核苷酸序列中涉及對每個個 體進行檢測過程而產生的分析基因組序列的比例。 最后,數據結構還可以包括討論414,討論414是從已經發表的文獻和出版的臨床 研究實驗中獲得的臨床相關知識中總結出來的。 在數據結構的至少一些數據設置中,可以獲得具有廣泛基礎的疾病結合基因轉錄 產物實驗數據結構。這種數據結構具有以下特點一種第一有形數據組,可以操作儲存來 自特異性來源的遺傳物質的表達數據結果,所述表達與第一疾病有關;一種第二有形數據 組,可以操作用來存儲數據源的識別方法并與第一有形數據組相結合;和一種第三有形數 據組,可以操作存儲至少一個其他的與第二疾病有關的結合,所述第二疾病與第二基因表 達有關。 其他的數據組可以包括一種第四有形數據組,可以操作用來存貯與第一疾病有關
的特異性試驗的識別方法;一種第五有形數據組,可以操作用來存儲于第一疾病和第一基
因表達有關的表達速率;以及一種第六有形數據組,可以操作用來存儲于第一疾病和與第
一基因表達有關的討論。這種數據結構可以在固定于電腦可讀的媒介物中識別,例如,一種
數據庫,或者可以被固定到另一種媒介物中,例如,含有遺傳樣品微陣列的基質材料。 在獨立基因表達微陣列平臺上,從人類基因組分離區域獲得的核酸序列的特異性
組合可以作為一種常見的內容被反映。完整的核酸序列表形成人類基因組測試中的分析因
素,這可以形成基因轉錄產物測試的基本特點,在臨床使用中通常能夠有效的檢測遺傳密
碼中的轉錄變量,有文獻證明所述遺傳密碼與疾病、治療劑反映結合,和/或疾病的治療有
關。通過定量(測定并評價組織內部存在的轉錄產物)和定性(測定基因組區域)的方法,
檢測結果可以評價RNA。 這種核酸陣列可以由探針序列組成,所述探針序列被分離用于檢測給定的基因內 部區域,所這給定的基因絕大部分能夠有效地顯示表達水平并表明多形性部分,顯示個體 實際表達的基因組中的序列。通過將擴增部分與所述陣列雜交并分析從雜交過程產生的雜 交方式來檢測被認為存在于樣品擴增部分的核酸序列,所述樣品是從標準血液樣品和/或 疾病感染組織中分離出來的。 經過全面的分析經過同行評議的文獻(或者其他的定期更新內容),具有臨床相 關性要求的實驗結果的結合可以被獲取并記錄作為結論。通過現有的和正在進行的企業結 合按季度協議評價或維持一種對等醫生支持網絡,可以對現有的要求進行進一步的改進。
記載這種實驗結果的文章顯示了 1到50遺傳序列自己的結果。其他的關于至少 1142種剩余序列的結果可以通過交替測定獲得。通過給中相關的聚類分析方法(分級方 法、區分方法和結合方法),這些測定可以使醫生相對于所有進行這種測定的病人而言更好的掌握他們負責的病人的信息。按照需要實現的目標可以進一步的促進為醫生/醫生網絡 提供實時基因型/表型結合的方案。醫生可以相對于所有進行過這種實驗的個體的其他數 據分析他們自己負責的病人的數據。 經評價的實施例的多形性可以是單一核苷酸多形性(SNP)、缺失、和/或刪除插入 序列。進一步的,已經確定出預計存在于所述方法部分的多形性。更進一步的,所述核酸樣 品可以是基因組DNA、互補DNA、互補RNA、 RNA1總RNA或者信使核糖核酸。在這些變量中, 所述單一核苷酸多形性(SNP)、缺失或者插入可能與一種疾病、藥物的功效有關、和/或與 上述疾病發展或者減緩的傾向性有關。通常,輸出數據可以包含在電腦可讀的媒介物(例 如,一種CD或者DVD)中并傳遞給客戶,例如,訂閱的醫生。 圖5是一種示意圖,根據這里公開的本發明的一種實施方案,顯示了用于建立具 有廣泛基礎的疾病結合基因轉錄產物試驗的方法和系統。在這個實施方案中,微陣列500 的特點在于根據每個樣品的結合具有不同識別的基因表達排列。其他的實施方案中也存在 其他的數據排列。因此,根據樣品已知的排列,存在的表型或其缺點的特異性表達方式確定 了從每種制備的微陣列500中獲得的信息類型。作為這種事實方案的結果,出現的特異性 方式表明單一核苷酸多形性(SNP)、插入或者缺失在不同的區域出現的可能性。
這種方式可以通過微陣列閱讀器501閱讀。微陣列閱讀裝置通常包括一種微陣列 站502,可以操作用來觀察微陣列500。如上所述,典型的微陣列500包括大量的存儲孔,用 于儲存遺傳物質樣品。基質中存在的孔可以被處理,從而每個行都適于雜交遺傳物質樣品, 由此識別一種獨特的基因表達(即,每行一個基因)。進一步的,對每個欄進行處理,使每欄 中每行中的樣品與單一來源的遺傳物質有關(即,每列一個人)。 微陣列閱讀器501通常也可以包括一種分析裝置510和一種記錄裝置520,分析裝 置510可以操作用來分析顯示在微陣列500上的方式,記錄裝置520可以操作用來傳遞分 析報告。另外,計算機系統550的接觸面可以對報告進行分析從而在顯示器上顯示(未表 現出)和/或存儲于電腦可讀媒介物551中。所述微陣列閱讀器501還可以具有一種電子 微陣列評價儀540,可以操作用來從一系列從微陣列500中發送出來或者接收到的電脈沖 中確定基因表達方式。 微陣列500在繪制或表達經處理的遺傳物質組成的數據方面是相當有效的。微陣 列500包括以下應用。信使核糖核酸或者基因表達曲線檢測的數千基因同時表達的表達 水平與生物學和醫學的許多領域有關,例如,研究治療方法、疾病和發展階段。例如,微陣 列500可用于通過比較患病細胞和正常細胞的基因表達識別疾病基因。比較基因組雜交作 用-這種典型的使用包括評價單一種類中大基因組的重新排列。單一核苷酸多形性(SNP) 檢測-在一種種類的群體基因組中尋找單一核苷酸多形性。染色質免疫沉淀研究-使用芯 片內建芯片(chip-on-chip)技術確定基因組中蛋白結合占位情況。微陣列500其他的應 用也是已知的和/或可以預料到,因此為了簡便起見在此不在論述。 使用可用于分析的微陣列500,并與其他制備的微陣列相結合,開始形成與疾病和 /或特異性基因序列的存在或缺失相關的包含廣泛的數據。微陣列500可以被掃描并選取 強度數據域原始樣品種存在/不存在遺傳物質相結合。這些數據與其他的數據,例如診斷 和治療數據一起被吸收入已知大型信息數據庫中,從而提供關于一系列數據組大量的有關 信息。由于數據被吸收,還可以提供一種綜合性文獻檢索,報道具有基因序列變更的疾病的實際結合。所述數據是隨機匿名的,并且加載到中央存儲器中進行樣品交叉對比并最終,較早的檢測到疾病。 盡管這里討論的實質內容可以進行多種修飾和結構變化,但其某些示例性的實施方案在這里已經進行了如上所述的詳細介紹并在附圖中有所顯示。另外,本領域技術人員應該理解,這里的描述不意味著將要求保護的權利限制到這里公開的具體形式上,相反的,是意味著覆蓋所有修飾,結構變化和落入本發明要求保護的精神和范圍內的所有等價物。
權利要求
一種用于從多種遺傳物質來源中集合基因專利產物數據的方法,該方法包括從多種遺傳物質來源中獲得遺傳物質樣品;對每個樣品,分離每個樣品的部分從而使每個部分顯示一種特異性基因表達,所述特異性基因表達與多種疾病的一種有關,每種分離的部分唯一的對應于一種有關的疾病;將每種部分與它的來源相結合;將每種部分與相應的疾病相結合;并將每種結合存儲在一種數據結構中。
2. 根據權利要求1所述的方法,進一步包括將來源于每個樣品的人口統計數據與樣品 的每個部分相結合。
3. 根據權利要求2所述的方法,進一步包括從數據結構中推導結合的數據,所述結合 的數據包括與樣品一種部分有關的第一疾病和關于該樣品來源的人口統計信息。
4. 根據權利要求1所述的方法,進一步包括將顯示代表第一疾病的特異性基因表達的 第一來源樣品部分與顯示代表第二疾病的特異性基因表達的第以來源的樣品部分相結合。
5. 根據權利要求4所述的方法,包括從數據結構中推導結合的數據,所述結合的數據 包括顯示代表第一疾病的特異性基因表達的第一來源樣品部分和顯示代表第二疾病的特 異性基因表達的第一來源樣品部分。
6. 根據權利要求4所述的方法,進一步包括將顯示分別代表第一和第二疾病的特異性 基因表達的第一來源樣品部分與第二來源的樣品部分相結合,所述第二來源的樣品部分顯 示與第一或第二疾病有關的特異性基因表達。
7. 根據權利要求6所述的方法,進一步包括從數據結構中推導結合的數據,所述結合 的數據包括顯示代表第一疾病的特異性基因表達的第一來源樣品部分;顯示代表第二疾病 的特異性基因表達的第一來源樣品部分;顯示與第一或第二疾病有關的特異性基因表達的 第二來源的樣品部分。
8
9
10. 根據權利要求1所述的方法,進一步包括將顯示代表第一疾病的特異性基因表達 的第一來源樣品部分和與第一疾病有關的治療方法相結合。
11. 根據權利要求io所述的方法,進一步包括從數據結構中推導結合的數據,所述結合的數據包括將顯示代表第一疾病的特異性基因表達的第一來源樣品部分和與第一疾病 有關的治療方法相結合。
12. 根據權利要求1所述的方法,進一步包括將顯示代表第一疾病的特異性基因表達 的第一來源樣品部分和與一種特異性多形性相結合。
13. 根據權利要求12所述的方法,進一步包括從數據結構中推導結合的數據,所述結 合的數據包括將顯示代表第一疾病的特異性基因表達的第一來源樣品部分和與一種特異 性多形性相結合。
14. 一種數據結構,包括固定在有形媒介物上的第一數據組,可以操作用來存儲來自 特異性來源的遺傳物質中分離的基因表達,所述基因表達與第一疾病有關;固定在有形媒 介物上的第二數據組,可以造作用來存儲來源的識別并與第一有形數據組有關;固定在有 形媒介物上的第三數據組,可以操作用來存儲至少一種其他的關于第二疾病的結合,所述 第二疾病與第二基因表達有關。
15. 根據權利要求14所述的數據結構,進一步包括一種固定在有形媒介物上的第四數 據組,可以操作用來存貯與第一疾病有關的特異性試驗的識別方法。
16. 根據權利要求15所述的數據結構,進一步包括一種固定在有形媒介物上的第五數據組,可以操作用來存儲于第一疾病和第一基因表達有關的表達速率。
17. 根據權利要求16所述的數據結構,進一步包括一種固定在有形媒介物上的第六數 據組,可以操作用來存儲于第一疾病和與第一基因表達有關的討論。
18. —種數據結構閱讀裝置,包括一種微陣列站可以操作用來觀察微陣列,所述微陣列 包括大量的存儲孔,適用于儲存遺傳物質樣品;每行適用于與遺傳物質樣品雜交從而識別 一種獨特的基因表達;每欄適用于含有一種樣品,在欄中的每一行含有的每種樣品與單一 的遺傳物質來源有關;一種分析裝置,可以操作用來分析至少一種微陣列的圖形;和一種 記錄裝置,可以操作用來傳遞分析報告。
19. 根據權利要求18所述的數據結構閱讀裝置,進一步包括一種計算機系統接觸面, 從而在顯示器上顯示記錄的分析結果并存儲將其于電腦可讀媒介物中。
20. 根據權利要求18所述的數據結構閱讀裝置,其中所述分析裝置進一步包括一種電 子微陣列評價儀,所述電子微陣列評價儀可以操作用來從一系列從微陣列500中發送出來 或者接收到的電脈沖中確定基因表達方式。
全文摘要
具有廣泛基礎的疾病結合的基因轉錄產物檢測和數據結構。用于研究這種獨特試驗的疾病包括一類常用遺傳序列,在經過同行評議的文獻中這種序列與多種已知疾病有關,例如,愛迪生氏病、貧血、哮喘、動脈粥樣硬化、孤獨癥、乳腺癌、雌激素新陳代謝、巴塞多病(Grave′s disease)、激素代替治療、主要組織相容性復合體(MHC)基因、存活力、狼瘡、多發性硬化、肥胖、關節變性病、前列腺癌、和2型糖尿病。可以從第三方獲得的臨床樣品來發展基礎數據庫。通過分析按規格改制的微陣列試驗服務可以促進對醫生和病人進行實時表型/基因型結合試驗的在線訪問。
文檔編號C12Q1/68GK101743320SQ200780053485
公開日2010年6月16日 申請日期2007年6月1日 優先權日2007年4月24日
發明者D·I·斯波勒斯 申請人:伊維什遺傳診斷公司