確定胎兒目標區域單體型的方法和裝置的制造方法
【技術領域】
[0001] 本發明涉及生物信息領域,特別地,涉及確定胎兒目標區域單體型的方法和裝置。
【背景技術】
[0002] 脊髓性肌萎縮癥(Spinal Muscular Atrophy, SMA)是一組常見的常染色體隱 性遺傳病,居致死性常染色體隱性遺傳病的第二位,活產嬰兒中患者發生率為1/6000~ 1/10000。目前的研究已經表明,SMA的病因主要是SMN基因缺失:其中SMN1為決定基因, 表達完整而穩定的SMN功能蛋白,而SMN2為SMA的修飾基因。據報道,98. 7% (226/229) 兒童型患者存在SMN1基因缺失,其中約90%的SMA病人顯示純合SMN1外顯子7和/或8 缺失。SMA神經肌肉疾病病情嚴重,目前臨床上無有效治療手段。產前診斷是預防該出生缺 陷的重要手段。
[0003] 隨著孕婦外周血漿中胎兒游離DNA存在的發現,為無創產前檢測胎兒基因型提供 了可能。然而目前尚未見到有關通過孕婦血漿游離DNA進行無創胎兒SMA檢測的報道。已 有的SMA檢測報道,多是通過診斷SMN17號外顯子設計QPCR引物及探針,實現對缺失型 SMN1突變的檢測,如徐湘民等人公開的"一種診斷人類脊髓性肌萎縮癥的熒光定量PCR試 劑盒"(公開號CN103614477A)。然而由于母體血漿中胎兒DNA含量相對較低,而QPCR的靈 敏度不足以在高母體背景下實現對胎兒SMN1基因突變情況的檢測。
[0004] 因此,發展一種可以無創檢測胎兒SMN1基因型的檢測方法,將對該疾病的產前診 斷起到十分重要的作用。
【發明內容】
[0005] 依據本發明的一方面,提供一種確定胎兒目標區域單體型的方法,該方法包括以 下步驟:對孕婦體液中游離核酸的所述目標區域進行序列測定,以便獲得第一測序數據; 對所述胎兒的家系成員的所述目標區域進行序列測定,以便獲得第二測序數據、第三測序 數據和第四測序數據,其中,所述第二測序數據為胎兒母親的測序數據,所述第三測序數據 為胎兒父親的測序數據,所述第四測序數據為先證者的測序數據;基于所述第一測序數據、 第二測序數據以及任選的第三測序數據,確定所述孕婦體液中的胎兒核酸含量;基于所述 第二測序數據、第三測序數據和第四測序數據,分別構建所述胎兒母親的目標區域單體型 和所述胎兒父親的目標區域單體型;以及,基于所述胎兒母親的目標區域單體型、所述胎兒 父親的目標區域單體型以及所述胎兒核酸含量,確定所述胎兒的目標區域單體型。其中,第 一、第二、第三和第四測序數據的獲得沒有必需遵循的先后關系,可同時獲得,也可一個個 獲得或幾個幾個一起獲得;胎兒核酸含量的確定步驟和父母單體型的構建步驟也沒有先后 關系。
[0006] 依據本發明的另一方面,提供一種確定胎兒目標區域單體型的裝置,該裝置能夠 執行本發明一方面提供的方法的部分或全部步驟,該裝置包括:測序單元,用于對孕婦體液 中游離核酸的所述目標區域進行序列測定,以便獲得第一測序數據,以及,對所述胎兒的家 系成員的所述目標區域進行序列測定,以便獲得第二測序數據、第三測序數據和第四測序 數據,其中,所述第二測序數據為胎兒母親的測序數據,所述第三測序數據為胎兒父親的測 序數據,所述第四測序數據為先證者的測序數據;胎兒核酸含量確定單元,與所述測序單元 連接,用于基于所述第一測序數據、第二測序數據以及任選的第三測序數據,確定所述孕婦 體液中的胎兒核酸含量;父母單體型確定單元,與所述測序單元連接,用于基于所述第二測 序數據、第三測序數據和第四測序數據,分別構建所述胎兒母親的目標區域單體型和所述 胎兒父親的目標區域單體型;以及胎兒單體型確定單元,與所述胎兒核酸含量確定單元和 所述父母單體型確定單元相連,用于基于所述胎兒母親的目標區域單體型、所述胎兒父親 的目標區域單體型以及所述胎兒核酸含量,確定所述胎兒的目標區域單體型。
[0007] 本發明的一方面的方法和/或裝置,提供了一種基于目標區域捕獲及家系目標區 域單體型連鎖分析的方法,通過連鎖分析從孕婦體液樣本比如孕婦外周血漿DNA測序數據 中推斷胎兒目標區域基因型,可用于判斷或輔助判斷胎兒是否患有目標區域變異相關疾病 或異常。本發明的方法或裝置通過利用連鎖單體型信息極大的降低了假陽性及假陰性的發 生。該方法和/或裝置的應用可以極大的避免由于單個位點測量比例不準,單個位點測序 錯誤等方面帶來的假陰性和假陽性結果,使得檢測結果更加準確可靠。通過該方法在SMN1 患病高風險家庭的應用,可以有效檢出患病兒,并減少不必要的羊水穿刺等有創取樣手術。
【附圖說明】
[0008] 本發明的上述和/或附加的方面和優點從結合下面附圖對實施方式的描述中將 變得明顯和容易理解,其中 :
[0009] 圖1是本發明的一個【具體實施方式】中的確定胎兒目標區域單體型的裝置的示意 圖;
[0010] 圖2是本發明的一個【具體實施方式】中的胎兒基因型判斷的整體技術線路示意圖;
[0011] 圖3是本發明的一個【具體實施方式】中的胎兒基因型判斷結果,圖3A為胎兒從父親 處所遺傳到的單體型的判斷結果圖,圖3B為胎兒從母親處所遺傳的單體型的判斷結果圖; 圖中,點表示一個snp位點遺傳自HapO的概率與遺傳自Hapl的概率的差值,圈線為組合判 斷結果。
【具體實施方式】
[0012] 依據本發明的一種實施方式,提供一種確定胎兒目標區域單體型的方法,包括以 下步驟:
[0013] 步驟一:獲得第一、第二、第三和第四測序數據。
[0014] 獲得孕婦體液中的游離核酸,捕獲目標區域,對所述捕獲得的目標區域進行序列 測定,獲得第一測序數據。孕婦體液樣本為包含胎兒核酸的樣本,比如孕婦外周血血漿包 含胎兒核酸,提取的外周血游離核酸是孕婦和胎兒核酸的混合物,混合物是高度片段化的。 依據現有測序平臺,通過對從孕婦外周血樣本提取的游離核酸進行測序文庫構建,利用探 針或芯片或液相探針捕獲獲得目標區域測序文庫,對目標區域測序文庫進行上機測序,獲 得第一測序數據,第一測序數據是孕婦核酸和胎兒核酸混合物的混合數據。測序平臺包括 但不限于 CG(Complete Genomics)、Illumina/Solexa、Life Technologies ABI SOLiD 和 Roche 454,可根據所選用的測序平臺進行相應的測序文庫制備,可選擇單端或雙端測序, 由此獲得的各個測序數據由多個短序列組成,將各個短序列稱為讀段。捕獲所用的芯片是 由固相基質和固定在其上的多個探針組成的,探針能夠特性識別目標區域,目標區域可以 是待測樣本基因組DNA的一部分也可以是整個基因組,在本發明的一個【具體實施方式】中, 目標捕獲區域包括SMN1基因外顯子區,表1顯示各個外顯子區域在參考基因組HG19上的 位置,目標區域還包括SMN1基因內部及其上下游3M區域內高雜合率的SNP位點,表2為這 些SNP在各個區域的數量分布,這些SNP的次等位基因頻率(MAF)在0. 3-0. 5之間。這些 區域以及位點信息有利于判斷分析胎兒單體型,目標基因上下游的3M區域的捕獲使得重 組概率減少到萬分之一以下,使得后續能夠準確的進行單體型構建或確定,而且上述高雜 合率的SNP位點的捕獲,使得容易獲得來源于胎兒自身的特定位點或序列,利用來自胎兒 本身的位點或序列能夠估算在混合DNA中胎兒的核酸含量。設計能夠特異性識別上述區域 的探針時,為保證捕獲的特性性、檢測的準確性,使包含至少一個上述SNP位點的探針在參 考基因組上是唯一比對的,這樣能增強探針捕獲目標位點的特異性。在探針設計時,使每 條探針的GC含量為40-50%,這樣有利于在同一個體系中整組探針一起特異性結合目標區 域、在同一個反應體系中能夠一起洗脫下來。
[0015] 表1 SMN1基因區域捕獲范圍
[0016]
[0017]
[0018] 表2 SMN1區單體型分析所用SNP位點分別情況
[0019]
[0020] 獲取胎兒家系成員的樣本,包括胎兒生物學母親(孕婦)、胎兒生物學父親以及先 證者的核酸樣本,提取各個家系成員樣本中的核酸,參考上述獲取第一測序數據的方式,捕 獲胎兒家系成員核酸中的同樣目標區域,對各個家系成員的同樣目標區域進行序列測定, 獲得家系成員測序數據,所述家系成員測序數據包括第二、第三和第四測序數據,分別對應 胎兒生物學母親、胎兒生物學父親和先證者的同樣目標區域的測序數據。其中第二測序數 據,即母親測序數據的獲得,可以通過分離上述獲得第一測序數據的孕婦外周血樣本,分離 孕婦外周血樣本獲得孕婦外周血血漿樣本和孕婦血細胞,從孕婦血細胞,比如白細胞,可以 獲得母親基因組核酸,進而獲得第二測序數據。先證者該家系中是確定帶有目標區域相關 變異的的成員,在這里,先證者是與待測胎兒同樣生物學父母的胎兒的兄弟姐妹,包括出生 的和未出生,包括體外培養的胚胎或受精卵,包括在世和不在世的。另外,在其他具體實施 方式中,先證者也可以是待測胎兒的父母的兄弟姐妹,比如胎兒的舅舅、叔叔、姑姑等,這 時,胎兒的家系成員的測序數據還應包括胎兒的祖父母和/或外祖父母,這樣能夠利用父 母的兄弟姐妹的測序數據以及父母的測序數據構建祖父母或外祖父母的目標區域單體型, 進而判斷父母的遺傳到的目標區域單體型。第一、第二、第三和第四測序數據的獲得沒有必 需遵循的先后關系,可同時獲得,比如利用標簽標記多個樣本,對多個樣本核酸混合建庫混 合上機測序同時獲得多個樣本的測序數據,也可一個個獲得或幾個幾個獲得核酸樣本的測 序數據。
當前第1頁
1 
2 
3 
4