位點(diǎn)發(fā)生的基因、坐標(biāo)、氨基酸改變等;
[0099] 確定SMN1捕獲區(qū)域內(nèi)各SNP的基因型。
[0100] 5.結(jié)果分析
[0101] 1)數(shù)據(jù)產(chǎn)出情況
[0102] 如表3所示,所測樣品在目標(biāo)區(qū)域平均測序深度均在100X以上,血漿測序深度達(dá) 到 27lx。
[0103] 表3數(shù)據(jù)產(chǎn)出情況表
[0104]
[0106] 2) SNP phasing 情況
[0107] 我們使用父親、母親及先證者在SMN1基因上下游1M以內(nèi)的SNP位點(diǎn)進(jìn)行先證者 單體型構(gòu)建。表4統(tǒng)計(jì)了該區(qū)域成功判斷所屬單體型的SNP的數(shù)目(phased SNP)。這些 phased SNP后續(xù)用于父親遺傳單體型判斷(SNP used for Pat-Hap)及用于母親遺傳單體 型判斷(SNP used for Mat-Hap)
[0108] 表4 SMN1基因相關(guān)區(qū)域phase SNP情況統(tǒng)計(jì)
[0109]
[0110] 3)血漿中胎兒DNA含量分析
[0111] 選擇父親為雜合而母親為純合的點(diǎn),對血漿中胎兒DNA含量進(jìn)行估計(jì):假設(shè)母親 基因型為AA,胎兒基因型為AT,若測得為A的reads數(shù)為a,為C的reads數(shù)為b,則血漿中 胎兒DNA含量c = 2V(a+b)。結(jié)果顯示該血漿樣品中胎兒DNA含量為0. 0930。
[0112] 4)胎兒基因型判斷
[0113] 對SMA 1家系中孕婦外周血漿數(shù)據(jù)進(jìn)行分析,利用HMM算法推測本次懷孕胎兒 SMN1基因情況,具體地,將胎兒的單體型HapO和Hapl作為隱含狀態(tài)(hidden states),將 成功判斷所屬單體型的SNP作為觀測序列(observations),根據(jù)snp位點(diǎn)的位置和遺傳圖 譜計(jì)算的相鄰snp間的重組概率推算出狀態(tài)轉(zhuǎn)移概率(transition probabilities),根 據(jù)reads支持?jǐn)?shù)計(jì)算每個(gè)snp位點(diǎn)支持HapO、Hapl的相對概率(Emission_probability), 然后通過惠特比算法(Viterbi algorithm)可以推斷出SNP總體支持的單體型排列,獲得 最可能的胎兒單體型組合。可參考Chen Sl,Ge H2, Wang X,et al.Haplotype-assisted accurate non-invasive fetal whole genome recovery through maternal plasma sequencing. Genome Med. 2〇l3, 5 (2) : l8 進(jìn)打。
[0114] 為了避免重復(fù)序列區(qū)域?qū)Ψ治鼋Y(jié)果的影響,僅使用unique序列區(qū)域進(jìn)行分析。結(jié) 果如圖3所示,圖上的每個(gè)點(diǎn)表示一個(gè)snp位點(diǎn)遺傳自父/母HapO的概率與遺傳自父/母 Hapl的概率的差值,每個(gè)小圈是一個(gè)組合判斷結(jié)果,小圈形成的線在中間基線上游表示最 終判斷遺傳自HapO,小圈形成的線在中間基線下面表示最終判斷遺傳自Hap 1。從圖3可看 出,Pat-Hap 0及Mat-Hap 0分別父母雙方帶有致病突變的單體型,Pat-Hap 1及Mat-Hap 1分別父母雙方不攜帶致病突變的單體型。推斷結(jié)果顯示胎兒從其父母處獲得了 Pat-Hapl 及Mat-Hapl,即不攜帶SMN1致病突變的染色體。表明胎兒不存在SMN1缺失。
【主權(quán)項(xiàng)】
1. 一種確定胎兒目標(biāo)區(qū)域單體型的方法,其特征在于,包括, 對孕婦體液中游離核酸的所述目標(biāo)區(qū)域進(jìn)行序列測定,以便獲得第一測序數(shù)據(jù); 對所述胎兒的家系成員的所述目標(biāo)區(qū)域進(jìn)行序列測定,以便獲得第二測序數(shù)據(jù)、第三 測序數(shù)據(jù)和第四測序數(shù)據(jù),其中,所述第二測序數(shù)據(jù)為胎兒母親的測序數(shù)據(jù),所述第三測序 數(shù)據(jù)為胎兒父親的測序數(shù)據(jù),所述第四測序數(shù)據(jù)為先證者的測序數(shù)據(jù); 基于所述第一測序數(shù)據(jù)、第二測序數(shù)據(jù)以及任選的第三測序數(shù)據(jù),確定所述孕婦體液 中的胎兒核酸含量; 基于所述第二測序數(shù)據(jù)、第三測序數(shù)據(jù)和第四測序數(shù)據(jù),分別構(gòu)建所述胎兒母親的目 標(biāo)區(qū)域單體型和所述胎兒父親的目標(biāo)區(qū)域單體型;以及 基于所述胎兒母親的目標(biāo)區(qū)域單體型、所述胎兒父親的目標(biāo)區(qū)域單體型以及所述胎兒 核酸含量,確定所述胎兒的目標(biāo)區(qū)域單體型。2. 權(quán)利要求1的方法,其特征在于,所述目標(biāo)區(qū)域包括SMN1基因的外顯子區(qū)。3. 權(quán)利要求2的方法,其特征在于,所述目標(biāo)區(qū)域還包括SMN1基因內(nèi)部及SMN1基因上 下游各3M區(qū)域中的次等位堿基頻率為0. 3-0. 5的SNP位點(diǎn)。4. 權(quán)利要求1-3任一方法,其特征在于,對孕婦體液中游離核酸的所述目標(biāo)區(qū)域進(jìn)行 序列測包括: 利用探針對所述游離核酸進(jìn)行捕獲,所述探針特異性識別所述目標(biāo)區(qū)域, 任選地,所述探針是以芯片形式提供的。5. 權(quán)利要求4的方法,其特征在于,所述探針包括SNP位點(diǎn)探針,所述SNP位點(diǎn)探針在 參考基因組上是唯一比對的。6. 權(quán)利要求4的方法,其特征在于,所述探針的GC含量為40-50%。7. 權(quán)利要求1的方法,其特征在于,所述胎兒核酸含量是通過下列步驟確定的: 確定所述第一測序數(shù)據(jù)和所述第二測序數(shù)據(jù)中預(yù)定位點(diǎn)的基因型組合,所述預(yù)定位點(diǎn) 在所述第一測序數(shù)據(jù)中存在兩種基因型,并且所述預(yù)定位點(diǎn)在所述第二測序數(shù)據(jù)中只存在 一種基因型,其中,所述基因型組合選自下列組合之一: (i) 在所述第二測序數(shù)據(jù)中只存在純合基因型RR,在所述第一測序數(shù)據(jù)中存在純合基 因型RR和雜合基因型Rr,其中,R和r表示一對等位基因, (ii) 在所述第二測序數(shù)據(jù)中只存在雜合基因型Rr,在所述第一測序數(shù)據(jù)中有純合基 因型RR和雜合基因型Rr ; 基于所述第一測序數(shù)據(jù)中支持所述等位基因 R和r的讀段數(shù)目,確定所述胎兒核酸含 量, 其中, 如果所述基因型組合為(i),根據(jù)公式f = 2cV(C+d)確定所述胎兒核酸含量, 如果所述基因型組合為(ii),根據(jù)公式f= (c-dV(c+d)確定所述胎兒核酸含量, 其中, c為所述第一測序數(shù)據(jù)中支持等位基因 R的讀段數(shù)目, d為所述第一測序數(shù)據(jù)中支持等位基因 r的讀段數(shù)目, f為所述胎兒核酸含量。8. 權(quán)利要求1的方法,其特征在于,所述胎兒核酸含量是通過下列步驟確定的: 確定在所述第二測序數(shù)據(jù)和所述第三測序數(shù)據(jù)中均為不同純合基因型的位點(diǎn),其中, RR和rr表示不同的純合基因型,R和r為一對等位基因, 基于公式f = gAg+h)確定所述胎兒核酸含量, 其中, g為所述第一測序數(shù)據(jù)中支持等位基因 r的讀段數(shù)目,h為所述第一測序數(shù)據(jù)中支持等 位基因 R的讀段數(shù)目。9. 權(quán)利要求1的方法,其特征在于,所述確定胎兒目標(biāo)區(qū)域單體型,包括, 利用多個(gè)在父親目標(biāo)區(qū)域單體型上為雜合、在母親目標(biāo)區(qū)域單體型上為純合的位點(diǎn)確 定胎兒遺傳到的父親目標(biāo)區(qū)域單體型,利用多個(gè)在父親目標(biāo)區(qū)域單體型上為純合、在母親 目標(biāo)區(qū)域單體型上為雜合的位點(diǎn)以及胎兒核酸含量確定胎兒遺傳到的母親目標(biāo)區(qū)域單體 型。10. 權(quán)利要求9的方法,其特征在于,對于所述多個(gè)在父親目標(biāo)區(qū)域單體型上為純 合、在母親目標(biāo)區(qū)域單體型上為雜合的位點(diǎn),若有多個(gè)這樣的位點(diǎn)符合R/r = (1+x% )/ (1-x% ),則判定胎兒遺傳了母親等位基因 R所在的目標(biāo)區(qū)域單體型,若有多個(gè)這樣的位點(diǎn) 符合R/r = 1,則判定胎兒遺傳了母親等位基因 r所在的目標(biāo)區(qū)域單體型,R和r表示一對 等位基因,X%表示胎兒核酸含量,R/r =第一測序數(shù)據(jù)中支持R的讀段數(shù)目/第一測序數(shù) 據(jù)中支持r的讀段數(shù)目。11. 確定胎兒目標(biāo)區(qū)域單體型的裝置,包括, 測序單元,用于對孕婦體液中游離核酸的所述目標(biāo)區(qū)域進(jìn)行序列測定,以便獲得第一 測序數(shù)據(jù),以及,對所述胎兒的家系成員的所述目標(biāo)區(qū)域進(jìn)行序列測定,以便獲得第二測序 數(shù)據(jù)、第三測序數(shù)據(jù)和第四測序數(shù)據(jù),其中,所述第二測序數(shù)據(jù)為胎兒母親的測序數(shù)據(jù),所 述第三測序數(shù)據(jù)為胎兒父親的測序數(shù)據(jù),所述第四測序數(shù)據(jù)為先證者的測序數(shù)據(jù); 胎兒核酸含量確定單元,與所述測序單元連接,用于基于所述第一測序數(shù)據(jù)、第二測序 數(shù)據(jù)以及任選的第三測序數(shù)據(jù),確定所述孕婦體液中的胎兒核酸含量; 父母單體型確定單元,與所述測序單元連接,用于基于所述第二測序數(shù)據(jù)、第三測序數(shù) 據(jù)和第四測序數(shù)據(jù),分別構(gòu)建所述胎兒母親的目標(biāo)區(qū)域單體型和所述胎兒父親的目標(biāo)區(qū)域 單體型;以及 胎兒單體型確定單元,與所述胎兒核酸含量確定單元和所述父母單體型確定單元相 連,用于基于所述胎兒母親的目標(biāo)區(qū)域單體型、所述胎兒父親的目標(biāo)區(qū)域單體型以及所述 胎兒核酸含量,確定所述胎兒的目標(biāo)區(qū)域單體型。
【專利摘要】本發(fā)明提供了一種確定胎兒目標(biāo)區(qū)域單體型的方法及其裝置。確定胎兒目標(biāo)區(qū)域單體型的方法包括:對孕婦體液中游離核酸的目標(biāo)區(qū)域進(jìn)行序列測定,以便獲得第一測序數(shù)據(jù);對胎兒家系成員的相同目標(biāo)區(qū)域進(jìn)行序列測定,以便獲得第二測序數(shù)據(jù)、第三測序數(shù)據(jù)和第四測序數(shù)據(jù),其中,第二測序數(shù)據(jù)為胎兒母親的測序數(shù)據(jù),第三測序數(shù)據(jù)為胎兒父親的測序數(shù)據(jù),第四測序數(shù)據(jù)為先證者的測序數(shù)據(jù);基于第一、第二以及任選的第三測序數(shù)據(jù),確定述孕婦體液中的胎兒核酸含量;基于第二、第三和第四測序數(shù)據(jù),分別構(gòu)建胎兒母親的目標(biāo)區(qū)域單體型和胎兒父親的目標(biāo)區(qū)域單體型;以及基于胎兒母親、父親的目標(biāo)區(qū)域單體型以及胎兒核酸含量,確定胎兒的目標(biāo)區(qū)域單體型。
【IPC分類】C12M1/34, C12Q1/68
【公開號】CN105648045
【申請?zhí)枴?br>【發(fā)明人】袁媛, 王垚燊, 朱紅梅, 易鑫
【申請人】天津華大基因科技有限公司, 深圳華大基因科技有限公司
【公開日】2016年6月8日
【申請日】2014年11月13日