本發明涉及基因編輯,特別涉及倒位目標dna序列的dna先導編輯系統、重組載體、試劑盒和方法。
背景技術:
1、基于crispr的基因組編輯工具徹底改變了我們以前所未有的精度操縱基因組序列的能力。crispr-cas核酸酶誘導位點特異性雙鏈斷裂(dsb),通過非同源末端連接(nhej)或同源定向修復(hdr)等修復機制,實現靶向基因組修飾。這些途徑促進小插入/缺失(indel)或使用供體模板進行精確修飾。
2、近年來,催化受損的cas核酸酶已被設計成與脫氨酶協同形成堿基編輯器(be),或與逆轉錄酶(rt)協同開發先導編輯器(pe)。堿基編輯器允許在特定基因組位點進行有效的堿基替換,而無需依賴hdr或供體dna。另一方面,先導編輯器使用先導編輯向導rna(pegrna)通過pegrna內編碼的rt模板來指導精確的序列修飾。通過將pe與整合酶相結合,精確dna修飾的范圍可以從幾個堿基對(bp)擴展到約40?kb,這個范圍涵蓋了單個基因的平均長度。
3、很大一部分致病突變源于基因組的結構變異。雖然這些變異可以通過使用cas9核酸酶與一對向導rna?(grna)組合來誘導,但主要的編輯結果通常是小的插入/缺失,結構變異是相對較小的副產物。盡管在單個基因位點的精確編輯取得了成功,但開發能夠精確高效地設計哺乳動物細胞大規模基因組結構變異的工具仍然是一個關鍵的未滿足需求。
4、與缺失和復制不同,倒位通常不會改變基因組拷貝數,但會極大地影響基因表達和基因組完整性。這些重排對于理解人類進化至關重要,并與各種遺傳疾病有關,例如血友病a、粘多糖貯積癥ii型(亨特綜合征)和埃默里-德雷福斯肌營養不良癥,這些疾病通常由反向同源序列之間的倒位引起。此外,倒位可導致致癌融合基因的形成,例如與肺癌相關的alk-eml4融合,強調其對基因功能的潛在影響。盡管它們與遺傳疾病和各種癌癥有關,但仍然缺乏有效且方便的遺傳工具來模擬細胞和動物中的染色體倒位。雖然cas9核酸酶與grna對結合可以誘導倒位,但這些事件并不常見,并且通常被插入/缺失所掩蓋。最近的方法,例如將pe與整合酶結合,并使用兩對pegrna安裝重組位點,已證明能夠倒位40?kb片段。然而,這些方法對于哺乳動物細胞中的倒位仍然效率低下,并且需要耗時的連續轉染來在倒位之前安裝重組位點。鑒于倒位在基因組結構和疾病中的關鍵作用,迫切需要一種更有效且可編程的工具來操縱和研究這些結構變異。
技術實現思路
1、針對以上現有技術的不足,本發明提供了一種倒位目標dna序列的dna先導編輯系統、重組載體、試劑盒和方法,利用先導編輯向導rna(pegrna),能夠更精準,更高效地實現目標dna序列的倒位編輯。具體通過以下技術實現。
2、本發明的第一方面,提供了第一種用于倒位目標dna序列的dna先導編輯系統,所述dna先導編輯系統包括cas蛋白和逆轉錄酶、pegrna-a和pegrna-b;
3、所述pegrna-a包括第一向導rna、第一引物結合位點和第一逆轉錄模板,所述pegrna-b包括第二向導rna、第二引物結合位點和第二逆轉錄模板;
4、所述第一逆轉錄模板包括第一配對片段,所述第二逆轉錄模板包括第二配對片段;所述第一配對片段與第二配對片段的序列互補;
5、所述pegrna-a和所述pegrna-b分別引導所述cas蛋白切割所述目的片段位于雙鏈dna的同一條鏈的兩側的酶切位點。
6、進一步地,所述第一逆轉錄模板、第二逆轉錄模板的序列長度為0至2,000個核苷酸;優選為15至500個核苷酸。
7、進一步地,所述第一配對片段、第二配對片段的序列長度為0至1,000個核苷酸;優選為3至200個核苷酸;更優選為30至100個核苷酸。
8、進一步地,所述第一逆轉錄模板還包含1個第一非互補模板序列,所述第二逆轉錄模板還包含1個第二非互補模板序列;所述第一非互補模板序列與第二非互補模板序列彼此不互補。
9、更進一步地,所述第一非互補模板序列、第二非互補模板序列的長度為1至2,000個核苷酸;優選為1至1,000個核苷酸;更優選為1至500個核苷酸。
10、進一步地,位于所述雙鏈dna的同一條鏈的兩側的所述酶切位點之間相距500至100,000,000個堿基對;優選為相距10,000至30,000,000個堿基對。
11、進一步地,所述pegrna-a和/或pegrna-b還包括尾部序列;所述尾部序列與自身形成發夾或環,或者所述尾部序列包括一個poly(a)、poly(u)或poly(c)序列,或者所述尾部序列包括一個rna結合域。
12、本發明提供的上述dna先導編輯系統,將cas蛋白、逆轉錄酶rt和兩個pegrna(a和b)在雙鏈dna的同一條鏈上引入兩條互補的3’?flap?(prime?editing-based?inversionwith?enhanced?performance?version?1,?piev1)。當這兩個互補的單鏈dna序列結合在一起時,在dna的修復作用下發生倒位(圖1)。這種方法在本發明中稱為piev1方法/設計。
13、本發明的第二方面,提供了第二種用于倒位目標dna序列的dna先導編輯系統,其特征在于,所述dna先導編輯系統包括cas蛋白和逆轉錄酶、pegrna-a、pegrna-b、pegrna-c、pegrna-d;
14、所述pegrna-a包括第一向導rna和第一逆轉錄模板,所述pegrna-b包括第二向導rna和第二逆轉錄模板;所述pegrna-c包括第三向導rna、第三引物結合位點和第三逆轉錄模板;所述pegrna-d包括第四向導rna、第四引物結合位點和第四逆轉錄模板;
15、所述第一逆轉錄模板包括第一配對片段,所述第二逆轉錄模板包括第二配對片段,所述第三逆轉錄模板包括第三配對片段,所述第四逆轉錄模板包括第四配對片段;所述第一配對片段與第二配對片段的序列互補,所述第三配對片段與第四配對片段的序列互補;
16、所述pegrna-a和所述pegrna-b分別引導所述cas蛋白切割所述目的片段位于雙鏈dna的其中一條鏈的兩側的酶切位點;所述pegrna-c和所述pegrna-d分別引導所述cas蛋白切割所述目的片段位于雙鏈dna的另一條鏈的兩側的酶切位點;
17、所述pegrna-a引導所述cas蛋白切割的酶切位點的原間隔序列鄰近基序與所述pegrna-c引導所述cas蛋白切割的酶切位點的原間隔序列鄰近基序,相對于spacer序列靠近(pam-in形式)或者遠離(pam-out形式)設置。
18、本發明中,pam-out形式如圖7所示。圖7中,pegrna-a對應的cas蛋白的酶切位點的原間隔序列鄰近基序(pam)位于spacer序列(protospacera)的右邊;pegrna-c對應的cas蛋白的酶切位點的原間隔序列鄰近基序(pam)位于spacer序列(protospacerb)的左邊,并且pegrna-a和pegrna-c的兩個pam相對于兩個spacer序列而言,為相互遠離設置。同理,pegrna-b和pegrna-d的兩個pam相對于兩個spacer序列而言,也為相互遠離設置。
19、本發明中,pam-in形式如圖9所示。圖9中,pegrna-a對應的cas蛋白的酶切位點的原間隔序列鄰近基序(pam)位于spacer序列(protospacera)的右邊;pegrna-c對應的cas蛋白的酶切位點的原間隔序列鄰近基序(pam)位于spacer序列(protospacerb)的左邊,并且pegrna-a和pegrna-c的兩個pam相對于兩個spacer序列而言,為相互靠近設置。同理,pegrna-b和pegrna-d的兩個pam相對于兩個spacer序列而言,也為相互靠近設置。
20、進一步地a和c之間的序列長度為2至10,000;優選為500至2,000個核苷酸。
21、進一步地b和d之間的序列長度為2至10,000;優選為500至2,000個核苷酸。
22、進一步地,位于所述雙鏈dna的同一條鏈的兩側的所述酶切位點之間相距500至100,000,000個堿基對;
23、更進一步地,為相距10,000至30,000,000個堿基對。
24、為了開發精準的倒位編輯工具,我們嘗試在雙鏈dna的另外一條鏈上另外引入第二對互補的3’單鏈dna,來確保另外一端接口的精準性。對于相鄰/臨近的兩個pegrna(圖7和8中的pegrna-a和pegrna-c,和pegrna-b和pegrna-d),存在pam-out和pam-in兩種形式。此處的“相鄰/臨近”是指位于兩條dna鏈上且相互鄰近的兩個pegrna。例如,把pegrna-a和pegrna-c被定義為兩個“相鄰/臨近”的一組pegrna,pegrna-b和pegrna-d被定義為兩個“相鄰/臨近”的一組pegrna”。因此,針對pam-out和pam-in兩種形式,本發明提供的上述第二種dna先導編輯系統實際上分為兩套更具體的dna先導編輯系統,在本發明中分別命名為piev2方法/設計和piev3方法/設計。
25、對于pam-out形式的情況,piev2方法/設計靶向基因組雙鏈dna上的四個位點,通過逆轉錄酶rt合成了兩對互補的3’單鏈dna。當這兩對互補的3’單鏈dna分別結合在一起時,在dna?修復作用下發生倒位。倒位編輯完成后,四個原始靶點仍然存在。
26、對于pam-in形式的情況,piev3方法/設計同樣靶向基因組雙鏈dna上的四個位點,通過rt合成了兩對互補的3’單鏈dna。當這兩對互補的3’單鏈dna分別結合在一起時,在dna修復作用下發生倒位,同時刪除同側兩端的兩個nick之間的序列,防止二次編輯的發生。
27、相比較piev1方法/設計而言,piev2方法/設計和piev3方法/設計,能夠更精準地實現倒位編輯。
28、本發明的第三方面,還提供了一種用于倒位目標dna序列的dna先導編輯系統,所述dna先導編輯系統包括cas蛋白和逆轉錄酶、pegrna-e和pegrna-f;
29、所述pegrna-e包括第五向導rna、第五引物結合位點和第五逆轉錄模板,所述pegrna-f包括第六向導rna、第六引物結合位點和第五逆轉錄模板;所述第五向導rna和第六向導rna分別靶向目的片段;
30、所述第五逆轉錄模板包括第五配對片段,所述第六逆轉錄模板包括第六配對片段;所述第五配對片段與第六向導rna引導所述cas蛋白切割的酶切位點的原間隔序列鄰近基序靠近3’端一側且緊挨的基因片段序列互補,所述第六配對片段與第五向導rna引導所述cas蛋白切割的酶切位點的原間隔序列鄰近基序靠近3’端一側且緊挨的基因片段序列互補;
31、所述pegrna-e和所述pegrna-f分別引導所述cas蛋白切割所述目的片段位于雙鏈dna的兩條相反鏈上兩側的酶切位點;所述pegrna-e引導所述cas蛋白切割的酶切位點的原間隔序列鄰近基序與所述pegrna-f引導所述cas蛋白切割的酶切位點的原間隔序列鄰近基序,相對于相應的spacer序列遠離設置。
32、進一步地,位于所述雙鏈dna的兩條相反鏈上兩側的所述酶切位點之間相距500至50,000,000個堿基對;優選為相距1,000至500,000個堿基對。
33、可以知曉的是,本發明提供的上述若干種dna先導編輯系統中,第一向導rna、第二向導rna、第三向導rna、第四向導rna、第五向導rna和第六向導rna的作用分別是靶向各自對應的目的片段。“第一”、“第二”、“第三”、“第四”、“第五”和“第六”僅僅以示區分,不產生任何特殊技術限定作用。針對不同的crispr/cas基因編輯系統,向導rna可以是具體的sgrna或crrna。
34、例如,在crispr/cas9基因編輯系統中,向導rna為sgrna;在crispr/cas12或crispr/cas13基因編輯系統中,向導rna為crrna。
35、本發明的第四方面,提供了一種物質,為以下任意一種:
36、(1)一種核酸組合物,所述組合物包括本發明上述提供的任意一項dna先導編輯系統的編碼基因;
37、(2)一種重組載體,所述載體包括本發明上述提供的任意一項dna先導編輯系統的編碼基因;
38、(3)一種重組微生物,所述重組微生物本發明上述提供的任意一項dna先導編輯系統的編碼基因;
39、(4)一種試劑盒,所述試劑盒包括本發明上述提供的任意一項dna先導編輯系統,或者包括所述重組載體。
40、進一步地,當所述重組載體包括本發明第二方面提供的dna先導編輯系統的編碼基因時,所述pegrna-a和pegrna-d重組在同一個重組載體上,所述pegrna-b和pegrna-c重組在同一個重組載體上。
41、在采用piev1方法/設計、piev2方法/設計或piev3方法/設計實際應用時,一般將pegrna分別克隆在不同的載體上。當采用這種載體構建方式時,在轉染細胞后可能存在質粒分布不均一的現象。尤其在采用piev3方法/設計時,上述現象可能會導致出現piev1編輯結果,產生非精準倒位。
42、為了減少上述問題的出現,對于piev3方法/設計,本發明將遠端且靶向不同dna鏈的兩個pegrna(pegrna-a和pegrna-d)克隆在同一個載體上,將另兩個pegrna(pegrna-b和pegrna-c)克隆在同一個載體上。這兩種載體當只有一種載體存在于細胞內時不會發生任何編輯,只有兩種載體同時位于細胞內才會發生piev3的編輯。
43、本發明的第五方面,提供了一種上述任意一項的dna先導編輯系統在倒位目標dna序列中的應用。
44、本發明的第六方面,提供了一種倒位目標dna序列的方法,包括以下步驟:
45、在反應體系中加入所述目標dna序列和本發明上述第一方面中提供的任意一項dna先導編輯系統,所述逆轉錄酶以所述第一逆轉錄模板和第二逆轉錄模板,分別逆轉錄生成2個單鏈dna序列,2個所述單鏈dna序列互補結合形成雙鏈區域;基于dna修復作用機制倒位所述目標dna序列,在靠近所述第一配對片段的接口處插入第一配對片段的互補dna序列;
46、或者,包括以下步驟:
47、在反應體系中加入所述目標dna序列和本發明提供的上述第二方面所述的dna先導編輯系統;所述逆轉錄酶以所述第一逆轉錄模板、第二逆轉錄模板、所述第三逆轉錄模板和第四逆轉錄模板,分別逆轉錄生成4個單鏈dna序列,4個單鏈dna序列互補結合形成2個雙鏈區域;
48、當pegrna-a和pegrna-c的兩個pam(cas蛋白切割的酶切位點的原間隔序列鄰近基序)相對于兩個spacer序列而言,為相互遠離的形式(pegrna-b和pegrna-d同理),即pam-out形式時,基于dna修復作用機制倒位所述目標dna序列,在靠近所述第一配對片段的接口處插入所述第一配對片段的互補dna序列并原位增加a和c之間的序列拷貝;在靠近所述第三配對片段的接口處插入所述第三配對片段的互補dna序列并原位增加b和d之間的序列拷貝;
49、當pegrna-a和pegrna-c的兩個pam(cas蛋白切割的酶切位點的原間隔序列鄰近基序)相對于兩個spacer序列而言,為相互靠近的形式(pegrna-b和pegrna-d同理),為pam-in形式時,基于dna修復作用機制倒位所述目標dna序列,在靠近所述第一配對片段的接口處刪除a和c之間的序列拷貝并插入所述第一配對片段的互補dna序列;在靠近所述第三配對片段的接口處刪除b和d之間的序列拷貝并插入所述第三配對片段的互補dna序列;
50、或者,包括以下步驟:
51、在反應體系中加入所述目標dna序列和上述第三方面提供的所述的dna先導編輯系統;所述逆轉錄酶以所述第五逆轉錄模板和第六逆轉錄模板,分別逆轉錄生成2個單鏈dna序列,2個所述單鏈dna序列分別與對應的互補基因組區域結合形成雙鏈區域;基于dna修復作用機制倒位所述目標dna序列。
52、進一步地,上述倒位目標dna序列的方法中,所述cas蛋白為含有失活hnh結構域的cas9蛋白,或者為含有失活ruvc結構域的cas9蛋白。
53、更進一步地,上述倒位目標dna序列的方法中,所述cas蛋白為spcas9、fncas9、st1cas9、st3cas9、nmcas9、sacas9、vqr?spcas9、eqr?spcas9、vrer?spcas9、spcas9-ng、xspcas9、rha?fncas9、kkh?sacas9、nmecas9、stcas9、cjcas9或atcas9。
54、進一步地,上述倒位目標dna序列的方法中,所述cas蛋白為cas12蛋白。
55、更進一步地,上述倒位目標dna序列的方法中,所述cas12蛋白為cas12a、cas12b、cas12f或cas12i。
56、具體可選地,上述倒位目標dna序列的方法中,所述cas12蛋白為ascpf1、lbcpf1、fncpf1、sscpf1、pccpf1、bpcpf1、cmtcpf1、licpf1、pmcpf1、pb3310cpf1、pb4417cpf1、bscpf1、eecpf1、bhcas12b、akcas12b、ebcas12b、lscas12b中的一種或幾種。
57、可選地,所述目標dna序列位于細胞內。
58、可選地,所述細胞為分裂細胞或非分裂細胞。
59、可選地,所述目標dna序列為端粒或其片段。
60、可選地,上述倒位目標dna序列的方法在體外或體內進行。
61、可選地,每個pegrna包括第一向導rna或第二向導rna、第一引物結合位點或第二引物結合位點、第一逆轉錄模板或第二逆轉錄模板,按照“?5’到3’?”或者“?3’到5’?”的方向排列。
62、可選地,逆轉錄酶為m-mlv逆轉錄酶或能夠在生理條件下發揮作用的逆轉錄酶。
63、可選地,cas蛋白和逆轉錄酶作為編碼相應蛋白質的核酸片段間接提供,或作為蛋白質直接提供。
64、可選地,每個pegrna作為編碼所述pegrna的重組dna間接提供,或作為rna分子直接提供。
65、與現有技術相比,本發明的有益之處在于:本發明提供了基于相同技術構思的四套dna先導編輯系統。這四套dna先導編輯系統都是通過特殊設計的先導編輯向導rna(pegrna),在目標dna序列的同一條鏈的兩端生成互補的配對片段,通過配對片段的互補作用實現目標dna的倒位編輯。
66、本發明提供的四套dna先導編輯系統可以針對任意需要倒位編輯的目標dna序列,并不限于特定的某一種或某一類物種。在實際應用時,針對相應的物種,只要采用本發明的技術構思構建四套dna先導編輯系統,都能獲得的良好的基因倒位編輯效果。