一種鑒別紅木及其制品的dna條形碼技術及其使用方法
【專利摘要】本發(fā)明公開一種鑒別紅木及其制品的DNA條形碼技術及其使用方法,采用合并紅木樣本實驗數(shù)據(jù)和目標植物的數(shù)據(jù)庫數(shù)據(jù)的策略構建高容量數(shù)據(jù)庫,對紅木樣本的DNA條形碼序列進行測序,將測序序列合并Genbank數(shù)據(jù)庫中已發(fā)表的同種序列,構建數(shù)據(jù)來源廣泛的紅木樹種DNA條形碼基因數(shù)據(jù)庫,并使用matK+rbcL基因作為紅木鑒定的目標DNA條形碼基因,同時使用基于頻率的局部比對算法的搜索工具法、基于Kimura-2-parameter概率的遺傳距離法和基于聚類分析的系統(tǒng)發(fā)生樹法設立鑒定的數(shù)據(jù)庫算法和判定規(guī)則;該鑒別紅木及其制品的DNA條形碼技術及其使用方法建立了準確、快捷的紅木種類DNA條形碼鑒別技術。
【專利說明】-種鑒別紅木及其制品的DNA條形碼技術及其使用方法
【技術領域】
[0001] 本發(fā)明涉及一種鑒別紅木及其制品的DNA條形碼技術及其使用方法。
【背景技術】
[0002] 目前,盡管已有應用DNA條形碼技術進行植物鑒定的報道,并形成了一定的規(guī)范 性文件(高連明等,《關于植物DNA條形碼研究技術規(guī)范》,植物分類與資源學報2012,34 ( 6) : 592?606),但是,如要將DNA條形碼技術應用于紅木的鑒定中,將面臨不同于常規(guī) 植物分類的突出難題: 問題一:建立DNA條形碼序列數(shù)據(jù)庫的數(shù)據(jù)來源問題。由于紅木是從消費角度命名 的俗稱類別,各種類之間不存在明確的物種親緣關系,且不同紅木品種的來源、珍稀程度存 在很大差別,很難同時收集到不同來源的全部33種紅木,且使得每一種類都具有足夠數(shù)量 用以建立數(shù)據(jù)庫的個體樣本,如全部使用紅木樣品基因測序結果建立數(shù)據(jù)庫,將面臨總體 樣本量過小和種間樣本量差距過大的問題,影響數(shù)據(jù)庫作為判定基礎的可信度;另一方面, GB/T18107-2000提供了每種紅木的拉丁種屬名稱,在Genbank等公共數(shù)據(jù)庫中,已有不少 這些種屬的基因序列資料,但是,紅木存在大量的同種異型現(xiàn)象,已發(fā)表的相關種屬的序列 信息很可能與紅木的序列并不完全匹配,如完全根據(jù)公共數(shù)據(jù)庫已發(fā)表的序列建立紅木的 DNA條形碼數(shù)據(jù)庫,則會面臨較大的錯判風險。因此,如何獲取并整合大量的紅木DNA條形 碼序列,建立容量充足、判定準確的DNA條形碼數(shù)據(jù)庫,將是將該技術應用于紅木及制品鑒 別的首要問題。
[0003] 問題二:植物DNA條形碼目標基因的選擇一直是該技術用于物種鑒別時影響可靠 性的關鍵影響因素。作為DNA條形碼鑒定的目標基因應具備較高的物種間多態(tài)性和物種內 遺傳穩(wěn)定性,從而在序列比對中表現(xiàn)出較強的物種區(qū)分能力。與動物的DNA條形碼普遍使 用coxl基因不同,目前尚未有一種理想的DNA條形碼基因或基因組合可區(qū)分所有的已知植 物。國際生命條形碼聯(lián)盟(Consortium for the Barcode of Life, CB0L)從引物通用性、 序列質量、區(qū)分物種的能力三方面開展了植物DNA條形碼候選基因的篩選(Hollingsworth etal·,2011)并得到了 7個候選的植物質體基因,分別是matK, rbcL, rpoB和rpoCl四 個編碼基因以及atpF-atpH, trnH-psbA和psbK-psbl三個非編碼基因(CB0L plant working group, 2009)。2011年,中國植物條形碼組織提出將轉錄間隔區(qū)的核核糖體(ITS) 基因加入到種子植物的鑒別條形碼候選基因中(China Plant BOL Group et al.,2011)。 但是,這些基因在用于植物DNA條形碼標記時,在對不同種屬的區(qū)分度、引物設計難度等方 面各有利弊,因此,在各類紅木的鑒定中,何種基因或基因組合最為有效,也是本發(fā)明須重 點解決的關鍵問題。
[0004] 問題三:DNA條形碼數(shù)據(jù)庫構建的算法和未知樣本的判別標準問題。在獲得用于 建立DNA條形碼數(shù)據(jù)庫的所有目標基因序列后,經(jīng)過序列的整理,一般有3種基于不同算法 的生物信息學方法可建立相應的數(shù)據(jù)庫并提供未知序列的查詢和判別,分別是基于頻率的 局部比對算法的搜索工具(BLAST)法、基于Kimura-2-parameter ( K2P)概率的遺傳距離 法和基于聚類分析的系統(tǒng)發(fā)生樹法。這三種方法數(shù)據(jù)處理的原理不同,因而進行判別時的 準確性和適用范圍都有所差異。即使對于其中的任意一種方法,分析時所采用的參數(shù)不同, 其結果也有出現(xiàn)差異的可能。因此,要對紅木這一特定的無明確親緣關系的植物群體中不 同種類的樣本進行準確鑒別,采取何種數(shù)據(jù)庫構建和序列分析方法將至關重要,這需要在 獲取序列信息的基礎上,通過摸索不同參數(shù)并驗證大量已知樣本,才能確保方法的準確度 和實用價值。
【發(fā)明內容】
[0005] 本發(fā)明要解決的技術問題是提供一種建立了準確、快捷的紅木種類DNA條形碼鑒 別技術,從重點解決上述三大難點問題出發(fā),首先研究確定最佳的DNA條形碼目標基因組 合,同時創(chuàng)新數(shù)據(jù)庫序列來源和構建方法,并驗證其鑒別的準確性的鑒別紅木及其制品的 DNA條形碼技術。
[0006] 為解決上述問題,本發(fā)明采用如下技術方案: 一種鑒別紅木及其制品的DNA條形碼技術,采用合并紅木樣本實驗數(shù)據(jù)和目標植物的 數(shù)據(jù)庫數(shù)據(jù)的策略構建高容量數(shù)據(jù)庫:對紅木樣本的DNA條形碼序列進行測序,將測序序 列合并Genbank數(shù)據(jù)庫中已發(fā)表的同種序列,構建數(shù)據(jù)來源廣泛的紅木樹種DNA條形碼基 因數(shù)據(jù)庫,并使用matK+rbcL基因作為紅木鑒定的目標DNA條形碼基因,同時使用基于頻 率的局部比對算法的搜索工具法、基于Kimura-2-parameter概率的遺傳距離法和基于聚 類分析的系統(tǒng)發(fā)生樹法設立鑒定的數(shù)據(jù)庫算法和判定規(guī)則,全面提高鑒定的準確性和可信 度。
[0007] 本發(fā)明要解決的另一技術問題是提供一種鑒別紅木及其制品的DNA條形碼技術 的使用方法, 為解決上述技術問題,本發(fā)明采用如下技術方案:包括以下步驟: 1) 紅木樣本的收集與驗證; 2) 樣本基因組DNA的提取; 3) 目標DNA條形碼基因片段的擴增、純化與測序; 4) 相關數(shù)據(jù)庫序列的查詢; 5) 序列的編輯、比對、質量核查,整合不同來源的序列數(shù)據(jù); 6) 數(shù)據(jù)庫的構建與判定參數(shù)的確認; 7) 數(shù)據(jù)庫判定準確性驗證; 8) 未知樣品的鑒定。
[0008] 本發(fā)明的有益效果是:首先,本發(fā)明建立可快速查詢的紅木種類DNA條形碼數(shù)據(jù) 庫,可對未知的紅木樣本進行快速鑒定,相比于傳統(tǒng)的木材切片顯微觀察、對比圖譜進行鑒 定的方法,可大大提高鑒定效率,提高檢測的通量和準確性,將鑒定時間從1-2天縮短為半 天左右,并減少對于操作人員經(jīng)驗的依賴性,可廣泛適用于具備分子生物學實驗室的木材 鑒定與產(chǎn)品檢驗機構,在滿足消費者需求的同時,提升檢測機構的技術平臺和水平,創(chuàng)造更 好的經(jīng)濟效益和社會效益。同時,本發(fā)明應用matK和rbcL條形碼基因的組合,創(chuàng)新性地將 樣本測序所得序列與數(shù)據(jù)庫已有序列合并建立數(shù)據(jù)庫,最大限度地增加了紅木數(shù)據(jù)庫的容 量,加之同時使用3種算法進行鑒定,其鑒定的可靠性和準確性也大大優(yōu)于常規(guī)的DNA條形 碼方法。
【專利附圖】
【附圖說明】
[0009] 圖1為本發(fā)明一種鑒別紅木及其制品的DNA條形碼技術及其使用方法的A部分紅 木樣本rbcL條形碼基因擴增電泳圖。
[0010] 圖2為本發(fā)明一種鑒別紅木及其制品的DNA條形碼技術及其使用方法的典型DNA 條形碼序列測序圖譜。
[0011] 圖3為本發(fā)明一種鑒別紅木及其制品的DNA條形碼技術及其使用方法的三種紅木 DNA條形碼數(shù)據(jù)庫操作與判定截圖。
【具體實施方式】
[0012] 一種鑒別紅木及其制品的DNA條形碼技術,采用合并紅木樣本實驗數(shù)據(jù)和目標植 物的數(shù)據(jù)庫數(shù)據(jù)的策略構建高容量數(shù)據(jù)庫:對紅木樣本的DNA條形碼序列進行測序,將測 序序列合并Genbank數(shù)據(jù)庫中已發(fā)表的同種序列,構建數(shù)據(jù)來源廣泛的紅木樹種DNA條形 碼基因數(shù)據(jù)庫,并使用matK+rbcL基因作為紅木鑒定的目標DNA條形碼基因,同時使用基于 頻率的局部比對算法的搜索工具法、基于Kimura-2-parameter概率的遺傳距離法和基于 聚類分析的系統(tǒng)發(fā)生樹法設立鑒定的數(shù)據(jù)庫算法和判定規(guī)則,全面提高鑒定的準確性和可 信度。
[0013] 參閱圖1所示,以18個紅木樣本DNA作為模板,用rbcL特異引物進行PCR擴增, 除2號樣本外,各樣本均獲得單一明亮的條帶,產(chǎn)物大小均為750bp。B.部分紅木樣本matK 條形碼基因擴增電泳圖,以15個紅木樣本DNA作為模板,用matK特異引物進行PCR擴增, 各樣本均獲得單一的擴增條帶,產(chǎn)物大小均為930bp。
[0014] 參閱圖2所示,測序峰明顯,重疊峰較少,測序樣本純度高。
[0015] 參閱圖3所示,A采用離線BLAST程序構建數(shù)據(jù)庫。將未知序列進行BLAST查詢, 查詢結果中相似度大于98%物種,可以被視為未知樣本所屬物種;B計算未知序列與數(shù)據(jù)庫 中已知序列的遺傳距離,若未知序列與某一種內各個體間的遺傳距離小于該種最大種內距 離并同時大于最小種間距離時,可以將未知樣本鑒定到種;C將未知序列與數(shù)據(jù)庫中已有 的序列進行聚類分析,構建NJ親緣關系樹。
[0016] 一種鑒別紅木及其制品的DNA條形碼技術的使用方法,包括以下步驟: 1) 紅木樣本的收集與驗證:從研究所、木材企業(yè)、檢測機構等多個途徑收集國家標準中 界定的各紅木品種,使得每個品種均獲得多個不同來源的樣本,應用傳統(tǒng)的顯微切片觀察 法處理樣本,并根據(jù)《木材鑒別方法通則》確定樣品的真實性,建立包含多個來源個體的紅 木標準樣本庫; 2) 樣本基因組DNA的提取:經(jīng)充分的文獻查詢,對木材中DNA的提取方法主要有改良 的十六烷基三甲基溴化銨CTAB法及植物DNA提取試劑盒,通常采用Qiagen DNeasy Plant Mini試劑盒,比較兩種方法的效率,確定使用Qiagen DNeasy Plant Mini試劑盒提取每個 樣本的基因組總DNA,將搜集到的木材樣本表面消毒,切成薄片,用冷凍球磨儀磨成粉末,取 2〇mg粉末按試劑盒使用說明提取DNA ; 3) 目標DNA條形碼基因片段的擴增、純化與測序:針對葉綠體基因,通過查閱文獻,挑 選出7個候選條形碼基因片段,經(jīng)篩選比較,選擇擴增效率高的通用引物,以前一步驟提取 的DNA為模板,分別擴增matK和rbcL基因的條形碼序列,反應體系為25 μ L ,其中包括 12. 5 μ L premix Taq, 0· 5 μ L 10 μ M 正、反向引物,IOOng 模板 DNA 和 ddH20 ; 擴增條件為:95 °C預變性3 min,30個循環(huán)的95 °C 30 s、51 °C 30 s、72 °C 40 s, 最后72 °C延伸7 min ; 參閱圖I所示,擴增產(chǎn)物的質量通過凝膠電泳檢驗;挑選有單一清晰目標條帶的樣本; 參閱圖2所示將擴增獲得的目標條帶純化后進行雙向測序,測序結果作為建立數(shù)據(jù)庫 的備選序列; 4) 相關數(shù)據(jù)庫序列的查詢:參閱下方表1所示,根據(jù)GB/T18107-2000中列出的各種紅 木樹種的拉丁名稱,在Genbank數(shù)據(jù)庫中搜索已發(fā)表的matK和rbcL基因條形碼序列,增加 進入數(shù)據(jù)庫備選序列的相應物種中; 5) 序列的編輯、比對、質量核查,整合不同來源的序列數(shù)據(jù):將每個紅木物種來自測序 和已有數(shù)據(jù)庫的matK和rbcL基因條形碼序列混合,分別使用DNAstar序列編輯軟件進行 編輯、比對與質量核查,將種內與其他樣本的最小序列差異超過5%的序列舍棄,每個紅木 物種至少有5個以上來源不同的序列; 6) 數(shù)據(jù)庫的構建與判定參數(shù)的確認:分別使用離線BLAST程序、MEGA5. 0軟件的遺傳距 離計算功能、MEGA5. 0的NJ樹聚類分析功能的算法構建各品種matK和rbcL基因條形碼序 列數(shù)據(jù)庫,均采用系統(tǒng)默認的參數(shù)設置,當要對未知序列進行判定時,均使用matK+rbcL基 因條形碼進行判定,設定規(guī)則如下: (1) 當使用離線BLAST數(shù)據(jù)庫時,將未知序列作為被查詢序列進行BLAST查詢,當查詢 報告中與之相似度最高的均為同一物種的數(shù)據(jù)庫內所有序列、且與之相似度最低的該物種 樣本間相似度大于98%,該未知樣本可被判定為屬于該紅木物種; (2) 當使用MEGA5. 0軟件的遺傳距離計算功能時,當未知樣本序列與數(shù)據(jù)庫某一物種1 的所有個體間的遺傳距離均在物種1的最大種內距離以內,同時,該物種序列與其他物種2 所有個體之間的遺傳距離均在物種1與物種2最小種間距離之外,該未知樣本可被判定為 屬于該紅木物種; (3) 當使用MEGA5. 0的NJ樹聚類分析功能時,數(shù)據(jù)庫的表現(xiàn)形式為NJ系統(tǒng)發(fā)生樹,將 未知樣本序列代入該樹,根據(jù)系統(tǒng)默認的聚類分析算法,如未知樣本聚類于某一物種,該未 知樣本即可被判定為屬于該紅木物種,三種紅木DNA條形碼數(shù)據(jù)庫操作與判定截圖見附圖 3 ; 7) 數(shù)據(jù)庫判定準確性驗證:針對上述應用不同算法和判定規(guī)則的3個數(shù)據(jù)庫,為驗證 每個數(shù)據(jù)庫的判定準確性,采取自驗證的方法,分別將數(shù)據(jù)庫中的每一個樣本的序列單獨 提出,將剩下的所有序列組成數(shù)據(jù)庫,將提出的序列作為被查詢序列代入去除其本身的數(shù) 據(jù)庫,對比判定結果與其真實種類,驗證并比較各個數(shù)據(jù)庫對紅木物種鑒定的準確性; 結果表明,通過這種自驗證的方法,3個不同算法、不同判定規(guī)則數(shù)據(jù)庫的判定準確率 均達到100%,均可用于紅木樹種及樣本的鑒定; 8) 未知樣品的鑒定:當需要對未知紅木樹種或紅木制品進行種類鑒定時,按照前述方 法提取未知樣本DNA,擴增測序得到matK和rbcL條形碼基因序列,以之作為被查詢序列,代 入上述3個數(shù)據(jù)庫之一進行檢索,即可判別該樣本是否屬于某一種類紅木; 現(xiàn)共進行了 61個未知樹種的鑒別,成功率達100% ;對39份紅木制品進行鑒別時,有22 份提取出可擴增的DNA,這22份的鑒定成功率也達到100%。
[0017]表 1 :
【權利要求】
1. 一種鑒別紅木及其制品的DNA條形碼技術,其特征在于:采用合并紅木樣本實驗數(shù) 據(jù)和目標植物的數(shù)據(jù)庫數(shù)據(jù)的策略構建高容量數(shù)據(jù)庫,對紅木樣本的DNA條形碼序列進行 測序,將測序序列合并Genbank數(shù)據(jù)庫中已發(fā)表的同種序列,構建數(shù)據(jù)來源廣泛的紅木樹 種DNA條形碼基因數(shù)據(jù)庫,并使用matK+rbcL基因作為紅木鑒定的目標DNA條形碼基因,同 時使用基于頻率的局部比對算法的搜索工具法、基于Kimura-2-parameter概率的遺傳距 離法和基于聚類分析的系統(tǒng)發(fā)生樹法設立鑒定的數(shù)據(jù)庫算法和判定規(guī)則。
2. -種如權利要求1所述的鑒別紅木及其制品的DNA條形碼技術的使用方法,其特征 在于,包括以下步驟: 1) 紅木樣本的收集與驗證; 2) 樣本基因組DNA的提取; 3) 目標DNA條形碼基因片段的擴增、純化與測序; 4) 相關數(shù)據(jù)庫序列的查詢; 5) 序列的編輯、比對、質量核查,整合不同來源的序列數(shù)據(jù); 6) 數(shù)據(jù)庫的構建與判定參數(shù)的確認; 7) 數(shù)據(jù)庫判定準確性驗證; 8) 未知樣品的鑒定。
【文檔編號】C12Q1/68GK104404131SQ201410473826
【公開日】2015年3月11日 申請日期:2014年9月17日 優(yōu)先權日:2014年9月17日
【發(fā)明者】張馳, 方昕, 邱皓璞, 李寧, 王金磚, 劉彬 申請人:南京市產(chǎn)品質量監(jiān)督檢驗院