本申請(qǐng)涉及基因變異數(shù)據(jù)庫(kù),尤其涉及體細(xì)胞基因變異分析方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù):
1、隨著高通量測(cè)序技術(shù)的快速發(fā)展,體細(xì)胞基因變異(somatic?variant)的檢測(cè)變得越來(lái)越普遍。體細(xì)胞基因變異通常指發(fā)生在非生殖細(xì)胞中的基因突變,這些變異與多種疾病的發(fā)生和發(fā)展密切相關(guān),特別是癌癥。體細(xì)胞基因變異類型主要有5大類型:?jiǎn)螇A基點(diǎn)突變snv,短片段插入缺失indel,拷貝數(shù)擴(kuò)增amplification,拷貝數(shù)缺失deletion,融合突變fusion。因此,對(duì)體細(xì)胞基因變異進(jìn)行準(zhǔn)確的解讀對(duì)于疾病的診斷、治療方案的選擇及預(yù)后的評(píng)估具有重要意義。目前已經(jīng)存在一些針對(duì)體細(xì)胞基因變異的數(shù)據(jù)庫(kù),如cosmic(catalogue?of?somatic?mutations?in?cancer)、tcga(the?cancer?genome?atlas)、icgc(international?cancer?genome?consortium)等。這些數(shù)據(jù)庫(kù)在一定程度上為研究者提供了大量的體細(xì)胞變異信息,雖然為體細(xì)胞基因變異的研究提供了基礎(chǔ)支持,但對(duì)體細(xì)胞變異信息的分析效率低下,無(wú)法快速做出判斷。
2、上述內(nèi)容僅用于輔助理解本申請(qǐng)的技術(shù)方案,并不代表承認(rèn)上述內(nèi)容是現(xiàn)有技術(shù)。
技術(shù)實(shí)現(xiàn)思路
1、本申請(qǐng)的主要目的在于提供一種體細(xì)胞基因變異分析方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),旨在解決現(xiàn)有技術(shù)中對(duì)體細(xì)胞變異判斷效率低下的技術(shù)問(wèn)題。
2、為實(shí)現(xiàn)上述目的,本申請(qǐng)?zhí)岢鲆环N體細(xì)胞基因變異分析方法,所述體細(xì)胞基因變異分析方法包括:
3、獲取體細(xì)胞檢測(cè)的樣本數(shù)據(jù),根據(jù)所述樣本數(shù)據(jù)確定主鍵信息;
4、根據(jù)所述主鍵信息確定id信息,基于所述id信息匹配基因樹分組,得到基因樹分組信息;
5、將所述樣本數(shù)據(jù)與所述基因樹分組信息匹配,確定所述樣本數(shù)據(jù)對(duì)應(yīng)的致癌性結(jié)果和變異位點(diǎn)信息;
6、將所述致癌性結(jié)果與所述變異點(diǎn)位信息輸出為體細(xì)胞基因變異分析結(jié)果。
7、在一實(shí)施例中,所述獲取體細(xì)胞檢測(cè)的樣本數(shù)據(jù),根據(jù)所述樣本數(shù)據(jù)確定主鍵信息的步驟包括:
8、獲取體細(xì)胞檢測(cè)報(bào)告,提取所述體細(xì)胞檢測(cè)報(bào)告的樣本數(shù)據(jù)中的轉(zhuǎn)錄本信息和核苷酸突變信息;
9、基于消息摘要算法,根據(jù)所述轉(zhuǎn)錄本信息和所述核苷酸信息生成主鍵信息。
10、在一實(shí)施例中,所述根據(jù)所述主鍵信息確定id信息,基于所述id信息匹配基因樹分組,得到基因樹分組信息的步驟包括:
11、將所述主鍵信息與基因信息條目匹配,在匹配成功時(shí),確定包含所述主鍵信息的基因信息條目,并得到所述基因信息條目的id信息;
12、將所述id信息與所述基因樹分組進(jìn)行匹配,得到所述id信息對(duì)應(yīng)的基因樹分組信息。
13、在一實(shí)施例中,所述將所述主鍵信息與基因信息條目匹配的步驟之后,還包括:
14、在所述主鍵信息與基因信息條目匹配失敗時(shí),根據(jù)所述主鍵信息生成id信息;
15、根據(jù)所述主鍵信息對(duì)應(yīng)的所述樣本數(shù)據(jù)確定基因樹分組信息;
16、根據(jù)所述基因樹分組信息、所述主鍵信息和所述id信息生成基因信息條目。
17、在一實(shí)施例中,所述將所述樣本數(shù)據(jù)與所述基因樹分組信息匹配,確定所述樣本數(shù)據(jù)對(duì)應(yīng)的致癌性結(jié)果和變異位點(diǎn)信息的步驟包括:
18、確定所述樣本數(shù)據(jù)中的變異類型,確定變異類型分組;
19、在所述變異類型分組中,確定所述樣本數(shù)據(jù)所屬的基因類型;
20、基于所述基于基因類型對(duì)所述樣本數(shù)據(jù)中的蛋白變異類型進(jìn)行檢測(cè),得到所述樣本數(shù)據(jù)對(duì)應(yīng)的致癌性結(jié)果;
21、將所述蛋白變異類型類別進(jìn)行判斷,確定蛋白變異類別;
22、根據(jù)所述蛋白變異類別與所述變異類型進(jìn)行精準(zhǔn)匹配,得到所述變異點(diǎn)位信息。
23、在一實(shí)施例中,所述根據(jù)所述蛋白變異類別與所述變異類型進(jìn)行精準(zhǔn)匹配,得到所述變異點(diǎn)位信息的步驟包括:
24、根據(jù)所述蛋白變異類別與所述變異類型進(jìn)行精準(zhǔn)匹配,確定所述變異解析結(jié)果;
25、對(duì)所述變異解析結(jié)果進(jìn)行解析,得到變異點(diǎn)位信息。
26、在一實(shí)施例中,所述將所述致癌性結(jié)果與所述變異點(diǎn)位信息輸出為體細(xì)胞基因變異分析結(jié)果的步驟包括:
27、將所述致癌性結(jié)果與所述變異點(diǎn)位信息組合,得到體細(xì)胞變異信息;
28、將所述體細(xì)胞變異信息與所述樣本數(shù)據(jù)進(jìn)行組合確定變異注釋;
29、根據(jù)所述樣本數(shù)據(jù)、所述體細(xì)胞變異信息和所述變異注釋得到體細(xì)胞基因變異分析結(jié)果,將輸出所述體細(xì)胞基因變異分析結(jié)果。
30、此外,為實(shí)現(xiàn)上述目的,本申請(qǐng)還提出一種體細(xì)胞基因變異分析裝置,所述體細(xì)胞基因變異分析裝置包括:
31、數(shù)據(jù)獲取模塊,用于獲取體細(xì)胞檢測(cè)的樣本數(shù)據(jù),根據(jù)所述樣本數(shù)據(jù)確定主鍵信息;
32、分組定位信息,用于根據(jù)所述主鍵信息確定id信息,基于所述id信息匹配基因樹分組,得到基因樹分組信息;
33、變異分析模塊,用于將所述樣本數(shù)據(jù)與所述基因樹分組信息匹配,確定所述樣本數(shù)據(jù)對(duì)應(yīng)的致癌性結(jié)果和變異位點(diǎn)信息;
34、結(jié)果輸出模塊,用于將所述致癌性結(jié)果與所述變異點(diǎn)位信息輸出為體細(xì)胞基因變異分析結(jié)果。
35、此外,為實(shí)現(xiàn)上述目的,本申請(qǐng)還提出一種體細(xì)胞基因變異分析設(shè)備,所述設(shè)備包括:存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序配置為實(shí)現(xiàn)如上文所述的體細(xì)胞基因變異分析方法的步驟。
36、此外,為實(shí)現(xiàn)上述目的,本申請(qǐng)還提出一種存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)為計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上文所述的體細(xì)胞基因變異分析方法的步驟。
37、此外,為實(shí)現(xiàn)上述目的,本申請(qǐng)還提供一種計(jì)算機(jī)程序產(chǎn)品,所述計(jì)算機(jī)程序產(chǎn)品包括計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如上文所述的體細(xì)胞基因變異分析方法的步驟。
38、本申請(qǐng)?zhí)岢龅囊粋€(gè)或多個(gè)技術(shù)方案,至少具有以下技術(shù)效果:獲取體細(xì)胞檢測(cè)的樣本數(shù)據(jù),根據(jù)所述樣本數(shù)據(jù)確定主鍵信息;根據(jù)所述主鍵信息確定id信息,基于所述id信息匹配基因樹分組,得到基因樹分組信息;將所述樣本數(shù)據(jù)與所述基因樹分組信息匹配,確定所述樣本數(shù)據(jù)對(duì)應(yīng)的致癌性結(jié)果和變異位點(diǎn)信息;將所述致癌性結(jié)果與所述變異點(diǎn)位信息輸出為體細(xì)胞基因變異分析結(jié)果,本申請(qǐng)能夠處理包含多個(gè)字段的體細(xì)胞變異數(shù)據(jù),并進(jìn)行有效的數(shù)據(jù)集成,確保數(shù)據(jù)的完整性和一致性,能夠?yàn)榕R床醫(yī)生提供準(zhǔn)確的基因變異解讀報(bào)告,幫助制定個(gè)性化的治療方案,提高診療效果。
1.一種體細(xì)胞基因變異分析方法,其特征在于,所述體細(xì)胞基因變異分析方法包括:
2.如權(quán)利要求1所述的方法,其特征在于,所述獲取體細(xì)胞檢測(cè)的樣本數(shù)據(jù),根據(jù)所述樣本數(shù)據(jù)確定主鍵信息的步驟包括:
3.如權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述主鍵信息確定id信息,基于所述id信息匹配基因樹分組,得到基因樹分組信息的步驟包括:
4.如權(quán)利要求3所述的方法,其特征在于,所述將所述主鍵信息與基因信息條目匹配的步驟之后,還包括:
5.如權(quán)利要求1所述的方法,其特征在于,所述將所述樣本數(shù)據(jù)與所述基因樹分組信息匹配,確定所述樣本數(shù)據(jù)對(duì)應(yīng)的致癌性結(jié)果和變異位點(diǎn)信息的步驟包括:
6.如權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述蛋白變異類別與所述變異類型進(jìn)行精準(zhǔn)匹配,得到所述變異點(diǎn)位信息的步驟包括:
7.如權(quán)利要求1所述的方法,其特征在于,所述將所述致癌性結(jié)果與所述變異點(diǎn)位信息輸出為體細(xì)胞基因變異分析結(jié)果的步驟包括:
8.一種體細(xì)胞基因變異分析裝置,其特征在于,所述裝置包括:
9.一種體細(xì)胞基因變異分析設(shè)備,其特征在于,所述設(shè)備包括:存儲(chǔ)器、處理器及存儲(chǔ)在所述存儲(chǔ)器上并可在所述處理器上運(yùn)行的計(jì)算機(jī)程序,所述計(jì)算機(jī)程序配置為實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的體細(xì)胞基因變異分析方法的步驟。
10.一種存儲(chǔ)介質(zhì),其特征在于,所述存儲(chǔ)介質(zhì)為計(jì)算機(jī)可讀存儲(chǔ)介質(zhì),所述存儲(chǔ)介質(zhì)上存儲(chǔ)有計(jì)算機(jī)程序,所述計(jì)算機(jī)程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)如權(quán)利要求1至7中任一項(xiàng)所述的體細(xì)胞基因變異分析方法的步驟。