麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

基于模糊測(cè)度的基因重要度追蹤方法

文檔序號(hào):6621439閱讀:326來(lái)源:國(guó)知局
基于模糊測(cè)度的基因重要度追蹤方法
【專利摘要】本發(fā)明公開了一種基于模糊測(cè)度的基因重要度追蹤方法,將人體的各個(gè)基因看作預(yù)測(cè)特征,通過(guò)模糊積分的變形構(gòu)造線性方程組,采用L1-norm歸一化方法求解模糊測(cè)度值,獲得一組帶有少量非零值的解,從而追蹤到與之相對(duì)應(yīng)的基因或基因組合對(duì)疾病影響的重要度。本發(fā)明的基于模糊測(cè)度的基因重要度追蹤方法采用基于L1-norm的方法對(duì)基于模糊測(cè)度的模糊積分運(yùn)算的變形進(jìn)行參數(shù)求解,擯除了傳統(tǒng)的假設(shè)特征獨(dú)立的前提,認(rèn)定各個(gè)基因以及各個(gè)基因之間的組合都有可能對(duì)疾病有著一定的影響,而影響的程度由求解得到的模糊測(cè)度值來(lái)描述,可以快速確定影響疾病發(fā)生的重要基因或基因組合。
【專利說(shuō)明】基于模糊測(cè)度的基因重要度追蹤方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基因重要度追蹤方法,尤其是一種基于模糊測(cè)度的基因重要度追 蹤方法,屬于生物信息【技術(shù)領(lǐng)域】。

【背景技術(shù)】
[0002] 目前,研究發(fā)現(xiàn)人類疾病的發(fā)病和基因序列中某些基因的突變有直接的關(guān)系。但 是基因序列往往是包含成千上萬(wàn)個(gè)基因的長(zhǎng)串,即使通過(guò)多種基因篩選技術(shù)到最后,仍然 是無(wú)法確定哪些基因和疾病有著重要關(guān)系。有些研究者借助計(jì)算機(jī)輔助工具進(jìn)行特征提取 的工作,但是所得到的重要基因的前提假設(shè)是各個(gè)基因之間是獨(dú)立作用毫不相關(guān)的。事實(shí) 上,事物的特征之間的交互作用往往也影響著目標(biāo)決策,因此,基因之間的交互組合對(duì)疾病 所起到的作用不容忽視。
[0003] 傳統(tǒng)的模糊測(cè)度是模糊積分計(jì)算中所用到的參數(shù),應(yīng)用于分類或者回歸模型中, 通常采用遺傳算法學(xué)習(xí)得到,當(dāng)數(shù)據(jù)特征數(shù)量較多時(shí),復(fù)雜度也會(huì)隨之增大。


【發(fā)明內(nèi)容】

[0004] 本發(fā)明的目的是為了解決上述現(xiàn)有技術(shù)的缺陷,提供一種可以快速確定影響疾病 發(fā)生的重要基因或基因組合的基于模糊測(cè)度的基因重要度追蹤方法。
[0005] 本發(fā)明的目的可以通過(guò)采取如下技術(shù)方案達(dá)到:
[0006] 基于模糊測(cè)度的基因重要度追蹤方法,其特征在于所述方法包括:將人體的各個(gè) 基因看作預(yù)測(cè)特征,通過(guò)模糊積分的變形構(gòu)造線性方程組,采用Ll-norm歸一化方法求解 模糊測(cè)度值,獲得一組帶有少量非零值的解,從而追蹤到與之相對(duì)應(yīng)的基因或基因組合對(duì) 疾病影響的重要度。
[0007] 作為一種實(shí)施方案,所述方法包括以下步驟:
[0008] S1、將人體的各個(gè)基因看作預(yù)測(cè)特征,而基因序列所對(duì)應(yīng)的疾病分類為預(yù)測(cè)目 標(biāo);
[0009] S2、通過(guò)模糊積分的變形構(gòu)造線性方程組,具體如下:
[0010] S21、設(shè)一個(gè)數(shù)據(jù)集合為訓(xùn)練集,含有1個(gè)例子,每個(gè)例子包含一個(gè)決策特征Y和η 個(gè)預(yù)測(cè)特征Χρ χ2, . . .,xn ; toon] 其中,正整數(shù)1表示數(shù)據(jù)集的大小;決策特征Y指示每個(gè)例子屬于哪一類;預(yù)測(cè)特 征是數(shù)字類型的,它們的值由一個(gè)η維向量f (Xl),f (x2),...,f 〇〇所表示;
[0012] S22、通過(guò)模糊積分的計(jì)算來(lái)完成基于模糊測(cè)度的目標(biāo)值,如下式:

【權(quán)利要求】
1. 基于模糊測(cè)度的基因重要度追蹤方法,其特征在于所述方法包括:將人體的各個(gè)基 因看作預(yù)測(cè)特征,通過(guò)模糊積分的變形構(gòu)造線性方程組,采用Ll-norm歸一化方法求解模 糊測(cè)度值,獲得一組帶有少量非零值的解,從而追蹤到與之相對(duì)應(yīng)的基因或基因組合對(duì)疾 病影響的重要度。
2. 根據(jù)權(quán)利要求1所述的基于模糊測(cè)度的基因重要度追蹤方法,其特征在于所述方法 包括以下步驟: 51、 將人體的各個(gè)基因看作預(yù)測(cè)特征,而基因序列所對(duì)應(yīng)的疾病分類為預(yù)測(cè)目標(biāo); 52、 通過(guò)模糊積分的變形構(gòu)造線性方程組,具體如下: 521、 設(shè)一個(gè)數(shù)據(jù)集合為訓(xùn)練集,含有1個(gè)例子,每個(gè)例子包含一個(gè)決策特征Y和η個(gè)預(yù) 測(cè)特征 Χρ χ2, . . .,xn ; 其中,正整數(shù)1表示數(shù)據(jù)集的大小;決策特征Y指示每個(gè)例子屬于哪一類;預(yù)測(cè)特征是 數(shù)字類型的,它們的值由一個(gè)η維向量f(Xl),f(x2),...,f 〇〇所表示; 522、 通過(guò)模糊積分的計(jì)算來(lái)完成基于模糊測(cè)度的目標(biāo)值,如下式:
對(duì)于j = 1,2,一,2^1都會(huì)有空集為0的慣例;其中,/rc(^)表示$的小數(shù)部分; 上述公式中,如果將j以二進(jìn)制的形式j(luò)njny i表示,則有= ^ =2}和
523、 根據(jù)已知的疾病DNA數(shù)據(jù)庫(kù),建立一組以模糊測(cè)度μ為未知變量的線性方程; 一 2**-1 2 53、 采用Ll-norm歸一化方法,使得Σ -y +Α|μ||的值最小,從而會(huì)得到一組帶有 戶1 2 少量非零值的解,通過(guò)調(diào)節(jié)其中的參數(shù)λ來(lái)控制非零值的個(gè)數(shù); 54、 根據(jù)步驟S3得到的非零值的解,追蹤到與之相對(duì)應(yīng)的基因及基因組合對(duì)疾病影響 的重要度。
3. 根據(jù)權(quán)利要求1或2所述的基于模糊測(cè)度的基因重要度追蹤方法,其特征在于:所 述采用Ll-norm歸一化方法求解模糊測(cè)度值直接調(diào)用LASSO函數(shù)包來(lái)完成。
【文檔編號(hào)】G06F19/10GK104091096SQ201410361374
【公開日】2014年10月8日 申請(qǐng)日期:2014年7月25日 優(yōu)先權(quán)日:2014年7月25日
【發(fā)明者】王金鳳 申請(qǐng)人:華南農(nóng)業(yè)大學(xué)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
主站蜘蛛池模板: 隆德县| 兴化市| 荣昌县| 长乐市| 延庆县| 华池县| 夹江县| 淮安市| 德格县| 垣曲县| 商河县| 兴和县| 柘城县| 岚皋县| 高平市| 长泰县| 沐川县| 江安县| 河西区| 南和县| 新昌县| 新化县| 马龙县| 镇沅| 巴林右旗| 囊谦县| 昌平区| 奉化市| 南漳县| 喜德县| 红河县| 德庆县| 叙永县| 文昌市| 尼玛县| 廉江市| 信宜市| 蚌埠市| 蓝山县| 盐津县| 砚山县|