麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種基于有向樹結(jié)構(gòu)的多處理器系統(tǒng)故障診斷方法

文檔序號:41758245發(fā)布日期:2025-04-29 18:27閱讀:6來源:國知局
一種基于有向樹結(jié)構(gòu)的多處理器系統(tǒng)故障診斷方法

本發(fā)明屬于多處理器領(lǐng)域,具體涉及一種基于有向樹結(jié)構(gòu)的多處理器系統(tǒng)故障診斷方法。


背景技術(shù):

1、多處理器系統(tǒng)是實(shí)現(xiàn)高性能計(jì)算的核心技術(shù),在天氣預(yù)報(bào)、石油勘探、生物信息處理等各方面廣泛應(yīng)用。多處理器系統(tǒng)的可靠性和容錯(cuò)性是保證其正常運(yùn)行和性能穩(wěn)定的關(guān)鍵。

2、在高速多處理器系統(tǒng)中,處理器故障是不可避免的。當(dāng)一個(gè)或多個(gè)處理器出現(xiàn)故障時(shí),可能會(huì)導(dǎo)致系統(tǒng)崩潰,使其無法正常運(yùn)行或者產(chǎn)生錯(cuò)誤的計(jì)算結(jié)果。因此,及時(shí)有效地檢測系統(tǒng)中的故障處理器(或組件),然后對其進(jìn)行維修或更換,以確保系統(tǒng)正常運(yùn)行,一直是多處理器系統(tǒng)的研究熱點(diǎn)之一。

3、在多處理器系統(tǒng)中,檢測所有故障處理器的過程稱為系統(tǒng)診斷。若系統(tǒng)g中發(fā)生故障的處理器的數(shù)目不超過t時(shí),所有的處理器都能被準(zhǔn)確地診斷出是否發(fā)生故障,則稱系統(tǒng)是t-可診斷的。使得系統(tǒng)g是t-可診斷的t的最大值稱為g的診斷度,記為t(g)。

4、在系統(tǒng)診斷研究領(lǐng)域,研究人員設(shè)計(jì)了各種模型來識(shí)別故障處理器,比如maeng,malek(mm)模型(比較模型)和preparata,metze,chien(pmc)模型。maeng和malek提出了mm模型(j.maeng?and?m.malek.a?comparison?connection?assignment?for?self-diagnosis?of?multiprocessor?systems.in?proceedings?of?11th?internationalsymposium?on?fault-tolerant?computing,pages?173–175,1981.),它通過將相同的任務(wù)從處理器發(fā)送到兩個(gè)不同的鄰居,然后進(jìn)行診斷比較它們的反應(yīng);通過匯總所有比較,系統(tǒng)可以確定每個(gè)處理器的狀態(tài)。preparata等人提出了pmc模型(f.preparata,g.metze,andr.chien.on?the?connection?assignment?problem?of?diagosis?systems.ieeetransactions?electronic?computers,ec-16(6):848–854,1967.),該模型通過互連測試相鄰處理器來有效地完成診斷故障。

5、在某些情況下,可能只關(guān)注多處理器系統(tǒng)中的特定處理器(或組件)是否有故障。hsu和tan提出了一種新的診斷定義(g.-h.hsu?and?j.j.-m.tan.a?localdiagnosiability?measure?for?multiprocessor?systems.ieee?transactions?onparallel?and?distributed?systems,18(5):598–607,2007.),稱為局部診斷,即只診斷特定處理器的狀態(tài)。全局診斷策略需要在系統(tǒng)中的處理器之間收集大量的測試結(jié)果,其復(fù)雜度高,與之相比,局部診斷策略具有更高的應(yīng)用價(jià)值。

6、多處理器系統(tǒng)的拓?fù)浣Y(jié)構(gòu)通常表示為無向圖,反映了對應(yīng)的通信結(jié)構(gòu),其中連接允許雙向數(shù)據(jù)傳輸。然而,在實(shí)際實(shí)現(xiàn)中,兩個(gè)處理器之間的雙向通信通常使用兩個(gè)獨(dú)立的單向通道來實(shí)現(xiàn),每個(gè)通道處理相反方向的數(shù)據(jù)傳輸。為了管理大量的頂點(diǎn),降低硬件復(fù)雜性,并解決制造大規(guī)模集成電路的挑戰(zhàn),研究人員引入了有向網(wǎng)絡(luò)的概念。這些網(wǎng)絡(luò),如有向超立方體和有向星圖,通過使用單向鏈接提供了有效的方式來組織通信。這種方法簡化了系統(tǒng)架構(gòu)并增強(qiáng)了可擴(kuò)展性。

7、從pmc模型、比較模型等系統(tǒng)診斷的基本定義來看,一個(gè)頂點(diǎn)對其他頂點(diǎn)的診斷可以看作是有向邊。基于比較模型,lin等人構(gòu)造了一種樹形結(jié)構(gòu)wb(u;t),以及相應(yīng)的局部診斷算法lda(c.-k.lin,y.-h.teng,j.j.-m.tan,and?g.-h.hsu.local?diagnosisalgorithms?for?multiprocessor?systems?under?the?comparison?diagnosismodel.ieee?transactions?on?reliability,62(4):800–810,2013.),通過該結(jié)構(gòu)和算法可以確定一個(gè)頂點(diǎn)的狀態(tài)。然而,這種方法不適用于有向圖,因?yàn)槊總€(gè)有向邊并不總是有相反的有向邊與之對應(yīng)。該樹結(jié)構(gòu)和lda算法不能應(yīng)用于有向超立方體和有向星圖等有向拓?fù)浣Y(jié)構(gòu)。


技術(shù)實(shí)現(xiàn)思路

1、本發(fā)明針對現(xiàn)有診斷技術(shù)的不足,提出一種基于有向樹結(jié)構(gòu)的多處理器系統(tǒng)故障診斷方法,解決多處理器系統(tǒng)中的故障診斷問題。

2、本發(fā)明所述的一種基于有向樹結(jié)構(gòu)的多處理器系統(tǒng)故障診斷方法,依據(jù)多處理器系統(tǒng)的互連結(jié)構(gòu),以待診斷的處理器為根構(gòu)造特定的有向樹結(jié)構(gòu),使用經(jīng)典的比較診斷模型,在有向樹結(jié)構(gòu)中執(zhí)行診斷測試,收集測試結(jié)果,再由算法得出處理器故障與否的狀態(tài),具體步驟如下:

3、步驟1,依據(jù)多處理器系統(tǒng)的互連結(jié)構(gòu),以待診斷的處理器為根構(gòu)造特定的有向樹結(jié)構(gòu);

4、步驟2,使用經(jīng)典的比較診斷模型,在有向樹結(jié)構(gòu)中執(zhí)行診斷測試,收集測試結(jié)果;

5、步驟3,執(zhí)行算法,由測試結(jié)果推導(dǎo)出處理器故障與否的狀態(tài);

6、步驟4,同樣的方法對多處理器系統(tǒng)中的所有處理器進(jìn)行故障診斷,完成多處理器系統(tǒng)的系統(tǒng)級故障診斷,找到所有故障處理器。

7、進(jìn)一步地,步驟1中,依據(jù)圖論知識(shí),多處理器系統(tǒng)的互連結(jié)構(gòu)使用圖g=(v,e)來表示,圖中的頂點(diǎn)對應(yīng)多處理器系統(tǒng)中的處理器,邊對應(yīng)處理器之間的鏈路,v、e分別為圖中的頂點(diǎn)集和邊的集合,代表了多處理器系統(tǒng)中的處理器集合和處理器之間的鏈路集合;

8、用符號u表示有向樹結(jié)構(gòu)的根,代表著待檢測的處理器,p、q分別表示該有向樹結(jié)構(gòu)中type?t和type?c形態(tài)的子圖的個(gè)數(shù),為樹中的頂點(diǎn),e1、e2為樹中的兩個(gè)邊集合;給出一種特定的有向樹結(jié)構(gòu)dt(u,p,q),其中:

9、

10、e(dt(u,p,q))=e1∪e2

11、

12、該有向樹結(jié)構(gòu)嵌入在多處理器系統(tǒng)中,依據(jù)此結(jié)構(gòu),通過診斷測試,判定頂點(diǎn)u對應(yīng)處理器的故障與否。

13、進(jìn)一步地,步驟2中,使用比較診斷模型即mm模型;

14、在mm模型下,一個(gè)測試處理器w同時(shí)對它的兩個(gè)相鄰的被測試處理器u、v發(fā)送相同的測試任務(wù),然后比較它們反饋的測試結(jié)果,實(shí)現(xiàn)對故障處理器的識(shí)別;這個(gè)測試結(jié)果稱為一個(gè)癥狀,記作σ;σw(u,v)表示處理器w對被測試點(diǎn)對{u,v}的輸出結(jié)果的比較結(jié)果,如果輸出的結(jié)果不一致,則σw(u,v)=1,否則σw(u,v)=0;如果σw(u,v)=1,意味著u、v、w中至少有一個(gè)是故障的;如果σw(u,v)=0并且已知w是無故障的,則u和v均無故障,若已知w是故障的,則測試結(jié)果是不可靠的;

15、在有向樹結(jié)構(gòu)dt(u,p,q)中,是測試點(diǎn),將得到測試結(jié)果:

16、

17、進(jìn)一步地,步驟3中,由測試結(jié)果分析得到診斷結(jié)果;該有向樹結(jié)構(gòu)中包含了兩種狀態(tài)的子結(jié)構(gòu),type?t和type?c,通過兩個(gè)變量g(u,i)和h(u,j)對比較結(jié)果進(jìn)行統(tǒng)計(jì),公式如下:

18、

19、記f為有向樹結(jié)構(gòu)中故障頂點(diǎn)的集合,代表著分布于該結(jié)構(gòu)中的故障處理器的集合;記對于1≤i≤p,

20、

21、其推導(dǎo)證明如下:

22、當(dāng)g(u,i)=0時(shí),得到或者如果如果從而,

23、當(dāng)g(u,i)=1且u∈f時(shí),得到由u∈f且得由且得從而,

24、當(dāng)g(u,i)=-1且時(shí),得到此時(shí),如果因?yàn)榈脧亩绻驗(yàn)椴⑶业眠M(jìn)而由得從而,

25、記對于1≤j≤q,

26、

27、其推導(dǎo)證明如下:

28、當(dāng)h(u,j)=0時(shí),得到或者如果如果從而,

29、當(dāng)h(u,j)=1且u∈f時(shí),得到由u∈f且得由且得從而,

30、當(dāng)h(u,i)=-1且時(shí),得到此時(shí),如果因?yàn)榈脧亩绻驗(yàn)椴⑶业眠M(jìn)而由得從而,

31、現(xiàn)假設(shè)p+q≥1,并且有向樹結(jié)構(gòu)中故障點(diǎn)數(shù)至多為p+q;

32、對g(u,i)和h(u,i)的值進(jìn)行求和,如果頂點(diǎn)u是非故障的,否則頂點(diǎn)u是故障的;其推論證明如下:

33、記g0={i|g(u,i)=0},g1={i|g(u,i)=1},g2={i|g(u,i)=-1},h0={j|h(u,j)=0},h1={j|h(u,j)=1},h2={j|h(u,j)=-1}。

34、顯然記由公式(1)(2)得,g=|g1|-|g2|,h=|h1|-

35、|h2|,g+h=|g1|+|h1|-|g2|-|h2|;由公式(3)(4)得,當(dāng)i∈g0,|f∩pi|≥1,當(dāng)j∈h0,|f∩qj|≥1;當(dāng)g+h≥0時(shí),|g1|+|h1|≥|g2|+|h2|;如果u是故障的,則當(dāng)i∈g1時(shí),|f∩pi|≥2,當(dāng)j∈h1時(shí),|f∩qj|≥2;從而得,|f|≥|g0|+2|g1|+|h0|+2|h1|+1≥|g0|+|g1|+|g2|+|h0|+|h1|+|h2|+1=p+q+1;根據(jù)假設(shè)|f|≤p+q,得出矛盾,從而得u是非故障的;

36、當(dāng)g+h<0時(shí),|g1|+|h1|<|g2|+|h2|;如果u是非故障的,則當(dāng)i∈g2時(shí),|f∩pi|≥2,當(dāng)j∈h2時(shí),|f∩qj|≥2;從而得,|f|≥|g0|+2|g2|+|h0|+2|h2|>|g0|+|g1|+|g2|+|h0|+|h1|+|h2|=p+q;設(shè)|f|≤p+q,得出矛盾,從而得u是故障的。

37、進(jìn)一步地,步驟2、步驟3收集測試結(jié)果,得出診斷結(jié)果,其算法框架如下:

38、

39、

40、算法流程如下:

41、輸入頂點(diǎn)u,子結(jié)構(gòu)type?t的數(shù)量p,子結(jié)構(gòu)type?c的數(shù)量q,p個(gè)type?t結(jié)構(gòu)的測試結(jié)果g(u,i),1≤i≤p,q個(gè)type?c結(jié)構(gòu)的測試結(jié)果h(u,j),1≤j≤q;對于1≤i≤p,對g(u,i)進(jìn)行求和,記為g;對于1≤j≤q,對h(u,j)進(jìn)行求和,記為h;判斷h+g≥0是否成立,若成立輸出0,表示頂點(diǎn)u非故障,否則輸出1,表示頂點(diǎn)u故障。

42、本發(fā)明達(dá)到的有益效果為:

43、(1)本發(fā)明給出了一個(gè)局部診斷結(jié)構(gòu)d(u,p,q)和兩個(gè)檢驗(yàn)函數(shù)。在此基礎(chǔ)上,提出了一種有向圖的局部診斷算法,在比較診斷模型下,當(dāng)故障頂點(diǎn)數(shù)不超過p+q時(shí),該算法對u進(jìn)行診斷的時(shí)間復(fù)雜度為o(p+q)。根據(jù)該算法,具有局部診斷結(jié)構(gòu)d(u,p,q)的有向圖對于頂點(diǎn)u是局部p+q可診斷的。

44、(2)該結(jié)構(gòu)和算法是基于有向圖進(jìn)行設(shè)計(jì)的,對于無向圖,其每條邊都表示處理器之間雙向的鏈路,可以表示為兩條不同方向的有向邊,同樣方法可以嵌入有向樹結(jié)構(gòu)、收集測試數(shù)據(jù)、調(diào)用算法來完成系統(tǒng)診斷。所以該結(jié)構(gòu)和算法在有向圖和無向圖中均可以很好的實(shí)現(xiàn),比較適用于多處理器系統(tǒng)的故障診斷。

45、(3)大量實(shí)驗(yàn)表明,結(jié)構(gòu)中每個(gè)頂點(diǎn)的故障概率在50%時(shí),算法診斷故障元素的準(zhǔn)確率仍在70%以上。本方法構(gòu)造的有向樹結(jié)構(gòu),圍繞待診斷的頂點(diǎn),結(jié)合比較診斷模型的特點(diǎn),選取最小數(shù)目的頂點(diǎn)和有向邊,避免了更多信息的影響;其次,構(gòu)造了好的算法,僅收集必要的測試結(jié)果來輸入算法,避免受到其他測試結(jié)果的干擾。從而保證了診斷結(jié)果的準(zhǔn)確率和高效性。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
主站蜘蛛池模板: 政和县| 砚山县| 清河县| 湖口县| 阳江市| 满城县| 宜州市| 梁平县| 镶黄旗| 安乡县| 大石桥市| 吴旗县| 桐乡市| 琼中| 临潭县| 阜南县| 曲靖市| 海兴县| 上杭县| 定远县| 洮南市| 安阳市| 罗田县| 凯里市| 和田市| 阜新市| 涟水县| 黑山县| 宁河县| 道真| 尖扎县| 海淀区| 涿州市| 宁强县| 巫山县| 于都县| 庐江县| 馆陶县| 得荣县| 贞丰县| 铅山县|