專(zhuān)利名稱(chēng):軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法及軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置,特別涉及通過(guò)分析項(xiàng)目指標(biāo)和項(xiàng)目風(fēng)險(xiǎn)之間的量化關(guān)系,來(lái)建立風(fēng)險(xiǎn)評(píng)價(jià)模型,將模型用于評(píng)價(jià)新項(xiàng)目中各種風(fēng)險(xiǎn)發(fā)生概率,以及對(duì)模型進(jìn)行優(yōu)化的方法和裝置。
背景技術(shù):
在各種軟件項(xiàng)目開(kāi)發(fā)過(guò)程中經(jīng)常會(huì)出現(xiàn)各種風(fēng)險(xiǎn)。比如,在一些項(xiàng)目開(kāi)發(fā)過(guò)程中,存在主要開(kāi)發(fā)者離職的情況、頻繁的重復(fù)性編碼錯(cuò)誤、或者頻繁的需求變更等情況。以上這些對(duì)項(xiàng)目開(kāi)發(fā)產(chǎn)生影響的情況的發(fā)生可能性稱(chēng)項(xiàng)目風(fēng)險(xiǎn)。開(kāi)發(fā)過(guò)程中的項(xiàng)目風(fēng)險(xiǎn)會(huì)對(duì)項(xiàng)目產(chǎn)生沖擊,引起一些負(fù)面影響。有些項(xiàng)目風(fēng)險(xiǎn)使得項(xiàng)目日程延遲,有些項(xiàng)目風(fēng)險(xiǎn)增加項(xiàng)目開(kāi)發(fā)成本,有些項(xiàng)目風(fēng)險(xiǎn)降低了軟件質(zhì)量。因此,希望能夠針對(duì)各個(gè)項(xiàng)目預(yù)測(cè)各個(gè)項(xiàng)目風(fēng)險(xiǎn)的發(fā)生概率,以便在早期采取措施加以預(yù)防。
采用風(fēng)險(xiǎn)評(píng)價(jià)模型來(lái)對(duì)項(xiàng)目風(fēng)險(xiǎn)出現(xiàn)概率進(jìn)行評(píng)價(jià)是本領(lǐng)域中識(shí)別項(xiàng)目潛在風(fēng)險(xiǎn)的有效方法。事實(shí)上,現(xiàn)有風(fēng)險(xiǎn)評(píng)價(jià)體系包含多個(gè)目標(biāo)例如,風(fēng)險(xiǎn)發(fā)生概率評(píng)價(jià)、風(fēng)險(xiǎn)嚴(yán)重程度評(píng)價(jià)、風(fēng)險(xiǎn)出現(xiàn)時(shí)間預(yù)測(cè)、風(fēng)險(xiǎn)影響范圍評(píng)價(jià)等。本發(fā)明著重處理風(fēng)險(xiǎn)發(fā)生概率的評(píng)價(jià)。
現(xiàn)有的項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法有以下幾種。
例如存在采用調(diào)查問(wèn)卷的方式對(duì)風(fēng)險(xiǎn)概率進(jìn)行簡(jiǎn)單評(píng)價(jià)的方法。在非專(zhuān)利文獻(xiàn)1:(論文)“Software Risk Management:Principles and Practices”,Barry Boehm, IEEESoftware, 1991.中講述了一種用問(wèn)卷調(diào)查來(lái)進(jìn)行風(fēng)險(xiǎn)評(píng)價(jià)的方法。在本方法中,由專(zhuān)家設(shè)計(jì)專(zhuān)用的調(diào)查問(wèn)卷,用于收集一些跟風(fēng)險(xiǎn)相關(guān)的項(xiàng)目信息。通過(guò)對(duì)項(xiàng)目管理者進(jìn)行的問(wèn)卷調(diào)查,收集管理者對(duì)項(xiàng)目狀況的看法評(píng)分。基于收集到的評(píng)分,進(jìn)行某種綜合分析(比如AHP或DELPHI方法),得出風(fēng)險(xiǎn)發(fā)生的概率。自本文作者Barry Boehm的成果發(fā)表后,其他學(xué)者沿同樣的路線進(jìn)行了很多后續(xù)研究和完善,均以問(wèn)卷調(diào)查為基本策略。
但是,該方法有較大的不確定性和對(duì)專(zhuān)家問(wèn)卷的依賴(lài)性。由于在問(wèn)卷調(diào)查的過(guò)程中,項(xiàng)目管理者容易把個(gè)人偏見(jiàn)加入到評(píng)分中,影響到了項(xiàng)目評(píng)價(jià)的準(zhǔn)確性,因此會(huì)帶來(lái)較大的不確定性。另外,問(wèn)卷的制訂完全依賴(lài)于專(zhuān)家經(jīng)驗(yàn)。換一種項(xiàng)目類(lèi)型后必須重新要求專(zhuān)家制訂相應(yīng)的問(wèn)卷,調(diào)整分析方法。這對(duì)專(zhuān)家形成了依賴(lài),影響了問(wèn)卷的適用范圍。因此,該方法存在人為因素大、準(zhǔn)確度低并且成本難以控制的缺點(diǎn)。
此外,也有采用基于規(guī)則或模型的評(píng)價(jià)方式,例如采用掙值分析(EVM)的方法分析風(fēng)險(xiǎn)出現(xiàn)的幾率。
在專(zhuān)利文獻(xiàn)2:(美國(guó)專(zhuān)利7669180B2)中公開(kāi)了這一種方法:為每組風(fēng)險(xiǎn)因素創(chuàng)建了風(fēng)險(xiǎn)評(píng)價(jià)任務(wù),為每個(gè)任務(wù)定義了決策流程圖,為決策流程圖創(chuàng)建了相關(guān)的規(guī)則集合,基于項(xiàng)目數(shù)據(jù)和規(guī)則集合自動(dòng)對(duì)風(fēng)險(xiǎn)進(jìn)行綜合評(píng)價(jià)。
此外,專(zhuān)利文獻(xiàn)2中提及的風(fēng)險(xiǎn)模型建立規(guī)則可以用某種機(jī)器語(yǔ)言描述,并且,專(zhuān)利文獻(xiàn)2所涉及裝置提供規(guī)則編程用的API。用戶(hù)可以較自由地編輯適用于自己軟件項(xiàng)目的風(fēng)險(xiǎn)檢測(cè)規(guī)則。
專(zhuān)利文獻(xiàn)2中描述了一種基于規(guī)則的風(fēng)險(xiǎn)評(píng)價(jià)方法。這些規(guī)則可以用某種語(yǔ)言或編程API進(jìn)行自由編輯,使得該方法具有很好的擴(kuò)展性。但是,該方法存在用戶(hù)需要自行編輯或選擇風(fēng)險(xiǎn)檢測(cè)規(guī)則的問(wèn)題。事實(shí)上,缺乏經(jīng)驗(yàn)的管理者不太知道哪種規(guī)則適用于檢測(cè)他們項(xiàng)目的風(fēng)險(xiǎn),也不知道如何創(chuàng)造出有效的規(guī)則。
此外,在非專(zhuān)利文獻(xiàn)3:(論文)”Risk management method using data from EVMin software development projects^, A.Hayashi, CIMCA 2008,IEEE Computer Society.中描述了一種風(fēng)險(xiǎn)評(píng)價(jià)方法。具體來(lái)說(shuō),該技術(shù)是采用EVM(掙值分析)等方法,將項(xiàng)目進(jìn)度受到的各種影響量化成進(jìn)度延遲天數(shù),然后根據(jù)計(jì)算出的進(jìn)度延遲天數(shù)進(jìn)行風(fēng)險(xiǎn)評(píng)價(jià)。
非專(zhuān)利文獻(xiàn)3作為一種基于EVM的風(fēng)險(xiǎn)評(píng)價(jià)技術(shù)。其目標(biāo)是對(duì)項(xiàng)目風(fēng)險(xiǎn)進(jìn)行量化評(píng)價(jià),尤其適用于跟軟件進(jìn)度相關(guān)的風(fēng)險(xiǎn)評(píng)價(jià)。但非專(zhuān)利文獻(xiàn)3中存在的問(wèn)題是,這種方法較難對(duì)非進(jìn)度型指標(biāo),比如項(xiàng)目質(zhì)量方面的指標(biāo)進(jìn)行分析,得出風(fēng)險(xiǎn)評(píng)價(jià)。也就是說(shuō),方法的適用范圍比較有限,并且,非專(zhuān)利文獻(xiàn)3中公開(kāi)的量化評(píng)價(jià)方法的準(zhǔn)確度也不高。發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種能夠建立風(fēng)險(xiǎn)出現(xiàn)概率判斷的準(zhǔn)確度更高的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法及軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置。
本發(fā)明是一種軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法,包括:收集步驟,收集多個(gè)樣本的關(guān)于項(xiàng)目指標(biāo)和項(xiàng)目風(fēng)險(xiǎn)的歷史數(shù)據(jù);分割步驟,將上述項(xiàng)目指標(biāo)所映射的值域分割為多個(gè),針對(duì)每個(gè)分割后的子值域取代表值,設(shè)相對(duì)于某類(lèi)項(xiàng)目風(fēng)險(xiǎn)的項(xiàng)目指標(biāo)的種類(lèi)數(shù)量為m時(shí),上述值域是m維向量空間,其中,m是大于O的整數(shù);統(tǒng)計(jì)步驟,根據(jù)收集到的歷史數(shù)據(jù),統(tǒng)計(jì)每個(gè)子值域中伴隨某類(lèi)項(xiàng)目風(fēng)險(xiǎn)發(fā)生的項(xiàng)目指標(biāo)映射點(diǎn)的數(shù)量相對(duì)于映射到該子值域中的所有項(xiàng)目指標(biāo)映射點(diǎn)的數(shù)量的比值,作為該類(lèi)項(xiàng)目風(fēng)險(xiǎn)出現(xiàn)的風(fēng)險(xiǎn)概率,以及計(jì)算步驟,根據(jù)上述代表值與統(tǒng)計(jì)后的上述風(fēng)險(xiǎn)概率,進(jìn)行歸一化處理,作為訓(xùn)練數(shù)據(jù),制作項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型。
此外,本發(fā)明也可以是一種軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置,包括:收集單元,收集多個(gè)樣本的關(guān)于項(xiàng)目指標(biāo)和項(xiàng)目風(fēng)險(xiǎn)的歷史數(shù)據(jù);分割單元,將上述項(xiàng)目指標(biāo)所映射的值域分割為多個(gè),針對(duì)每個(gè)分割后的子值域取代表值,設(shè)相對(duì)于某類(lèi)項(xiàng)目風(fēng)險(xiǎn)的項(xiàng)目指標(biāo)的種類(lèi)數(shù)量為m時(shí),上述值域是m維向量空間,其中,m是大于O的整數(shù);統(tǒng)計(jì)單元,根據(jù)收集到的歷史數(shù)據(jù),統(tǒng)計(jì)每個(gè)子值域中伴隨某類(lèi)項(xiàng)目風(fēng)險(xiǎn)發(fā)生的項(xiàng)目指標(biāo)映射點(diǎn)的數(shù)量相對(duì)于映射到該子值域中的所有項(xiàng)目指標(biāo)映射點(diǎn)的數(shù)量的比值,作為該類(lèi)項(xiàng)目風(fēng)險(xiǎn)出現(xiàn)的風(fēng)險(xiǎn)概率,以及計(jì)算單元,根據(jù)上述代表值與統(tǒng)計(jì)后的上述風(fēng)險(xiǎn)概率,進(jìn)行歸一化處理,作為訓(xùn)練數(shù)據(jù),制作項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型。
根據(jù)本發(fā)明的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法及軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置,可以在不依賴(lài)專(zhuān)家經(jīng)驗(yàn)的情況下,找出歷史數(shù)據(jù)中各種風(fēng)險(xiǎn)的發(fā)生規(guī)律,并將其量化為風(fēng)險(xiǎn)評(píng)價(jià)模型,在新項(xiàng)目中基于項(xiàng)目指標(biāo)和評(píng)價(jià)模型估算出各種風(fēng)險(xiǎn)發(fā)生的概率,從而提高了風(fēng)險(xiǎn)評(píng)價(jià)的準(zhǔn)確性。
此外,本發(fā)明采用了機(jī)器學(xué)習(xí)的方法,自動(dòng)發(fā)現(xiàn)歷史風(fēng)險(xiǎn)出現(xiàn)規(guī)律,相當(dāng)于把“規(guī)貝1J”創(chuàng)建自動(dòng)化,并且通過(guò)收集各種類(lèi)型的項(xiàng)目風(fēng)險(xiǎn)和指標(biāo),擴(kuò)大了裝置的適用范圍。
因此,根據(jù)本發(fā)明,能夠建立準(zhǔn)確度更高的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型,來(lái)幫助項(xiàng)目管理者發(fā)現(xiàn)軟件項(xiàng)目中的各種風(fēng)險(xiǎn)。采用本發(fā)明的建模方法及裝置能夠有效利用歷史數(shù)據(jù),找出項(xiàng)目風(fēng)險(xiǎn)出現(xiàn)的規(guī)律,發(fā)現(xiàn)新項(xiàng)目中存在的風(fēng)險(xiǎn),減少對(duì)專(zhuān)家經(jīng)驗(yàn)的依賴(lài),提高風(fēng)險(xiǎn)發(fā)現(xiàn)的準(zhǔn)確率,并且適用范圍廣泛。
圖1是第一實(shí)施方式涉及的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法的流程圖2是第一實(shí)施方式涉及的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置的框圖3是第二實(shí)施方式涉及的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法的流程圖4是第二實(shí)施方式涉及的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置的框圖5是項(xiàng)目風(fēng)險(xiǎn)記錄和歷史項(xiàng)目指標(biāo)的例圖6是準(zhǔn)備風(fēng)險(xiǎn)模型訓(xùn)練數(shù)據(jù)的流程圖7是說(shuō)明風(fēng)險(xiǎn)模型訓(xùn)練數(shù)據(jù)的例圖8是說(shuō)明通過(guò)向量空間分割得到訓(xùn)練數(shù)據(jù)的例圖9是采用SVM算法訓(xùn)練風(fēng)險(xiǎn)模型的流程圖10是采用風(fēng)險(xiǎn)模型計(jì)算項(xiàng)目風(fēng)險(xiǎn)概率的流程圖11是說(shuō)明分析項(xiàng)目風(fēng)險(xiǎn)和項(xiàng)目指標(biāo)之間的相關(guān)度的流程圖12是分析項(xiàng)目風(fēng)險(xiǎn)和項(xiàng)目指標(biāo)之間的相關(guān)度的實(shí)例圖13是說(shuō)明利用驗(yàn)證數(shù)據(jù)訓(xùn)練風(fēng)險(xiǎn)評(píng)價(jià)模型的流程圖14是說(shuō)明調(diào)整向量空間分割距離的流程圖15是調(diào)整相關(guān)度閾值的流程圖。
具體實(shí)施方式
以下,參照附圖,對(duì)有關(guān)本發(fā)明的優(yōu)選實(shí)施方式進(jìn)行說(shuō)明。
(第一實(shí)施方式)
圖2是第一實(shí)施方式涉及的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置的框圖。如圖2所示,本發(fā)明的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置包括收集單元200、分割單元201、統(tǒng)計(jì)單元203以及計(jì)算單元204。
其中,收集單元200將多個(gè)樣本的關(guān)于項(xiàng)目指標(biāo)和項(xiàng)目風(fēng)險(xiǎn)的歷史數(shù)據(jù)收集到數(shù)據(jù)庫(kù)201中加以保存。例如,收集單元200受理用戶(hù)通過(guò)輸入裝置進(jìn)行的輸入,或者直接從外部裝置導(dǎo)入歷史數(shù)據(jù),來(lái)自動(dòng)/手動(dòng)收集軟件項(xiàng)目的歷史數(shù)據(jù)和正在進(jìn)行的新項(xiàng)目數(shù)據(jù),并將數(shù)據(jù)保存到數(shù)據(jù)庫(kù)201中。
作為數(shù)據(jù)庫(kù)201中的一個(gè)保存示例,可以利用表格保存項(xiàng)目風(fēng)險(xiǎn)記錄和歷史項(xiàng)目指標(biāo)。圖5是項(xiàng)目風(fēng)險(xiǎn)記錄和歷史項(xiàng)目指標(biāo)的例圖,在圖5中示意性地示出了當(dāng)前軟件管理中的部分項(xiàng)目風(fēng)險(xiǎn)和項(xiàng)目指標(biāo)。如圖5所示,表格“項(xiàng)目風(fēng)險(xiǎn)記錄”中保存了項(xiàng)目風(fēng)險(xiǎn)發(fā)生記錄。表格第I列記錄項(xiàng)目名稱(chēng),第2列記錄所發(fā)生風(fēng)險(xiǎn)類(lèi)型,第3列及之后記錄了某項(xiàng)目中某種風(fēng)險(xiǎn)每天的發(fā)生次數(shù)。其中,項(xiàng)目UProject I)在2011/7/5日出現(xiàn)“交付延遲(Delivery delay) ”風(fēng)險(xiǎn)一次,項(xiàng)目2在2011/7/6日同樣出現(xiàn)了“交付延遲”風(fēng)險(xiǎn)一次。
表格“歷史項(xiàng)目指標(biāo)”記錄了項(xiàng)目的各種項(xiàng)目指標(biāo)。表格第I列記錄項(xiàng)目名稱(chēng),第2列記錄所收集項(xiàng)目指標(biāo),第3列及之后記錄了某項(xiàng)目中某種指標(biāo)每天的值。如圖5所示,表格第2、3行記錄了項(xiàng)目I的“缺陷密度”和“需求變更規(guī)模”兩項(xiàng)指標(biāo),第4、5行記錄了項(xiàng)目2的這兩項(xiàng)指標(biāo)的變化情況。
在此,由于同類(lèi)項(xiàng)目的歷史數(shù)據(jù)對(duì)新項(xiàng)目的風(fēng)險(xiǎn)分析更加具有參考價(jià)值,因此假設(shè)所收集到的數(shù)據(jù)都屬于同類(lèi)項(xiàng)目(比如都屬于嵌入式開(kāi)發(fā)項(xiàng)目),或者已經(jīng)按照項(xiàng)目類(lèi)型(如電子商務(wù)項(xiàng)目、手機(jī)應(yīng)用項(xiàng)目、中間件項(xiàng)目等)進(jìn)行了分類(lèi)。
此外,如圖5中所指出的項(xiàng)目風(fēng)險(xiǎn)和項(xiàng)目指標(biāo)的種類(lèi)僅是示例,當(dāng)然還包括其他現(xiàn)有的項(xiàng)目風(fēng)險(xiǎn)和項(xiàng)目指標(biāo)。
設(shè)收集單元200收集到的、相對(duì)于某類(lèi)項(xiàng)目風(fēng)險(xiǎn)的項(xiàng)目指標(biāo)的種類(lèi)數(shù)量為m(m是大于O的整數(shù))時(shí),即有m種項(xiàng)目指標(biāo)時(shí),該m種項(xiàng)目指標(biāo)的值域構(gòu)成m維向量空間。分割單元201將將上述項(xiàng)目指標(biāo)所映射的作為該m維向量空間的值域分割為多個(gè)子值域,針對(duì)每個(gè)分割后的子值域取代表值,用于后續(xù)的處理。
統(tǒng)計(jì)單元203根據(jù)收集到的歷史數(shù)據(jù),統(tǒng)計(jì)每個(gè)子值域中伴隨某類(lèi)項(xiàng)目風(fēng)險(xiǎn)發(fā)生的項(xiàng)目指標(biāo)映射點(diǎn)的數(shù)量相對(duì)于映射到該子值域中的所有項(xiàng)目指標(biāo)映射點(diǎn)(某項(xiàng)目中所有項(xiàng)目指標(biāo)所構(gòu)成的m維向量)的數(shù)量的比值,作為該類(lèi)項(xiàng)目風(fēng)險(xiǎn)出現(xiàn)的風(fēng)險(xiǎn)概率,有關(guān)映射的詳細(xì)情況在后面敘述。
計(jì)算單元204用于制作項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型,具體來(lái)說(shuō),計(jì)算單元204根據(jù)上述代表值與統(tǒng)計(jì)后的上述風(fēng)險(xiǎn)概率,進(jìn)行歸一化處理,作為訓(xùn)練數(shù)據(jù),制作項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型,根據(jù)上述代表值與統(tǒng)計(jì)后的上述風(fēng)險(xiǎn)概率,進(jìn)行歸一化處理,作為訓(xùn)練數(shù)據(jù),制作項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型。其中,上述歸一化處理可以利用現(xiàn)有的歸一化處理算法來(lái)進(jìn)行,并且,得到訓(xùn)練數(shù)據(jù)之后,即可利用現(xiàn)有的預(yù)測(cè)模型建立方法來(lái)建立項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型,因此,在此省略詳細(xì)的說(shuō)明。
以下利用圖1說(shuō)明本發(fā)明的第一實(shí)施方式涉及的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法。圖1是第一實(shí)施方式涉及的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法的流程圖。如圖1所示,首先,收集單元200收集多個(gè)樣本的關(guān)于項(xiàng)目指標(biāo)和項(xiàng)目風(fēng)險(xiǎn)的歷史數(shù)據(jù)(步驟100)。
接著,分割單元201將上述項(xiàng)目指標(biāo)所映射的值域分割為多個(gè),針對(duì)每個(gè)分割后的子值域取代表值,設(shè)相對(duì)于某類(lèi)項(xiàng)目風(fēng)險(xiǎn)的項(xiàng)目指標(biāo)的種類(lèi)數(shù)量為m時(shí),上述值域是m維向量空間(步驟101)。
接著,統(tǒng)計(jì)單元203根據(jù)收集到的歷史數(shù)據(jù),統(tǒng)計(jì)每個(gè)子值域中伴隨某類(lèi)項(xiàng)目風(fēng)險(xiǎn)發(fā)生的項(xiàng)目指標(biāo)映射點(diǎn)的數(shù)量相對(duì)于映射到該子值域中的所有項(xiàng)目指標(biāo)映射點(diǎn)的數(shù)量的比值,作為該類(lèi)項(xiàng)目風(fēng)險(xiǎn)出現(xiàn)的風(fēng)險(xiǎn)概率(步驟102)。
最后,計(jì)算單元204根據(jù)上述代表值與統(tǒng)計(jì)后的上述風(fēng)險(xiǎn)概率,進(jìn)行歸一化處理,作為訓(xùn)練數(shù)據(jù),制作項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型(步驟103)。
以下舉例詳細(xì)說(shuō)明各步驟。
一般來(lái)說(shuō),風(fēng)險(xiǎn)評(píng)價(jià)模型實(shí)際上是“風(fēng)險(xiǎn)概率”和“相關(guān)項(xiàng)目指標(biāo)”之間的量化函數(shù)關(guān)系。為了訓(xùn)練出項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型,需要大量的(風(fēng)險(xiǎn)概率,相關(guān)項(xiàng)目指標(biāo))數(shù)據(jù)。數(shù)據(jù)庫(kù)中已有歷史項(xiàng)目指標(biāo),可以直接查出,但相應(yīng)的歷史風(fēng)險(xiǎn)概率是需要計(jì)算出來(lái)的。為了計(jì)算歷史風(fēng)險(xiǎn)出現(xiàn)概率,這里把歷史風(fēng)險(xiǎn)概率的計(jì)算定義成“相同或相似條件下的多個(gè)樣本案例中,某種風(fēng)險(xiǎn)發(fā)生的幾率”。這里加入“相似條件下案例”是因?yàn)樵跉v史數(shù)據(jù)中找到多個(gè)完全相同條件的案例是很困難的。“相同或相似條件”實(shí)際上是指“在相關(guān)項(xiàng)目指標(biāo)相同或相似的條件下”。為便于計(jì)算,這里設(shè)所有項(xiàng)目指標(biāo)都是相關(guān)項(xiàng)目指標(biāo),從而僅針對(duì)項(xiàng)目種類(lèi)進(jìn)行分類(lèi),即可將數(shù)據(jù)庫(kù)中的某類(lèi)項(xiàng)目的數(shù)據(jù)帶入本發(fā)明的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置中進(jìn)行處理。
圖6是準(zhǔn)備風(fēng)險(xiǎn)模型訓(xùn)練數(shù)據(jù)的流程圖。是對(duì)圖1中的流程圖中的步驟101 103的舉例說(shuō)明。
如圖6所示,在將該風(fēng)險(xiǎn)發(fā)生概率定義為“在相同或相似條件下(具備相同或相近的項(xiàng)目指標(biāo)),該風(fēng)險(xiǎn)出現(xiàn)的幾率”(步驟800)時(shí),統(tǒng)計(jì)單元203針對(duì)某種風(fēng)險(xiǎn)i,找出數(shù)據(jù)庫(kù)中多個(gè)項(xiàng)目風(fēng)險(xiǎn)i發(fā)生的記錄,采用這些項(xiàng)目中與風(fēng)險(xiǎn)i相關(guān)的m類(lèi)指標(biāo)數(shù)據(jù)建立m維向量Xlx1,…,xj ;由于每個(gè)項(xiàng)目都有多組(風(fēng)險(xiǎn)記錄,指標(biāo))數(shù)據(jù)對(duì),可以得到向量X的很多組實(shí)例,及每組實(shí)例對(duì)應(yīng)的風(fēng)險(xiǎn)記錄(步驟801);這里的“數(shù)據(jù)對(duì)”實(shí)際上是指某項(xiàng)目某天風(fēng)險(xiǎn)發(fā)生的狀況和當(dāng)天的相關(guān)項(xiàng)目指標(biāo),例如2011年9月I日,某項(xiàng)目中“交付延遲”風(fēng)險(xiǎn)出現(xiàn)I次,當(dāng)天的相關(guān)指標(biāo)為“缺陷密度=9.2K/L0C,需求變更范圍=5個(gè)模塊”,相應(yīng)的數(shù)據(jù)對(duì)就是(風(fēng)險(xiǎn)記錄=1,指標(biāo)向量X= (9.2,5))(步驟801)。
分割單元201將m維向量看作m維空間,在每個(gè)維度上,將該維的值域均分為L(zhǎng)段,也就是將整個(gè)m維空間均分為L(zhǎng)m個(gè)區(qū)間,將每區(qū)間的中心點(diǎn)記為{xlc;,x2。,...,xj作為每個(gè)段的代表值(步驟802)。
接著,統(tǒng)計(jì)單元203將向量X的所有樣本實(shí)例映射到m維空間中;在每個(gè)中心點(diǎn)為{xlc, X2c,..., XfflJ的區(qū)間中,統(tǒng)計(jì)出落在該區(qū)間的樣本數(shù)量,并可統(tǒng)計(jì)出發(fā)生了風(fēng)險(xiǎn)的樣本數(shù)量。把(風(fēng)險(xiǎn)發(fā)生樣本數(shù))/(總樣本數(shù))作為該區(qū)間的風(fēng)險(xiǎn)概率(步驟803)。通過(guò)統(tǒng)計(jì)上述每個(gè)區(qū)間內(nèi)的風(fēng)險(xiǎn)概率,可以得到一組(風(fēng)險(xiǎn)概率,指標(biāo)向量)數(shù)據(jù)集,比如(15%,X1), (88%, X2), , (75%,Xi),這里Xi是每個(gè)區(qū)間的中心點(diǎn)(步驟804)。
最后,計(jì)算單元204將上述數(shù)據(jù)集中的向量X值進(jìn)行歸一化,將向量X的每個(gè)值轉(zhuǎn)化為
之間的值(步驟805)。這樣,就得到了可用于風(fēng)險(xiǎn)評(píng)價(jià)模型訓(xùn)練的多組(風(fēng)險(xiǎn)概率,項(xiàng)目指標(biāo))記錄。
在圖6中,統(tǒng)計(jì)單元203先進(jìn)行伴隨風(fēng)險(xiǎn)發(fā)生的向量映射,分割單元202再進(jìn)行值域分割,但是也可以先進(jìn)行值域分割,再進(jìn)行映射。也就是說(shuō),本發(fā)明的各步驟的執(zhí)行順序并不限于圖6中所例舉的實(shí)施方式。在不存在數(shù)據(jù)繼承關(guān)系的情況下,各步驟的執(zhí)行順序是任意的。
此外,在上述例子中 ,以分割后的段(子值域)的中心點(diǎn)所對(duì)應(yīng)的向量作為代表值,結(jié)合該子值域的風(fēng)險(xiǎn)概率,來(lái)進(jìn)行歸一化處理。但是,本發(fā)明中所取得代表值并不限于中心點(diǎn)。也可以是其他點(diǎn)的向量。例如將子值域中包含所有映射點(diǎn)的特定圖形(例如圓形)的中心點(diǎn)的向量作為代表值。或者也可以根據(jù)子值域中的映射點(diǎn)分布的疏密程度來(lái)計(jì)算代表值,總之,代表值的定義方式并不僅限于這里所例舉的具體事例,可以根據(jù)項(xiàng)目環(huán)境或者側(cè)重點(diǎn)來(lái)設(shè)定子值域中的任意向量值作為代表值。
圖7是說(shuō)明風(fēng)險(xiǎn)模型訓(xùn)練數(shù)據(jù)的例圖。在圖7中示出了經(jīng)過(guò)圖6的各步驟所得到的訓(xùn)練數(shù)據(jù)的例子,圖中表格的每一行記錄了某個(gè)向量區(qū)間中心點(diǎn)項(xiàng)目指標(biāo)的值,和該區(qū)間內(nèi)某種風(fēng)險(xiǎn)的發(fā)生概率(風(fēng)險(xiǎn)概率,項(xiàng)目指標(biāo))。在圖7的例中,各種項(xiàng)目指標(biāo)已經(jīng)進(jìn)行了歸一化。
結(jié)合圖8說(shuō)明風(fēng)險(xiǎn)概率的計(jì)算過(guò)程。圖8是說(shuō)明通過(guò)向量空間分割得到訓(xùn)練數(shù)據(jù)的例圖。為了說(shuō)明的方便,以簡(jiǎn)單的二維空間為例進(jìn)行說(shuō)明。在本發(fā)明的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法中,主要有以下特點(diǎn)。
(I)將與項(xiàng)目風(fēng)險(xiǎn)相關(guān)的m維項(xiàng)目指標(biāo),看作m維向量空間。在上圖例中,把“缺陷密度(Bug density) ”和“需求變更規(guī)模(Require change scale) ”看作是與“交付延遲”風(fēng)險(xiǎn)相關(guān)的兩種項(xiàng)目指標(biāo),因此就得到如圖的二維向量空間,“缺陷密度”作為橫坐標(biāo),“需求變更規(guī)模”作為縱坐標(biāo)。
(2)將數(shù)據(jù)庫(kù)中的所有指標(biāo)樣本及相關(guān)風(fēng)險(xiǎn)記錄映射到向量空間中。有風(fēng)險(xiǎn)發(fā)生的指標(biāo)樣本用實(shí)心圓表示,無(wú)風(fēng)險(xiǎn)發(fā)生的指標(biāo)樣本用空心圓表示。在圖8中,把數(shù)據(jù)庫(kù)中2011/7/5日項(xiàng)目I的“缺陷密度”和“需求變更規(guī)模”指標(biāo)映射成向量空間中的樣本點(diǎn)(7,3),因?yàn)樵摌颖景殡S有“交付延遲”風(fēng)險(xiǎn),因此標(biāo)記為實(shí)心圓,同樣2011/7/6日項(xiàng)目2的這兩項(xiàng)指標(biāo)映射成樣本點(diǎn)(3,4),而且也是實(shí)心圓。相反,2011/7/3日的兩項(xiàng)指標(biāo)映射成樣本點(diǎn)(3,I),但因?yàn)楫?dāng)天未出現(xiàn)“交付延遲”風(fēng)險(xiǎn),因此該樣本點(diǎn)為空心圓。
(3)按照各維度上樣本的跨度,將向量空間等分為多份。本例中,將橫軸、縱軸各劃分3等分,整個(gè)二維空間劃分為3X3等分,9個(gè)區(qū)間。關(guān)于邊界值的劃分原則,將邊界值包含在靠前的較小區(qū)間中。例 如,在圖8中,橫軸劃分為
、(3,6]、(6,9]等3個(gè)區(qū)間,縱軸劃分為
、(2,4], (4,6]等3個(gè)區(qū)間。
(4)在劃分后的每個(gè)區(qū)間內(nèi),統(tǒng)計(jì)落在該區(qū)間中的樣本點(diǎn)總數(shù),及出現(xiàn)了風(fēng)險(xiǎn)的樣本點(diǎn)數(shù)目(實(shí)心圓數(shù)目)。“風(fēng)險(xiǎn)樣本點(diǎn)數(shù)目/樣本點(diǎn)總數(shù)”即作為該區(qū)間內(nèi)的風(fēng)險(xiǎn)概率,并算出該區(qū)間的中心點(diǎn)(圖中星型符)。將該區(qū)間的(風(fēng)險(xiǎn)概率,中心點(diǎn)向量)作為一組(風(fēng)險(xiǎn)概率,項(xiàng)目指標(biāo))數(shù)據(jù)。比如,圖8中最左列第2個(gè)區(qū)間內(nèi),有2個(gè)樣本點(diǎn),其中I個(gè)樣本點(diǎn)出現(xiàn)了風(fēng)險(xiǎn),該區(qū)間的風(fēng)險(xiǎn)概率即為1/2 = 50%。根據(jù)橫縱坐標(biāo),可算出該區(qū)間的中心點(diǎn)為(1.5,3),因此就得到一組(風(fēng)險(xiǎn)概率,項(xiàng)目指標(biāo))記錄為[50%,(1.5,3)]。其中項(xiàng)目指標(biāo)(1.5,3)為2維向量。同理,可在其他區(qū)間內(nèi)獲得圖中的另外兩組記錄
和[100%, (7.5,3)]。
(5)匯總所有區(qū)間的(風(fēng)險(xiǎn)概率,中心點(diǎn)向量)計(jì)算結(jié)果,即得到可用于風(fēng)險(xiǎn)評(píng)價(jià)模型訓(xùn)練的多組訓(xùn)練數(shù)據(jù)(風(fēng)險(xiǎn)概率,項(xiàng)目指標(biāo))記錄。
上例中講述了二維向量空間的劃分。實(shí)際上,這種向量空間劃分方法完全可以擴(kuò)展到多維(維度>=3)。下面以四維向量(即4個(gè)指標(biāo)與某風(fēng)險(xiǎn)相關(guān))為例子來(lái)說(shuō)明多維空間分割的例子。設(shè)四維向量為(Χι,χ2,χ3,χ4),向量空間分割及區(qū)間內(nèi)風(fēng)險(xiǎn)概率計(jì)算步驟如下:
I)針對(duì)向量每一維,從其最大值到最小值之間等分為L(zhǎng)段(比如5段)。比如,假設(shè)X1的值在
之間,則將其值域劃分為Xltl, X11,...X14總共5段,X10段的值介于
,X11段的值介于(10,20],而X14段的值介于(40,50]。
2)將每維的各段,與其他3維的各段,進(jìn)行不重復(fù)的組合,形成LXLXLXL個(gè)組合。每個(gè)組合也就是一個(gè)區(qū)間,比如(X1CI,X21,X33,X42)。該區(qū)間的中心為各維在該段上的中;L.、點(diǎn),比如(XiOc,X21c, X33c X42c)。
3)在劃分后的每個(gè)區(qū)間內(nèi),查找數(shù)據(jù)庫(kù)中落在該區(qū)間內(nèi)的樣本點(diǎn),并查出這些樣本點(diǎn)中發(fā)生風(fēng)險(xiǎn)的樣本點(diǎn)。比如數(shù)據(jù)庫(kù)中落在(X1Q, X21 , X33, X42)的樣本點(diǎn)有10個(gè),出現(xiàn)風(fēng)險(xiǎn)的樣本點(diǎn)有4個(gè)。在本例中,就認(rèn)為,在4類(lèi)項(xiàng)目指標(biāo)接近x1(l。,x21c, X33c X42。(區(qū)間中心點(diǎn))的情況下,風(fēng)險(xiǎn)概率為4/10 = 40%。
統(tǒng)計(jì)每個(gè)區(qū)間內(nèi)的風(fēng)險(xiǎn)概率,并記錄該區(qū)間的中心點(diǎn)值,即得到大量的(風(fēng)險(xiǎn)概率,X1, X2, X3, X4)數(shù)據(jù)組合。該5元組所形成的集合即可用于風(fēng)險(xiǎn)評(píng)價(jià)模型的訓(xùn)練。在這里,組合的數(shù)目其實(shí)就是空間劃分區(qū)間的數(shù)目,比如L4個(gè)。區(qū)間劃分越多,每個(gè)區(qū)間越小,區(qū)間內(nèi)樣本點(diǎn)距中心點(diǎn)距離越小,樣本點(diǎn)條件就越近似,風(fēng)險(xiǎn)概率計(jì)算精度就越高,但計(jì)算量就越大。反之,區(qū)間劃分越少,單個(gè)區(qū)間越大,落在單個(gè)區(qū)間內(nèi)的樣本點(diǎn)更多,但風(fēng)險(xiǎn)概率精度下降,計(jì)算量也下降。
通過(guò)以上的基于向量空間劃分統(tǒng)計(jì)歷史風(fēng)險(xiǎn)概率的方法,可以得到各種風(fēng)險(xiǎn)的(歷史風(fēng)險(xiǎn)概率,相應(yīng)項(xiàng)目指標(biāo))數(shù)據(jù)集。這些數(shù)據(jù)將用于各種風(fēng)險(xiǎn)的評(píng)價(jià)模型訓(xùn)練。模型訓(xùn)練可采用支持向量機(jī)(SVM)、神經(jīng)網(wǎng)絡(luò)、KNN(Κ-Nearest Neighbor algorithm:K近鄰算法)等方法,本說(shuō)明書(shū)以SVM算法為例說(shuō)明利用訓(xùn)練數(shù)據(jù)建立預(yù)測(cè)模型的步驟。訓(xùn)練步驟參見(jiàn)附圖9。首先,計(jì)算單元204為非線性SVM選定核函數(shù),例如:
K(Xj^Xj) = exp(--L——J-), 2σ
這里σ為常量(步驟1000)。然后,設(shè)置用于模型訓(xùn)練的方程組,例如:
權(quán)利要求
1.一種軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法,其特征在于, 包括: 收集步驟,收集多個(gè)樣本的關(guān)于項(xiàng)目指標(biāo)和項(xiàng)目風(fēng)險(xiǎn)的歷史數(shù)據(jù); 分割步驟,將上述項(xiàng)目指標(biāo)所映射的值域分割為多個(gè),針對(duì)每個(gè)分割后的子值域取代表值,設(shè)相對(duì)于某類(lèi)項(xiàng)目風(fēng)險(xiǎn)的項(xiàng)目指標(biāo)的種類(lèi)數(shù)量為m時(shí),上述值域是m維向量空間,其中,m是大于O的整數(shù); 統(tǒng)計(jì)步驟,根據(jù)收集到的歷史數(shù)據(jù),統(tǒng)計(jì)每個(gè)子值域中伴隨某類(lèi)項(xiàng)目風(fēng)險(xiǎn)發(fā)生的項(xiàng)目指標(biāo)映射點(diǎn)的數(shù)量相對(duì)于映射到該子值域中的所有項(xiàng)目指標(biāo)映射點(diǎn)的數(shù)量的比值,作為該類(lèi)項(xiàng)目風(fēng)險(xiǎn)出現(xiàn)的風(fēng)險(xiǎn)概率,以及 計(jì)算步驟,根據(jù)上述代表值與統(tǒng)計(jì)后的上述風(fēng)險(xiǎn)概率,進(jìn)行歸一化處理,作為訓(xùn)練數(shù)據(jù),制作項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型。
2.根據(jù)權(quán)利要求1所述的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法,其特征在于, 在上述分割步驟中,將映射到某個(gè)子值域中的樣本數(shù)量與規(guī)定的數(shù)量閾值相比較,根據(jù)比較結(jié)果調(diào)整分割的子值域的大小。
3.根據(jù)權(quán)利要求1所述的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法,其特征在于, 還包括驗(yàn)證步驟,將歷史數(shù)據(jù)中的一部分?jǐn)?shù)據(jù)作為驗(yàn)證數(shù)據(jù),代入項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型來(lái)得到驗(yàn)證用預(yù)測(cè)風(fēng)險(xiǎn)概率,并計(jì)算該驗(yàn)證用預(yù)測(cè)風(fēng)險(xiǎn)概率與驗(yàn)證數(shù)據(jù)的歷史風(fēng)險(xiǎn)概率之差相對(duì)于歷史風(fēng)險(xiǎn)概率的百分比,在上述百分比低于規(guī)定驗(yàn)證閾值的情況下,不使用該項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型進(jìn)行風(fēng)險(xiǎn)評(píng)價(jià)。
4.根據(jù)權(quán)利要求1所述的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法,其特征在于, 還包括評(píng)價(jià)步驟,利用上述計(jì)算步驟中計(jì)算出的項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型對(duì)新的軟件項(xiàng)目進(jìn)行風(fēng)險(xiǎn)評(píng)價(jià),得到預(yù)測(cè)風(fēng)險(xiǎn)概率。
5.根據(jù)權(quán)利要求1所述的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法,其特征在于, 還包括反饋步驟,每當(dāng)新的軟件項(xiàng)目完成之后,收集該軟件項(xiàng)目的與項(xiàng)目指標(biāo)和項(xiàng)目風(fēng)險(xiǎn)有關(guān)的信息反饋給上述收集步驟,作為歷史數(shù)據(jù),重新制作項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型。
6.根據(jù)權(quán)利要求1所述的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法,其特征在于, 在上述分割步驟中,取每個(gè)子值域的中心值作為該子值域的代表值。
7.根據(jù)權(quán)利要求1所述的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法,其特征在于, 還包括相關(guān)度分析步驟,根據(jù)在上述統(tǒng)計(jì)步驟統(tǒng)計(jì)出來(lái)的、每個(gè)子值域中伴隨某類(lèi)項(xiàng)目風(fēng)險(xiǎn)發(fā)生的某類(lèi)項(xiàng) 目指標(biāo)的出現(xiàn)次數(shù),計(jì)算該某類(lèi)項(xiàng)目風(fēng)險(xiǎn)與該某類(lèi)項(xiàng)目指標(biāo)之間的相關(guān)度指標(biāo),僅將相關(guān)度指標(biāo)在規(guī)定的相關(guān)度閾值以上的項(xiàng)目指標(biāo)作為相關(guān)項(xiàng)目指標(biāo)用于分割步驟, 在上述分割步驟中,僅將上述相關(guān)項(xiàng)目指標(biāo)所映射的值域作為m維向量空間進(jìn)行分割。
8.根據(jù)權(quán)利要求7所述的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法,其特征在于, 在上述相關(guān)度分析步驟中,每一定時(shí)期將相對(duì)某類(lèi)項(xiàng)目風(fēng)險(xiǎn)而放棄的項(xiàng)目指標(biāo)重新用于評(píng)價(jià)模型的建立,來(lái)建立臨時(shí)評(píng)價(jià)模型,并且比較將歷史數(shù)據(jù)分別代入臨時(shí)評(píng)價(jià)模型和原評(píng)價(jià)模型得到而的風(fēng)險(xiǎn)評(píng)價(jià)結(jié)果,在作為臨時(shí)評(píng)價(jià)模型的風(fēng)險(xiǎn)評(píng)價(jià)結(jié)果的預(yù)測(cè)風(fēng)險(xiǎn)概率比作為原評(píng)價(jià)模型的風(fēng)險(xiǎn)評(píng)價(jià)結(jié)果的預(yù)測(cè)風(fēng)險(xiǎn)概率更加接近歷史風(fēng)險(xiǎn)概率時(shí),將規(guī)定的相關(guān)度閾值調(diào)整為該放棄的項(xiàng)目指標(biāo)所對(duì)應(yīng)的相關(guān)度。
9.根據(jù)權(quán)利要求1所述的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法,其特征在于, 在上述計(jì)算步驟中,利用支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)或K近鄰算法KNN,對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行建模處理,來(lái)制作項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型。
10.一種軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置,其特征在于, 包括: 收集單元,收集多個(gè)樣本的關(guān)于項(xiàng)目指標(biāo)和項(xiàng)目風(fēng)險(xiǎn)的歷史數(shù)據(jù); 分割單元,將上述項(xiàng)目指標(biāo)所映射的值域分割為多個(gè),針對(duì)每個(gè)分割后的子值域取代表值,設(shè)相對(duì)于某類(lèi)項(xiàng)目風(fēng)險(xiǎn)的項(xiàng)目指標(biāo)的種類(lèi)數(shù)量為m時(shí),上述值域是m維向量空間,其中,m是大于O的整數(shù); 統(tǒng)計(jì)單元,根據(jù)收集到的歷史數(shù)據(jù),統(tǒng)計(jì)每個(gè)子值域中伴隨某類(lèi)項(xiàng)目風(fēng)險(xiǎn)發(fā)生的項(xiàng)目指標(biāo)映射點(diǎn)的數(shù)量相對(duì)于 映射到該子值域中的所有項(xiàng)目指標(biāo)映射點(diǎn)的數(shù)量的比值,作為該類(lèi)項(xiàng)目風(fēng)險(xiǎn)出現(xiàn)的風(fēng)險(xiǎn)概率,以及 計(jì)算單元,根據(jù)上述代表值與統(tǒng)計(jì)后的上述風(fēng)險(xiǎn)概率,進(jìn)行歸一化處理,作為訓(xùn)練數(shù)據(jù),制作項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型。
11.根據(jù)權(quán)利要求10所述的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置,其特征在于, 上述分割單元將映射到某個(gè)子值域中的樣本數(shù)量與規(guī)定的數(shù)量閾值相比較,根據(jù)比較結(jié)果調(diào)整分割的子值域的大小。
12.根據(jù)權(quán)利要求10所述的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置,其特征在于, 還包括驗(yàn)證單元,將歷史數(shù)據(jù)中的一部分?jǐn)?shù)據(jù)作為驗(yàn)證數(shù)據(jù),代入項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型來(lái)得到驗(yàn)證用預(yù)測(cè)風(fēng)險(xiǎn)概率,并計(jì)算該驗(yàn)證用預(yù)測(cè)風(fēng)險(xiǎn)概率與驗(yàn)證數(shù)據(jù)的歷史風(fēng)險(xiǎn)概率之差相對(duì)于歷史風(fēng)險(xiǎn)概率的百分比,在上述百分比低于規(guī)定驗(yàn)證閾值的情況下,不使用該項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型進(jìn)行風(fēng)險(xiǎn)評(píng)價(jià)。
13.根據(jù)權(quán)利要求10所述的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置,其特征在于, 還包括評(píng)價(jià)單元,利用上述計(jì)算單元所計(jì)算出的項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型對(duì)新的軟件項(xiàng)目進(jìn)行風(fēng)險(xiǎn)評(píng)價(jià),得到預(yù)測(cè)風(fēng)險(xiǎn)概率。
14.根據(jù)權(quán)利要求10所述的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置,其特征在于, 每當(dāng)新的軟件項(xiàng)目完成之后,上述收集單元收集該軟件項(xiàng)目的與項(xiàng)目指標(biāo)和項(xiàng)目風(fēng)險(xiǎn)有關(guān)的信息,作為歷史數(shù)據(jù),重新制作項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型。
15.根據(jù)權(quán)利要求10所述的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置,其特征在于, 上述分割單元取每個(gè)子值域的中心值作為該子值域的代表值。
16.根據(jù)權(quán)利要求10所述的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置,其特征在于, 還包括相關(guān)度分析單元,上述相關(guān)度分析單元根據(jù)上述統(tǒng)計(jì)單元統(tǒng)計(jì)出來(lái)的、每個(gè)子值域中伴隨某類(lèi)項(xiàng)目風(fēng)險(xiǎn)發(fā)生的某類(lèi)項(xiàng)目指標(biāo)的出現(xiàn)次數(shù),計(jì)算該某類(lèi)項(xiàng)目風(fēng)險(xiǎn)與該某類(lèi)項(xiàng)目指標(biāo)之間的相關(guān)度指標(biāo),將相關(guān)度指標(biāo)在規(guī)定的相關(guān)度閾值以上的項(xiàng)目指標(biāo)作為相關(guān)項(xiàng)目指標(biāo), 上述分割單元僅將上述相關(guān)項(xiàng)目指標(biāo)所映射的值域作為m維向量空間進(jìn)行分割。
17.根據(jù)權(quán)利要求16所述的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置,其特征在于, 上述相關(guān)度分析單元每一定時(shí)期將相對(duì)某類(lèi)項(xiàng)目風(fēng)險(xiǎn)而放棄的項(xiàng)目指標(biāo)重新用于評(píng)價(jià)模型的建立,來(lái)建立臨時(shí)評(píng)價(jià)模型,并且將利用臨時(shí)評(píng)價(jià)模型得到的風(fēng)險(xiǎn)評(píng)價(jià)結(jié)果與利用原評(píng)價(jià)模型得到的風(fēng)險(xiǎn)評(píng)價(jià)結(jié)果相比較,在臨時(shí)評(píng)價(jià)模型得到的風(fēng)險(xiǎn)評(píng)價(jià)結(jié)果比原評(píng)價(jià)模型得到的風(fēng)險(xiǎn)評(píng)價(jià)結(jié)果更加接近歷史風(fēng)險(xiǎn)概率時(shí),將規(guī)定的相關(guān)度閾值調(diào)整為該放棄的項(xiàng)目指標(biāo)所對(duì)應(yīng)的相關(guān)度。
18.根據(jù)權(quán)利要求10所述的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)裝置,其特征在于, 上述計(jì)算單元利用支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)或K近鄰算法KNN,對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行建模處理,來(lái)制作項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型。 ·
全文摘要
本發(fā)明的目的在于提供一種能夠建立風(fēng)險(xiǎn)出現(xiàn)概率判斷的準(zhǔn)確度更高的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法。本發(fā)明的軟件項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)方法包括收集步驟,收集多個(gè)樣本的關(guān)于項(xiàng)目指標(biāo)和項(xiàng)目風(fēng)險(xiǎn)的歷史數(shù)據(jù);分割步驟,將項(xiàng)目指標(biāo)所映射的值域分割為多個(gè),針對(duì)每個(gè)子值域取代表值,上述值域是m維向量空間;統(tǒng)計(jì)步驟,根據(jù)收集到的歷史數(shù)據(jù),統(tǒng)計(jì)每個(gè)子值域中伴隨某類(lèi)項(xiàng)目風(fēng)險(xiǎn)發(fā)生的項(xiàng)目指標(biāo)映射點(diǎn)的數(shù)量相對(duì)于映射到該子值域中的所有項(xiàng)目指標(biāo)映射點(diǎn)的數(shù)量的比值,作為該類(lèi)項(xiàng)目風(fēng)險(xiǎn)出現(xiàn)的風(fēng)險(xiǎn)概率,以及計(jì)算步驟,根據(jù)代表值與統(tǒng)計(jì)后的上述風(fēng)險(xiǎn)概率,進(jìn)行歸一化處理,作為訓(xùn)練數(shù)據(jù),制作項(xiàng)目風(fēng)險(xiǎn)評(píng)價(jià)模型;將模型用于新項(xiàng)目的風(fēng)險(xiǎn)評(píng)價(jià)。
文檔編號(hào)G06Q10/06GK103208039SQ20121000975
公開(kāi)日2013年7月17日 申請(qǐng)日期2012年1月13日 優(yōu)先權(quán)日2012年1月13日
發(fā)明者張玄 申請(qǐng)人:株式會(huì)社日立制作所