本發(fā)明涉及數(shù)據(jù)處理,具體涉及一種分布式數(shù)據(jù)安全存儲方法、裝置及系統(tǒng)。
背景技術(shù):
1、分布式存儲系統(tǒng),是將數(shù)據(jù)分散存儲在多臺獨立的設(shè)備上。傳統(tǒng)的網(wǎng)絡(luò)存儲系統(tǒng)采用集中的存儲服務(wù)器存放所有數(shù)據(jù),存儲服務(wù)器成為系統(tǒng)性能的瓶頸,也是可靠性和安全性的焦點,不能滿足大規(guī)模存儲應(yīng)用的需要。分布式網(wǎng)絡(luò)存儲系統(tǒng)采用可擴展的系統(tǒng)結(jié)構(gòu),利用多臺存儲服務(wù)器分擔(dān)存儲負(fù)荷,利用位置服務(wù)器定位存儲信息,它不但提高了系統(tǒng)的可靠性、可用性和存取效率,還易于擴展。
2、分布式存儲系統(tǒng)也存在一些安全隱患,由于節(jié)點眾多、結(jié)構(gòu)不固定、分布廣泛等特點,難以有效保證存儲器中實際數(shù)據(jù)的安全性。當(dāng)單個節(jié)點出現(xiàn)損害時可能會導(dǎo)致數(shù)據(jù)缺失,因此往往需要在數(shù)據(jù)存儲時同步備份至其余節(jié)點,可以降低單節(jié)點故障造成的影響,也可以保證數(shù)據(jù)的可恢復(fù)性,保證數(shù)據(jù)的安全。
3、現(xiàn)有技術(shù)中,通過結(jié)合節(jié)點異構(gòu)性與多副本機制提高分布式存儲系統(tǒng)數(shù)據(jù)的安全性,但是現(xiàn)有方法對異構(gòu)性的量化僅從功能上的異同進行量化,缺少對數(shù)據(jù)本身的分析,導(dǎo)致負(fù)載不均衡以及備份數(shù)量上的冗余,使得分布式存儲系統(tǒng)的安全性和冗余度不能達到很好的平衡。
技術(shù)實現(xiàn)思路
1、為了解決現(xiàn)有技術(shù)中分布式存儲系統(tǒng)的安全性和冗余度不能較好平衡的技術(shù)問題,本發(fā)明的目的在于提供一種分布式數(shù)據(jù)安全存儲方法、裝置及系統(tǒng),所采用的技術(shù)方案具體如下:
2、第一方面,提供一種分布式數(shù)據(jù)安全存儲方法,所述方法包括:
3、步驟s1:獲取分布式數(shù)據(jù)存儲系統(tǒng)中的節(jié)點信息;
4、步驟s2:根據(jù)節(jié)點間的功能差異度、交互情況,獲取任意兩個節(jié)點的差異度;
5、步驟s3:根據(jù)待備份數(shù)據(jù)的安全性需求、所屬節(jié)點與可選擇的節(jié)點間的差異度聚集情況,獲取待備份數(shù)據(jù)的待選備份節(jié)點;
6、步驟s4:根據(jù)待選備份節(jié)點的活躍性、存儲情況,從待選備份節(jié)點中篩選出最終備份節(jié)點;
7、步驟s5:將待備份數(shù)據(jù)同步存入所有最終備份節(jié)點中,完成分布式數(shù)據(jù)安全存儲。
8、進一步地,所述步驟s1中獲取分布式數(shù)據(jù)存儲系統(tǒng)中的節(jié)點信息具體包括:
9、對任意分布式數(shù)據(jù)存儲系統(tǒng),將任意計算機作為一個節(jié)點,將任意節(jié)點拆分為功能獨立的不同組件,獲取每個節(jié)點的組件集合;
10、獲取任意節(jié)點的軟件或硬件具有的漏洞集合。
11、進一步地,所述步驟s2具體包括:
12、根據(jù)任意兩個節(jié)點的交集和并集的組件數(shù)量、該兩個節(jié)點的交集和并集的漏洞數(shù)量,獲取該兩個節(jié)點的功能差異度;
13、根據(jù)該兩個節(jié)點互相傳輸?shù)臄?shù)據(jù)量、該兩個節(jié)點的所有存在數(shù)據(jù)傳輸?shù)墓?jié)點集合的交集節(jié)點數(shù)量、并集節(jié)點數(shù)量,獲取該兩個節(jié)點的交互情況;
14、根據(jù)該兩個節(jié)點的功能差異度、交互情況,獲取該兩個節(jié)點的差異度。
15、進一步地,所述該兩個節(jié)點互相傳輸?shù)臄?shù)據(jù)量與該兩個節(jié)點的差異度負(fù)相關(guān),所述交集節(jié)點數(shù)量、所述并集節(jié)點數(shù)量的比值與該兩個節(jié)點的差異度負(fù)相關(guān)。
16、進一步地,所述步驟s3具體包括:
17、根據(jù)節(jié)點類數(shù)量、待備份數(shù)據(jù)經(jīng)加密及驗證的步驟數(shù)量、所有數(shù)據(jù)中經(jīng)加密及驗證最多的步驟數(shù)量,獲取待備份數(shù)據(jù)的備份數(shù)量;
18、根據(jù)待備份數(shù)據(jù)的備份數(shù)量、待備份數(shù)據(jù)所屬節(jié)點與每個節(jié)點類中所有節(jié)點的平均差異度、待選備份方案任意兩個節(jié)點類的所有節(jié)點間的平均差異度,獲取待備份數(shù)據(jù)與任意待選備份方案的綜合差異度;
19、記綜合差異度最大的待選備份方案的所有節(jié)點作為待選備份節(jié)點。
20、進一步地,所述節(jié)點類具體為:對節(jié)點的無向帶權(quán)網(wǎng)狀圖進行聚類,直到所有節(jié)點加入聚類簇或被標(biāo)記為噪聲點,將任意噪聲點、任意聚類簇均記為一個節(jié)點類;所述待選備份方案由多個節(jié)點類組合構(gòu)成。
21、進一步地,所述步驟s4具體為:根據(jù)備份當(dāng)天及前一天待選備份節(jié)點的數(shù)據(jù)存儲量、待選備份節(jié)點的已存儲量、待選備份節(jié)點的總存儲空間,獲取每個待選備份節(jié)點的適宜備份程度,記適宜備份程度最大的待選備份節(jié)點為最終備份節(jié)點。
22、進一步地,備份當(dāng)天相比備份前一天待選備份節(jié)點的數(shù)據(jù)存儲量的增長速度、待選備份節(jié)點的已存儲量與待選備份節(jié)點的總存儲空間之比均與待選備份節(jié)點的適宜備份程度負(fù)相關(guān)。
23、第二方面,本發(fā)明提供一種分布式數(shù)據(jù)安全存儲裝置,該裝置包括:
24、節(jié)點信息獲取模塊,用于獲取分布式數(shù)據(jù)存儲系統(tǒng)中的節(jié)點信息;
25、差異度獲取模塊,用于根據(jù)節(jié)點間的功能差異度、交互情況,獲取任意兩個節(jié)點的差異度;
26、待選備份節(jié)點獲取模塊,用于根據(jù)待備份數(shù)據(jù)的安全性需求、所屬節(jié)點與可選擇的節(jié)點間的差異度聚集情況,獲取待備份數(shù)據(jù)的待選備份節(jié)點;
27、最終備份節(jié)點獲取模塊,用于根據(jù)待選備份節(jié)點的活躍性、存儲情況,從待選備份節(jié)點中篩選出最終備份節(jié)點;
28、存儲執(zhí)行模塊,用于將待備份數(shù)據(jù)同步存入所有最終備份節(jié)點中。
29、第三方面,本發(fā)明提供一種分布式數(shù)據(jù)安全存儲系統(tǒng),所述系統(tǒng)包括上述的一種分布式數(shù)據(jù)安全存儲裝置,還包括由多個計算機組成的多個節(jié)點。
30、本發(fā)明有如下有益效果:本發(fā)明對分布式數(shù)據(jù)存儲系統(tǒng)中所有節(jié)點的差異進行分析,得到節(jié)點的無向帶權(quán)網(wǎng)狀圖,結(jié)合不同數(shù)據(jù)有不同保密需求的特點,確定任意數(shù)據(jù)的備份數(shù)量,并根據(jù)數(shù)據(jù)的存儲比以及活躍度,進一步獲取備份節(jié)點,使得存儲系統(tǒng)各節(jié)點可以均衡存儲,完成數(shù)據(jù)的多節(jié)點備份。本發(fā)明有利于在保證分布式數(shù)據(jù)存儲的安全性的前提下,盡可能降低冗余備份,最大程度提高備份效果,使得分布式存儲系統(tǒng)的安全性和冗余度達到很好的平衡。
1.一種分布式數(shù)據(jù)安全存儲方法,其特征在于,所述方法包括:
2.根據(jù)權(quán)利要求1所述一種分布式數(shù)據(jù)安全存儲方法,其特征在于,所述步驟s1中獲取分布式數(shù)據(jù)存儲系統(tǒng)中的節(jié)點信息具體包括:
3.根據(jù)權(quán)利要求2所述的一種分布式數(shù)據(jù)安全存儲方法,其特征在于,所述步驟s2具體包括:
4.根據(jù)權(quán)利要求3所述的一種分布式數(shù)據(jù)安全存儲方法,其特征在于,所述該兩個節(jié)點互相傳輸?shù)臄?shù)據(jù)量與該兩個節(jié)點的差異度負(fù)相關(guān),所述交集節(jié)點數(shù)量、所述并集節(jié)點數(shù)量的比值與該兩個節(jié)點的差異度負(fù)相關(guān)。
5.根據(jù)權(quán)利要求1所述的一種分布式數(shù)據(jù)安全存儲方法,其特征在于,所述步驟s3具體包括:
6.根據(jù)權(quán)利要求5所述的一種分布式數(shù)據(jù)安全存儲方法,其特征在于,所述節(jié)點類具體為:對節(jié)點的無向帶權(quán)網(wǎng)狀圖進行聚類,直到所有節(jié)點加入聚類簇或被標(biāo)記為噪聲點,將任意噪聲點、任意聚類簇均記為一個節(jié)點類;所述待選備份方案由多個節(jié)點類組合構(gòu)成。
7.根據(jù)權(quán)利要求1所述的一種分布式數(shù)據(jù)安全存儲方法,其特征在于,所述步驟s4具體為:根據(jù)備份當(dāng)天及前一天待選備份節(jié)點的數(shù)據(jù)存儲量、待選備份節(jié)點的已存儲量、待選備份節(jié)點的總存儲空間,獲取每個待選備份節(jié)點的適宜備份程度,記適宜備份程度最大的待選備份節(jié)點為最終備份節(jié)點。
8.根據(jù)權(quán)利要求7所述的一種分布式數(shù)據(jù)安全存儲方法,其特征在于,備份當(dāng)天相比備份前一天待選備份節(jié)點的數(shù)據(jù)存儲量的增長速度、待選備份節(jié)點的已存儲量與待選備份節(jié)點的總存儲空間之比均與待選備份節(jié)點的適宜備份程度負(fù)相關(guān)。
9.一種分布式數(shù)據(jù)安全存儲裝置,其特征在于,該裝置包括:
10.一種分布式數(shù)據(jù)安全存儲系統(tǒng),其特征在于,所述系統(tǒng)包括權(quán)利要求9所述一種分布式數(shù)據(jù)安全存儲裝置,還包括由多個計算機組成的多個節(jié)點。