麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

數(shù)據(jù)存儲(chǔ)方法和裝置的制作方法

文檔序號(hào):6377964閱讀:286來源:國(guó)知局
專利名稱:數(shù)據(jù)存儲(chǔ)方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計(jì)算機(jī)云存儲(chǔ)領(lǐng)域,尤其涉及一種數(shù)據(jù)存儲(chǔ)方法和裝置。
背景技術(shù)
云存儲(chǔ)是在云計(jì)算概念上延伸和發(fā)展出來的一個(gè)新的概念,是指通過集群應(yīng)用、 網(wǎng)格技術(shù)或分布式文件系統(tǒng)等功能,將網(wǎng)絡(luò)中大量各種不同類型的存儲(chǔ)設(shè)備通過應(yīng)用軟件集合起來協(xié)同工作,共同對(duì)外提供數(shù)據(jù)存儲(chǔ)和業(yè)務(wù)訪問功能的一個(gè)系統(tǒng)。云存儲(chǔ)是一個(gè)以數(shù)據(jù)存儲(chǔ)和管理為核心的云計(jì)算系統(tǒng),是對(duì)現(xiàn)有存儲(chǔ)方式的一種變革,也就是“存儲(chǔ)即服務(wù)”。與云計(jì)算系統(tǒng)相比,云存儲(chǔ)可以認(rèn)為是配置了大容量存儲(chǔ)空間的一個(gè)云計(jì)算系統(tǒng)。從架構(gòu)模型來看,云存儲(chǔ)系統(tǒng)系統(tǒng)比云計(jì)算系統(tǒng)多了一個(gè)存儲(chǔ)層,同時(shí),在基礎(chǔ)管理也多了很多與數(shù)據(jù)管理和數(shù)據(jù)安全有關(guān)的功能。
對(duì)數(shù)據(jù)而言,數(shù)據(jù)的語(yǔ)義就是對(duì)數(shù)據(jù)的描述,而關(guān)于數(shù)據(jù)的描述也稱為元數(shù)據(jù),所以,如果一個(gè)數(shù)據(jù)有語(yǔ)義,意味著這個(gè)數(shù)據(jù)有形式化的描述,或說其元數(shù)據(jù)表示語(yǔ)言有形式化的語(yǔ)義。
元數(shù)據(jù)是數(shù)據(jù)的數(shù)據(jù),主要是用來描述網(wǎng)絡(luò)資料屬性的有關(guān)信息,用來支持如資源位置,資源尋找、文件記錄、評(píng)價(jià)、過濾等功能。對(duì)關(guān)系數(shù)據(jù),元數(shù)據(jù)是庫(kù)表結(jié)構(gòu)DBShcema, 因?yàn)樗枋隽藬?shù)據(jù)庫(kù)中數(shù)據(jù)所屬的字段名以及其他的約束,如數(shù)據(jù)類型,它的數(shù)據(jù)和語(yǔ)義是分離的,且其語(yǔ)義是非形式化的,開發(fā)人員根據(jù)對(duì)DBShcema的理解寫應(yīng)用程序,也就是說,語(yǔ)義是硬編碼在程序中的。發(fā)明內(nèi)容
本發(fā)明提供了一種數(shù)據(jù)存儲(chǔ)方法和裝置,解決了云存儲(chǔ)系統(tǒng)中數(shù)據(jù)存儲(chǔ)的問題。
一種數(shù)據(jù)存儲(chǔ)方法,包括
對(duì)網(wǎng)頁(yè)信息進(jìn)行分析處理;
根據(jù)分析處理結(jié)果,構(gòu)建并存儲(chǔ)本體語(yǔ)言(OWL)本體。
優(yōu)選的,所述對(duì)網(wǎng)頁(yè)信息進(jìn)行分析處理包括
進(jìn)行網(wǎng)頁(yè)抓取;
對(duì)抓取得到的網(wǎng)頁(yè)內(nèi)的數(shù)據(jù)進(jìn)行分詞處理,并對(duì)分詞處理后得到的詞語(yǔ)進(jìn)行分類和統(tǒng)計(jì)。
優(yōu)選的,所述根據(jù)分析處理結(jié)果,構(gòu)建并存儲(chǔ)OWL本體的步驟具體為
對(duì)所述詞語(yǔ)構(gòu)建OWL本體,將所述本體存儲(chǔ)于預(yù)置的存儲(chǔ)環(huán)境中。
優(yōu)選的,所述對(duì)網(wǎng)頁(yè)信息進(jìn)行分析處理的步驟之前,還包括
配置云存儲(chǔ)環(huán)境作為所述OWL本體的存儲(chǔ)環(huán)境。
優(yōu)選的,所述根據(jù)分析處理結(jié)果,構(gòu)建并存儲(chǔ)OWL本體的步驟之后,還包括
根據(jù)所述OWL本體,以可擴(kuò)展標(biāo)記語(yǔ)言(XML)形式重新描述網(wǎng)頁(yè)內(nèi)容。
優(yōu)選的,所述根據(jù)分析處理結(jié)果,構(gòu)建并存儲(chǔ)OWL本體的步驟之后,還包括3
根據(jù)推理擴(kuò)充所述OWL本體。
本發(fā)明還提供了一種數(shù)據(jù)存儲(chǔ)裝置,包括
網(wǎng)頁(yè)分析模塊,用于對(duì)網(wǎng)頁(yè)信息進(jìn)行分析處理;
OffL本體構(gòu)建模塊,用于根據(jù)分析處理結(jié)果,構(gòu)建并存儲(chǔ)OWL本體。
優(yōu)選的,上述數(shù)據(jù)存儲(chǔ)裝置還包括
配置模塊,用于配置云存儲(chǔ)環(huán)境作為所述OWL本體的存儲(chǔ)環(huán)境。
優(yōu)選的,上述數(shù)據(jù)存儲(chǔ)裝置還包括
標(biāo)注模塊,用于根據(jù)所述OWL本體,以XML形式重新描述網(wǎng)頁(yè)內(nèi)容。
優(yōu)選的,上述數(shù)據(jù)存儲(chǔ)裝置包括
推理模塊,用于根據(jù)推理擴(kuò)充所述OWL本體。
本發(fā)明提供了一種數(shù)據(jù)存儲(chǔ)方法和裝置,對(duì)網(wǎng)頁(yè)信息進(jìn)行分析處理,根據(jù)分析處理結(jié)果,構(gòu)建并存儲(chǔ)OWL本體,以O(shè)WL本體的形式存儲(chǔ)數(shù)據(jù),解決了云存儲(chǔ)系統(tǒng)中數(shù)據(jù)存儲(chǔ)的問題。


圖I為本發(fā)明的實(shí)施例一提供的一種數(shù)據(jù)存儲(chǔ)方法的原理圖2為本發(fā)明的實(shí)施例一提供的一種數(shù)據(jù)存儲(chǔ)方法的流程圖3為本發(fā)明的實(shí)施例二提供的一種數(shù)據(jù)存儲(chǔ)裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
為了解決云存儲(chǔ)系統(tǒng)中數(shù)據(jù)存儲(chǔ)的問題,本發(fā)明的實(shí)施例提供了一種數(shù)據(jù)存儲(chǔ)方法和裝置。下文中將結(jié)合附圖對(duì)本發(fā)明的實(shí)施例進(jìn)行詳細(xì)說明。需要說明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互任意組合。
為了方便理解本發(fā)明的實(shí)施例所提供的技術(shù)方案,首先對(duì)OWL本體進(jìn)行說明。
傳統(tǒng)的科學(xué)計(jì)算集群系統(tǒng)需要3套配套的互連網(wǎng)絡(luò)來對(duì)XML數(shù)據(jù)進(jìn)行描述,元數(shù)據(jù)是XMLSchema,因?yàn)樗x了 XML文檔的標(biāo)簽和結(jié)構(gòu),描述了 XML實(shí)例文檔中數(shù)據(jù)的類型等信息,其語(yǔ)義和數(shù)據(jù)是在一起的,但語(yǔ)義是隱式的和非形式化的。開發(fā)人員根據(jù)對(duì) XMLShcema的理解寫應(yīng)用程序,同樣,語(yǔ)義是硬編碼在程序中的。
而對(duì)RDF數(shù)據(jù),其元數(shù)據(jù)在RDFShcema或表達(dá)能力更強(qiáng)的本體中,因?yàn)镽DF文檔中的詞匯由RDFSchema或本體定義,而RDFShcema和本體都是一種形式化的語(yǔ)言,所以說,RDF 數(shù)據(jù)具有形式化語(yǔ)義。對(duì)RDF應(yīng)用程序,開發(fā)人員根據(jù)對(duì)RDFShcema或本體的理解寫程序, 而本體其實(shí)就是語(yǔ)義所在。所以,語(yǔ)義、元數(shù)據(jù)和本體三者是緊密關(guān)聯(lián)的概念。
本體是共享概念模型的明確的形式化規(guī)范說明。(I)概念化 (Conceptualization):指通過抽象出客觀世界中一些現(xiàn)象的相關(guān)概念而得到的概述模型;(2)明確(Explicit):指所使用的概念及其約束都有明確的定義;(3)形式化(Formal):指本體是計(jì)算機(jī)可讀的(即能被計(jì)算機(jī)處理);(4)共享(Share):本體中反映的知識(shí)是其使用者共同認(rèn)可的。
本體的目標(biāo)是捕獲相關(guān)的領(lǐng)域的知識(shí),提供對(duì)該領(lǐng)域知識(shí)的共同理解,確定該領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同層次的形式化模式上給出這些詞匯和詞匯之間相互關(guān)系的明確定義。
本體是領(lǐng)域(可以是特定領(lǐng)域的,也可以是普遍范圍的)內(nèi)部不同主體(人、應(yīng)用系統(tǒng)等)之間進(jìn)行交流(對(duì)話、互操作、共享等)的一種語(yǔ)義基礎(chǔ),即由本體提供一種明確定義的共識(shí)。
目前,本體提供的這種共識(shí)更主要的是為機(jī)器服務(wù),而機(jī)器并不能像人類一樣理解自然語(yǔ)言中表達(dá)的語(yǔ)義。目前的計(jì)算機(jī)也只能把文本看成字符串進(jìn)行處理,因此,在計(jì)算機(jī)領(lǐng)域討論本體,就要討論本體究竟是如何表達(dá)共識(shí)的,也就是概念的形式化問題。這涉及到本體的描述語(yǔ)言、本體的建設(shè)方法等具體研究?jī)?nèi)容,與此同時(shí),可以認(rèn)為構(gòu)造本體的目標(biāo)是捕獲相關(guān)的領(lǐng)域的知識(shí),提供對(duì)該領(lǐng)域知識(shí)的共同理解,確定該領(lǐng)域內(nèi)共同認(rèn)可的詞匯, 并從不同層次的形式化模式上給出這些詞匯和詞匯之間相互關(guān)系的明確定義。
基于本體的語(yǔ)義模型表示的支持對(duì)于編碼語(yǔ)言的選擇,目前較為合理的是WC3組織定義的WOL語(yǔ)言。WOL是本體論Web語(yǔ)言(Ontology Web Language)的字母縮寫,其設(shè)計(jì)的最終目的是提供一種可以用于各種應(yīng)用的語(yǔ)言,這些應(yīng)用需要理解內(nèi)容,從而代替只是采用人類易讀的形式來表達(dá)內(nèi)容。OWL能夠被用于清晰地表達(dá)詞匯表中的詞條的含義以及這些詞條之間的關(guān)系,而這種對(duì)詞條和它們之間的關(guān)系的表達(dá)就稱作本體。
W3C組織開發(fā)語(yǔ)義網(wǎng)的目的是能夠在互聯(lián)網(wǎng)上進(jìn)行更結(jié)構(gòu)化的智能處理,OffL從語(yǔ)義層次的角度對(duì)Web中的信息進(jìn)行描述時(shí),運(yùn)用了 XML語(yǔ)法和XML Schema提供的對(duì)文檔結(jié)構(gòu)的描述功能,而這些又是建立在RDF對(duì)數(shù)據(jù)的精確定義和RDFS提供的語(yǔ)義描述機(jī)制基礎(chǔ)上的,所以可以說OWL集中了 XML和RDF的優(yōu)點(diǎn),具有強(qiáng)大的語(yǔ)義描述能力。
OffL的理論基礎(chǔ)來源于人工智能知識(shí)表示領(lǐng)域?qū)γ枋鲞壿嬮L(zhǎng)達(dá)近20年的研究。 描述邏輯代表了一類基于邏輯的知識(shí)表示語(yǔ)言,其典型特征是通過描述概念以及概念之間的關(guān)系來表達(dá)知識(shí),典型的應(yīng)用于定義術(shù)語(yǔ)(terminology)、分類目錄(taxonomy)、本體 (ontology)、數(shù)據(jù)的概念建模等。OWL本體的抽象語(yǔ)法由注釋、公理和事實(shí)三部分組成,注釋用于描述本體的外在信息(如本體名、作者等),以及對(duì)其他本體的導(dǎo)入信息。公理和事實(shí)是本體的主要組成部分,提供了類、屬性和個(gè)體的信息。OWL的形式基礎(chǔ)是描述邏輯,其類和屬性分別對(duì)應(yīng)著描述邏輯的概念和角色(Role)。OWL的本體由公理集和事實(shí)集組成,正對(duì)應(yīng)著描述邏輯的知識(shí)庫(kù)由TBox和ABox組成。
下面結(jié)合附圖,對(duì)本發(fā)明的實(shí)施例一進(jìn)行說明。
本發(fā)明實(shí)施例提供了一種數(shù)據(jù)存儲(chǔ)方法,使用該方法完成云存儲(chǔ)系統(tǒng)中數(shù)據(jù)存儲(chǔ)的原理如圖I所示,具體流程如圖2所示,包括
步驟201、配置云存儲(chǔ)環(huán)境作為OWL本體的存儲(chǔ)環(huán)境;
步驟202、對(duì)網(wǎng)頁(yè)信息進(jìn)行分析處理;
本步驟中,首先對(duì)網(wǎng)頁(yè)進(jìn)行抓取,優(yōu)選的,可通過搭建nutch環(huán)境進(jìn)行網(wǎng)頁(yè)抓取; 然后,對(duì)抓取得到的網(wǎng)頁(yè)內(nèi)的數(shù)據(jù)進(jìn)行分詞處理,并對(duì)分詞處理后得到的詞語(yǔ)進(jìn)行分類和統(tǒng)計(jì)。
步驟203、根據(jù)分析處理結(jié)果,構(gòu)建并存儲(chǔ)OWL本體;
本步驟中,對(duì)所述詞語(yǔ)構(gòu)建OWL本體,將所述本體存儲(chǔ)于預(yù)置的存儲(chǔ)環(huán)境中。
以下為一個(gè)構(gòu)建OWL本體的具體示例
權(quán)利要求
1.一種數(shù)據(jù)存儲(chǔ)方法,其特征在于,包括 對(duì)網(wǎng)頁(yè)信息進(jìn)行分析處理; 根據(jù)分析處理結(jié)果,構(gòu)建并存儲(chǔ)本體語(yǔ)言(OWL)本體。
2.根據(jù)權(quán)利要求I所述的數(shù)據(jù)存儲(chǔ)方法,其特征在于,所述對(duì)網(wǎng)頁(yè)信息進(jìn)行分析處理包括 進(jìn)行網(wǎng)頁(yè)抓取; 對(duì)抓取得到的網(wǎng)頁(yè)內(nèi)的數(shù)據(jù)進(jìn)行分詞處理,并對(duì)分詞處理后得到的詞語(yǔ)進(jìn)行分類和統(tǒng)計(jì)。
3.根據(jù)權(quán)利要求2所述的數(shù)據(jù)存儲(chǔ)方法,其特征在于,所述根據(jù)分析處理結(jié)果,構(gòu)建并存儲(chǔ)OWL本體的步驟具體為 對(duì)所述詞語(yǔ)構(gòu)建OWL本體,將所述本體存儲(chǔ)于預(yù)置的存儲(chǔ)環(huán)境中。
4.根據(jù)權(quán)利要求3所述的數(shù)據(jù)存儲(chǔ)方法,其特征在于,所述對(duì)網(wǎng)頁(yè)信息進(jìn)行分析處理的步驟之前,還包括 配置云存儲(chǔ)環(huán)境作為所述OWL本體的存儲(chǔ)環(huán)境。
5.根據(jù)權(quán)利要求3所述的數(shù)據(jù)存儲(chǔ)方法,其特征在于,所述根據(jù)分析處理結(jié)果,構(gòu)建并存儲(chǔ)OWL本體的步驟之后,還包括 根據(jù)所述OWL本體,以可擴(kuò)展標(biāo)記語(yǔ)言(XML)形式重新描述網(wǎng)頁(yè)內(nèi)容。
6.根據(jù)權(quán)利要求3所述的數(shù)據(jù)存儲(chǔ)方法,其特征在于,所述根據(jù)分析處理結(jié)果,構(gòu)建并存儲(chǔ)OWL本體的步驟之后,還包括 根據(jù)推理擴(kuò)充所述OWL本體。
7.一種數(shù)據(jù)存儲(chǔ)裝置,其特征在于,包括 網(wǎng)頁(yè)分析模塊,用于對(duì)網(wǎng)頁(yè)信息進(jìn)行分析處理; OffL本體構(gòu)建模塊,用于根據(jù)分析處理結(jié)果,構(gòu)建并存儲(chǔ)OWL本體。
8.根據(jù)權(quán)利要求7所述的數(shù)據(jù)存儲(chǔ)裝置,其特征在于,該裝置還包括配置模塊,用于配置云存儲(chǔ)環(huán)境作為所述OWL本體的存儲(chǔ)環(huán)境。
9.根據(jù)權(quán)利要求7所述的數(shù)據(jù)存儲(chǔ)裝置,其特征在于,該裝置還包括標(biāo)注模塊,用于根據(jù)所述OWL本體,以XML形式重新描述網(wǎng)頁(yè)內(nèi)容。
10.根據(jù)權(quán)利要求7所述的數(shù)據(jù)存儲(chǔ)裝置,其特征在于,該裝置還包括推理模塊,用于根據(jù)推理擴(kuò)充所述OWL本體。
全文摘要
本發(fā)明提供了一種數(shù)據(jù)存儲(chǔ)方法和裝置。涉及計(jì)算機(jī)云存儲(chǔ)領(lǐng)域;解決了云存儲(chǔ)系統(tǒng)中數(shù)據(jù)存儲(chǔ)的問題。該方法包括對(duì)網(wǎng)頁(yè)信息進(jìn)行分析處理;根據(jù)分析處理結(jié)果,構(gòu)建并存儲(chǔ)OWL本體。本發(fā)明提供的技術(shù)方案適用于云存儲(chǔ)系統(tǒng),實(shí)現(xiàn)了本體形式的數(shù)據(jù)存儲(chǔ)。
文檔編號(hào)G06F17/30GK102932417SQ20121036796
公開日2013年2月13日 申請(qǐng)日期2012年9月28日 優(yōu)先權(quán)日2012年9月28日
發(fā)明者張現(xiàn)忠, 顏秉珩, 張俊, 崔贏 申請(qǐng)人:浪潮(北京)電子信息產(chǎn)業(yè)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
主站蜘蛛池模板: 临猗县| 康定县| 赤城县| 鄄城县| 梁平县| 昌乐县| 怀来县| 和林格尔县| 曲周县| 淳化县| 大田县| 贵南县| 桃园县| 临高县| 灵台县| 光泽县| 北辰区| 来凤县| 安阳市| 汉中市| 泰来县| 道孚县| 襄垣县| 永川市| 郎溪县| 洪江市| 三原县| 武川县| 绍兴市| 会泽县| 民丰县| 静海县| 岢岚县| 金寨县| 广水市| 灌阳县| 昆明市| 景泰县| 岢岚县| 体育| 高邑县|