專利名稱:使用頁面集而提供信息搜索服務的服務器、方法和系統的制作方法
技術領域:
本發明涉及一種信息搜索服務,更確切的說,是一種使用頁面組而提供信息搜索服務的方法、系統和服務器。
背景技術:
隨著因特網的發展,網絡信息搜索技術已經得到了很大的發展,而使得大量的信息在網絡上可被處理和堆積,而且用戶可以又快又準地搜索到信息。網絡信息搜索技術使得用戶能夠使用web瀏覽器(網絡瀏覽器)輕松的從網上搜索到各種各樣的信息,例如圖片,聲音,電影圖像等。然而,搜索技術存在著一個不利的因素就是,隨著網址以幾何級數增長,它們無法提供用戶真正必需的信息。最常見的一種解決這種問題的方法就是使用搜索引擎。搜索引擎是一種被設計用來幫助發現信息的程序,這些信息存儲在計算機系統中,例如存儲于公共或私人網絡或個人電腦內的萬維網。搜索引擎通過搜索程序,例如搜索機器人或者網絡蜘蛛,來創建網址信息的索引,并且將索引信息存儲到數據庫中。它允許用戶查詢符合特定規則的內容(特別是那些含有給定單詞或者短語的內容),并返回一個和特定規則相匹配的參考列表。搜索引擎使用網絡索引方法,網絡路徑方法和元搜索方法。網絡索引方法是一種最通用的搜索方法。它通過搜索程序例如搜索機器人或者網絡蜘蛛,來創建網址信息的索弓丨,并且將索引信息存儲到數據庫中,它允許用戶查詢符合特定規則的內容,并返回一個和特定規則相匹配的參考列表。網絡路徑方法按照主題和層次對因特網上的頁面進行分類以編輯一個數據庫,然后創建條目的路徑,它允許用戶選擇和需要信息最接近的條目,進而逐漸的縮小搜索的范圍。元搜索方法是一種高級網絡索引方法,它在網絡索引方法中創建一個可提供搜索服務的搜索引擎的列表,使得用戶可以選擇一個搜索引擎進行搜索。但是,這些搜索引擎各自都存在著以下的不足。網絡路徑方法不能獲得實質性的搜索結果,因為在搜索結果內只包含了相對少量的網頁。此外,網絡路徑方法搜索很耗時,因為它需要很多步驟來獲得信息。網絡索引方法和元搜索方法使得用戶在大量的搜索結果前感到困惑,而且其搜索結果可靠性很低,因為它們提供給用戶所有的頁面,包括查詢頁面。元搜索方法和網絡索引方法首先使用它們自己的算法來提供可靠性高的網頁。但是,這些頁面未必提供給用戶他們想要的信息,因為包括查詢在內的所有頁面都被提供了。例如,以上提及的搜索方法會提供書中一頁的存儲信息,而不會提供一本或多本書的存儲信息,而使得復雜搜索是不可能的。因此,要解決搜索結果的低可靠性問題,輔助內容,例如網絡咖啡館博客(Internet caf blog),或者信息服務,就被應用到搜索引擎中了。
發明內容
技術方案本發明提供了能夠提供信息捜索服務的ー種方法,系統和服務器,這種服務可以對符合特定規則的ー組頁面進行索引,并在這組頁面內進行搜索。有益效果
根據本發明,用戶可以又快又準的在因特網上查到信息,因為ー組網頁被分析用以創建ー個位置信息模式,使用位置信息模式將含有類似信息的網頁分組為多組,接著含有與查詢相關信息的多個頁面,也就是ー個代表頁面和一些低級別的頁面的形式被劃為ー組后再提供給用戶。
通過示意性實施例的詳細描述,本發明的以上及其他特征和優勢將更清楚,其中參照下述附圖圖I是根據本發明的一個實施例,使用一組頁面來提供信息捜索服務的系統的方框圖;圖2根據本發明的一個實施例,一個組搜索服務器的方框圖;圖3和4是說明根據本發明的一個實施例的URL(統ー資源定位符)模式和ー個URL模式樹(UP樹)的示意圖;圖5是根據本發明的一個實施例,使用一組頁面來提供信息捜索服務的方法的流程圖;以及圖6是根據本發明的一個實施例的一個組檢索結果。實施發明的最優方式根據本發明的ー個方面,它提供了ー種提供組搜索服務的方法,包括(a)通過分析所收集數據最初定位的位置信息來創建這些數據的位置信息模式;(b)根據已經創建的位置信息模式對所收集數據進行分組;以及(C)從數據組中選擇ー個與關鍵字相關的數據組并且提供一個組搜索結果。根據本發明的另ー個方面,它提供了在一個系統中提供一種組搜索服務的方法,該系統包括一個發送查詢并輸出搜索結果的用戶終端,ー個提供多個頁面的web服務器,以及ー個從用戶終端接收查詢并創建和發送搜索結果到用戶終端的組搜索服務器,該方法包括(a)從用戶終端接收查詢和查詢請求信號;(b)接收來自web服務器的網頁;(C)分析網頁以創建ー個URL模式,并且用該URL模式把這些網頁分到ー個網頁組;(d)從網頁組中提取索引,創建索引信息,并創建索引所參照的網頁組的URL信息;以及(e)比較查詢和索引來創建ー個組搜索結果并將該結果發送給用戶終端。根據本發明的另ー個方面,它提供了ー個提供組搜索服務的系統,該組捜索服務通過搜索在無線/有線網絡中多個網頁內的信息而獲得,系統包括ー個在無線/有線通訊網絡上實現網上沖浪的用戶終端,它通過傳送查詢和搜索請求信號來產生搜索請求,接收該請求對應的組搜索結果,并且輸出組搜索結果到顯示單元;一個從信息中創建網頁并提供網頁的web服務器;以及一個接收和分析網頁以創建URL模式,并使用URL模式而把網頁分組為網頁組,對網頁組進行索引,在網頁組中搜索信息并創建和傳送組搜索結果給用戶終端的組搜索服務器。 根據本發明的另一個方面,它提供了一個組搜索服務器,其包括一個位置信息模式生成模塊,它通過分析所收集數據最初定位的位置信息來創建這些數據的位置信息模式;一個網頁分組模塊,它根據已創建的位置信息模式將所收集數據分組為數據組;以及一個控制器,它從數據組中選擇一個與關鍵字相關的一個數據組并且提供一個組搜索結果O根據本發明的另一個方面,它提供了一個組搜索服務器,該服務器接收在無線/有線通訊網絡上實現網上沖浪的用戶終端發送的查詢和搜索請求,在web服務器提供的網頁中搜索信息,并發送搜索結果給用戶終端,該組搜索服務器包括一個網頁收集模塊,它執行網頁收集程序,用以自web服務器接收web服務器訪問無線/有線通訊網絡而獲得的網頁,并存儲這些網頁;一個URL模式生成模塊,它通過分析網頁收集模塊接收到的網頁來創建URL模式;一個網頁分組模塊,它利用URL模式生成模塊創建的URL模式將網頁分組為網頁組;一個索引管理模塊,它從網頁分組模塊分組的網頁組中提取索引,用以創建并存儲索引信息和索引所參照的網頁組的URL信息;一個查詢管理模塊,它根據收到的查詢和搜索請求信號而搜索索引信息,將具有與查詢相關的索引的網頁組的URL信息創建為組搜索結果,以及將組搜索結果傳送至用戶終端;以及一個控制器,它控制網頁收集模塊,URL模式生成模塊,網頁分組模塊,索引管理模塊,查詢管理模塊,使得組搜索服務器能夠使用網頁組來完成搜索,并通過無線/有線通訊網絡與客戶終端和web服務器進行通訊。
具體實施例方式現在用結合附圖,對本發明的示意性實施例進行詳細描述。圖I是根據本發明的一個實施例,使用頁面分組而提供信息搜索服務的系統的方框圖。根據本發明的一個實施例,使用頁面分組而提供信息搜索服務的系統包括一個用戶終端110,一個無線/有線通訊網絡120,一個web服務器130,一個組搜索服務器140,一個組搜索數據庫(此后都用DB來表示數據庫)141,一個索引服務器150,和一個索引數據庫 151。用戶終端110通過無線/有線通訊網絡120訪問組搜索服務器140,發送一個查詢和搜索請求信號,并接收來自組搜索服務器140的組搜索結果,再輸出組搜索結果到顯示單元。用戶終端110包括一個有線通訊單元,該單元包括一個因特網調制解調器,例如極高比特速率數字用戶線路(VDSL)調制解調器和電纜調制解調器,和/或一個移動通訊單元,該單元包括一個移動通訊調制解調器,例如碼分多址(CDMA) 2000調制解調器和寬帶CDMA(ff-CDMA)調制解調器。用戶終端110使用包含的通訊單元通過無線/有線通訊網絡120來訪問組搜索服務器140。用戶終端進一步包括一個包含一塊內存和一個微處理器的控制器。內存存放網絡瀏覽器程序,這些程序被用來接收用戶查詢,請求信息捜索,以及輸出捜索結果給顯示單元。微處理器控制用戶終端110的運行。 用戶終端110的例子包括一臺個人計算機(PC),例如一臺桌上電腦或者一臺膝上電腦,以及ー個通訊終端,例如個人數碼助理(PDA)、手機、個人通訊服務電話、掌上電腦、全球移動通訊系統(GSM)電話、W-CDMA手機、CDMA-2000手機和移動寬帶系統(MBS)手機。無線/有線通訊網絡120將用戶終端110、web服務器130、組搜索服務器140、索引服務器150連接起來,使得它們可以使用有線或無線的方式重復它們之間發送和接收的數據。web服務器130是ー個典型的網絡服務器,包括用網頁形式提供各種信息的多個計算機系統或計算機軟件。網絡服務器指一個計算機系統和計算機軟件(網絡服務器程序),它被連接到一個子單元,而與其他網絡服務器通過計算機網絡,例如企業內部互聯網或者因特網,進行通信,接收運行請求并提供運行結果。然而,除了網絡服務器程序,網絡服務器應該被解釋為包括運行在網絡服務器上的應用程序以及存儲在上面的各種數據庫。網絡服務器被具體化為根據操作系統,例如DOS、Windows, Linux、UNIX或者MacOS,而使用相應的網絡服務器程序。索引服務器150執行ー個數據收集程序,通常是ー個web機器人,從連接到無線/有線通訊網絡120的web服務器130上收集數據。索引服務器150定時更新收集的數據,且索引數據庫151使用一個翻轉文件或者類似的機制存放收集到的數據。組搜索服務器140與索引服務器150以及索引數據庫151相通訊以閱讀網絡數據,組搜索服務器140還分析網絡數據的位置信息以創建多種位置信息模式。位置信息是指包括收集到的網絡數據的因特網路徑。它優選包括網絡數據的統ー資源定位符(URLs)。它分析在位置信息模式之間的聯系以執行分組操作。上述過程能包括使用ー個URL模式樹而創建在多個不同URL模式之間的ー個聯系,還包括對具有相同URL模式分組域值的網頁進行分組。可選擇地或另外地,創建和URL模式分組的過程能包括參照ー個預定的URL模式路徑。組搜索服務器140提取在網頁組単元內的索引,創建由索引參照的網頁的索引信息和URL信息,并且在組搜索數據庫141內儲存索引信息和URL信息。當組搜索服務器140從用戶終端接收ー個查詢和ー個信息搜索需求時,它將該查詢與搜索相對比以創建關于組捜索結果的信息。組搜索結果與關于查詢的其他捜索結果一起,能被傳送至用戶終端110。組搜索服務器140將會參照圖2而被詳細描述。即使組捜索服務器140沒有從用戶接收到關于查詢的組搜索結果,它也能被用于提供一個關于一個確定關鍵字的組搜索結果。例如,它能使用ー個包含用戶查詢的更高水平的概念或一個關于用戶查詢的確定的關鍵字以提供一個組搜索結果。進ー步地,它能使用一個關于情報的關鍵字以提供一個組搜索結果。組搜索數據庫141儲存網頁組的索引信息和位置信息(包括URL信息),這些信息由組搜索服務器140所創建。它能進一歩地儲存組的中心詞。數據庫是指通過DBMS(數據庫管理系統)程序而在計算機系統的存儲區內形成的數據結構,在其中數據被取得、刪除、編輯和添加。數據庫能使用一個相關的DBMS而適應于本發明,例如,Oracle, Informix,Sybase, MS SQL (微軟結構查詢語言),或DB2的數據庫管理系統。數據庫包括存儲、取得、刪除、編輯和添加數據所需的域和元素。進一步地,組搜索數據庫141和索引數據庫151能彼此分開,或為完整一體。
圖2根據本發明的一個實施例,一個組搜索服務器的方框圖。一個組搜索服務器140是包括一個網頁收集模塊210、一個URL模式生成模塊220、一個網頁分組模塊230、一個索引管理模塊240、一個查詢管理模塊250和一個控制器260的網絡服務器。網頁收集模塊210通過無線/有線通訊網絡而訪問web服務器130以收集數據。網頁收集模塊210能選擇性地包括在組搜索服務器140內,以反映被位置信息所參照的數據的變化,該位置信息由索引服務器150所收集且存儲于索引數據庫151內。URL模式生成模塊220分析控制器260或網頁收集模塊210所需的網頁的URLs以創建URL模式。URL模式是指網頁的URL的預定模式,且其被創建以管理具有相同內容的一組網頁或以同樣模式寫成的一組網頁。在本發明中,相同網頁被分組和被管理以用于信息搜索。此時,URL模式被用作選擇相同網頁的一個標準。URL模式生成模塊220分析控制器260或網頁收集模塊210接收的網頁的URLs,以創建包括分組域的URL模式。例如,在由Neowiz公司提供的SayClub主頁服務器內,每一個ID (身份)的代表頁的URL被分析,ID被設置為一個分組域,因此創建了一個http: //hompy.sayclub. com/[ID]的URL模式。URL模式將會參照圖3而被詳細描述。除了分組域,URL模式能基于超文本傳輸協議(HyperText Markup Language, HTML)模版而創建,該模版由兩個網頁或網頁內容所共享。HTML模版是指通常使用的基礎結構,以使得網頁能夠易于被寫入。例如,它以標簽形式被書寫,如〈Table. · · ><TD>[text number]</TDXTD>[title]</TD>. · ·〈/TABLE〉,其常用于寫入網頁。寫入為網頁的一個HTML文件典型地是一個HTML標簽和一個文本的組合,它遵守HTML的語法。HTML文件由多個功能塊組成,如,菜單塊、用于與其他入口站點相連的連接塊、和一個用于包含內容的信息塊。功能塊經常用于網頁內,且因此用模版寫入以方便用戶。由同樣操作件創建的網頁能包含于多個由web服務器所管理的網頁內,而該服務器提供了公告服務、博客服務、最小化主頁服務及其類似物。即,共享一個相同HTML模版的多個網頁趨向于由相同的操作件所創建,且趨向于包含相同的內容。因為提供了公告服務、博客服務和最小化主頁服務的web服務器130使用相同的HTML模版以寫入由web服務器130所管理的最多的網頁,所以由相同web服務器130所管理的網頁共享同樣的HTML模版。相應地,共享同樣HTML模版的網頁能具有同樣的URL模式。基于所需URL模式之間的通過UP樹信息的聯系,網頁分組模塊230對由URL模式生成模塊220創建的不同URL模式進行分組,而且在URL模式組內對具有同樣分組域的網頁進行分組。即,網頁分組模塊230對URL模式進行分組,該URL模式與由URL模式生成模塊220創建的URL模式不同,但是它們又相互相關,基于所需URL模式之間的通過UP樹信息的聯系,網頁分組模塊230在URL模式組內對具有相同URL模式分組域值的網頁進行分組。例如,登記于SayClub主頁內網頁的URLs能夠概括為大約20種不同的URL模式。基于UP樹信息,這20種不同URL模式被分組在ー個單個組。在它們中,具有同一個用戶ID的網頁作為ー個分組域值而被分組在ー個網頁組內。相應地,當登記于SayClub主頁的網頁被依據用戶ID而分組,網頁的分組數等同于登記于SayClub主頁的用戶ID的數量。進一歩地,這能等同地應用于登記于Naver博客的網頁,以使得網頁的分組數等同于登記于Naver博客的用戶ID的數量。然而,在本發明中,用于分組網頁的標準不局限于分組域值。例如,能通過對分組域執行“和”或“或”操作的而對網頁分組。本發明可進ー步包括對在ー個索引和一個相應組之間的聯系進行評價,以對頁面組進行細分或改變,該索引由索引管理模塊240提取。例如,當自頁面組提取的索引涉及兩個或多個域時,頁面可被整合為ー個組或基于域而被細分兩個或多個子組。當從ー組頁面提取的ー個索引不正確地表示其內容,該組可被刪除以產生ー個可靠的搜索結果。索引管理模塊240從ー個由網頁分組模塊230分組的頁面組提取ー個索引,以及 存儲在組搜索數據庫141內網頁的索引信息和URL信息。即,索引管理模塊240從ー個頁面組提取ー個索引以創建索引信息,以及在組搜索數據庫141的索引數據庫151內儲存索引信息。另外,索引管理模塊240使用UP樹信息以創建網頁組的URL信息和在組搜索數據庫141內儲存URL信息。在從用戶終端110接收ー個查詢或關鍵字時,查詢管理模塊250搜索索引數據庫151,從組搜索數據庫141接收具有匹配查詢索引的網頁組信息和創建組捜索結果。在查詢或關鍵字與索引之間的匹配可通過使用指定術語詞典或共有信息(MI)值而執行。另外,可使用公知算法而執行。控制器260控制網頁收集模塊210、URL模式生成模塊220、網頁分組模塊230、索引管理模塊240和查詢管理模塊250,以使得組搜索服務器能夠使用ー組網頁進行查詢。另夕卜,控制器與索引服務器150和索引數據151進行通訊,從用戶終端110接收查詢搜索請求,和發送組捜索結果。圖3和圖4是根據本發明的一個實施例,對URL模式和UP樹的進行解釋的示意圖。圖3 說明了使用 Neowiz SayClub 主頁(http://hompy. sayclub. com,此后稱之為hompy)服務的用戶主頁的URL,以及其相關頁面的URL。用戶主頁包括ー些在用戶URL內含有其ID的網頁。在SayClub hompy, URL被表現為查詢形式,如被“變量名稱=變量值”跟隨的“◎”符號。相應地,在圖3中,當跟隨“targetmsrl =”的值被認為是確認用戶ID的標準吋,URL模式被如圖4所示而創建。另外,在由門戶站點所提供的私人博客服務或公告服務中,服務提供商的域名可被一個分隔符所跟隨用以區別用戶和公告。圖4是通過分析在hompy內網頁的URL而得到的URL的樹狀結構的模式。參照圖3,每ー個網頁在其URL內包括用戶的ID。因此,在網頁的URL中,“用戶ID”的部分可被轉換為[ID]的分組域,而包含在hompy內的“公告類型”部分可被轉換為[公告類型]的分組域。即使是分組域值變化了,而當URL瀏覽的內容實質上沒有改變時,分組域可被設置為[忽略]域,而[忽略]域在分組URL模式的過程中被忽略。基于分組域值的變化,可通過分析在相應組內文件的囊括和聯系而確定分組域之間的優先。
當URL模式通過上述過程而被創建,被創建的URL模式能被用于概括Neowizhompy所有用戶的網頁。分組域能自動地被形成于分析URL地址的過程中。在由門戶站點或社區站點提供的私人博客或公告中,URL模式被統一地按照服務提供商的策略而創建。在這種情況下,創建和對URL模式分組的過程能通過參照關于分組域的預定URL模式和路徑而被執行。圖5是根據本發明的一個實施例,使用一組頁面而提供信息搜索服務的方法的流程圖。 一個因特網用戶使用用戶終端以輸入一個信息搜索的查詢,且發送該查詢和搜索請求至組搜索服務器140(操作S410)。操作S410可被省略。即,一個組搜索服務器可通過分析儲存數據而被執行,而無需用戶輸入查詢或查詢請求。在從用戶終端110接收查詢和搜索請求信號后,組搜索服務器140從索引數據庫151接收關于網頁的信息(包括地址信息),而該索引數據庫151由索引服務器150所預先收集和編譯(操作S420)。組搜索服務器140可選擇性地操作網頁收集模塊210以從索引數據庫151接收附助材料。期間,根據一個預定方法,web機器人程序可被執行以接收網頁索引服務器150而存儲于索引數據庫151內。在從索引服務器150接收網頁后,組搜索服務器140分析網頁以創建URL模式(S430)。在創建URL模式后,基于通過UP樹信息獲得的URL模式與網頁組的聯系,而該網頁組在一組URL模式內具有同樣的URL模式的分組域值(操作S440),組搜索服務器140對不同的URL模式進行分組。在分組網頁后,組搜索服務器140從組單元內的網頁組提取索引,以創建索引信息和由索引參照的網頁組的URL信息(操作S450),以及在組搜索數據庫150內存儲索引信息和網頁組的URL信息(操作S460)。在組搜索數據庫150內存儲索引信息和網頁組的URL信息后,組搜索服務器140對接收自用戶終端110的查詢和存儲于組搜索數據庫150內的索引進行對比,進行搜索,創建和發送組搜索結果至用戶終端110 (操作S470)。在從組搜索服務器140接收搜索結果后,用戶終端110輸出搜索結果至顯示單元。根據本發明,即使是查詢沒有從用戶被輸出,也可提供組搜索服務。根據本發明,組搜索服務將多個網頁分組為一個網頁組,且搜索與該網頁相關的實體,而不是搜索包含于網頁內的一個術語。搜索服務可與公告搜索服務一起而被使用。最近,公告服務廣泛地用于網頁上,在其中用戶登記關于特定信息的材料,寫入信息的問題和解答。公告服務可包括含有比用戶搜索更多信息的網頁。相應地,當一個用戶輸入查詢以請求搜索,一個代表性的網頁和共享關于該查詢信息的低水平的公告網頁,被分組在一起以及以預定次序被提供,而不是簡單地提供包含該查詢的網頁。根據本發明的一個實施例,組搜索服務在下午中采取為公告服務。然而,本發明并不局限至此,而是可被應用為使用網頁組以進行搜索的多種服務。圖6是根據本發明的一個實施例,解釋組搜索結果的示意圖。在提供組搜索結果的方面,其輸出順序可取決于用戶查詢和關鍵字、組內文件的數目、在現實期間內組內文件數目的增加、組和組文件的創建時間或普及度之間的聯系,而所述普及度如用戶訪問單個組的數量。為了評價該聯系,評價技術可被使用,其中使用了在相應組內和預定術語路徑內,用戶使用查詢和關鍵字的頻次。普及度可取決于在相應組內文件查詢的數目,用戶訪問組的數目以及在預定時間內在相應組內創建的數據量。當一個用戶在網頁內的輸入窗口 510內輸入“psp”查詢,即輸出一個組搜索結果530,所述網頁輸出至用戶終端110以提供組搜索服務和選擇“搜索”。組搜索結果530按照“Neo rank order (新登記次序)”而在分類菜單520內被分類。用戶可在分類菜單520內的“相關文章次序”或“普及度次序”內對組搜索結果530進行分類。組搜索結果530可顯示網絡文件的名稱、文章名稱等以有效地提供信息。頁面組信息540可進一步包括關于頁面組分類和所囊括文件的數目的信息。另外,可提供單個頁面組內單個文件的清單550以方便用戶。進一步地,可提供關于單個頁面組來源信息的分類項560以有效地提供信息。雖然本發明被參照其說明性實施例而被描述,但是本領域技術人員能夠理解,在下述權利要求的范圍內,可以作出形式和細節上的多種變化,而不會脫離本發明的保護范圍。產業上的可利用性本發明能被有效地適用于提供信息搜索服務的方法、系統和服務器。
權利要求
1.一種組搜索服務器,包括 網頁收集模塊,執行網頁收集程序,用以接收網頁并存儲所述網頁; URL模式生成模塊,通過分析網頁收集模塊接收到的網頁的URL來創建包含為網頁分組的分組域的URL模式; 網頁分組模塊,它利用URL模式生成模塊創建的URL模式將網頁分組為網頁組;索引管理模塊,從網頁分組模塊分組的網頁組中提取索引,用以創建并存儲索引信息和索引所參照的網頁組的URL信息; 查詢管理模塊,在接收到查詢和搜索請求信號時搜索索引信息,將具有與所述查詢相關的索引的網頁組的URL信息創建為組搜索結果;以及 控制器,控制網頁收集模塊,URL模式生成模塊,網頁分組模塊,索引管理模塊和查詢管理模塊,使得組搜索服務器能夠使用網頁組來完成搜索; 其中,URL模式生成模塊使用網頁的URL生成分組域。
2.根據權利要求I所述的組搜索服務器,其中,URL模式生成模塊創建用作標準的URL模式,所述標準用于以預定模式對網頁分組,該預定模式由具有相同信息的網頁所共享。
3.根據權利要求I所述的組搜索服務器,其中,所述網頁分組模塊基于通過URL模式數信息獲得的URL模式之間的聯系,將不同URL模式分組以創建URL模式的組,以及將URL模式的組中的具有相同的URL模式的分組域值的網頁分組為網頁組。
4.根據權利要求I所述的組搜索服務器,其中,所述網頁分組模塊將具有相同值的網頁分組為網頁組,所述值通過對URL模式的分組域執行“和”或“或”操作的而獲得。
5.根據權利要求I所述的組搜索服務器,其中,所述索引管理模塊從包含于網頁組內的網頁提取索引,以創建和存儲索引信息,以及創建和存儲由索引所參照的網頁組的URL信息,以使得URL信息與索引相對應。
全文摘要
披露的是提供信息搜索服務的方法、系統和服務器。提供組搜索服務的方法,包括通過分析所收集數據最初定位的位置信息,來創建這些數據的位置信息模式;根據已經創建的位置信息模式,將所收集數據分組為數據組;以及從數據組中選擇一個與關鍵字相關的數據組并且提供一個組搜索結果。
文檔編號G06F17/30GK102622402SQ201210008279
公開日2012年8月1日 申請日期2006年3月3日 優先權日2005年3月4日
發明者南世東, 愼重熩 申請人:搜索方案株式會社