技術特征:
技術總結
本發明公開了一種海量數據多維排序搜索方法,包括:根據數據庫中文檔的領域相關度,將文檔進行聚類,得到聚類組織相似查詢樹;將不同的領域的聚類組織進行聚類,形成相似查詢樹;獲取用戶提交的查詢向量,將查詢向量表示為查詢超球體;根據查詢超球體與相似查詢樹中節點所代表的超球體的位置關系,獲取與查詢超球體交集最多的超球體,并對該超球體向下一層節點尋找,直到葉子節點,并查詢其左右鄰居節點,按照相關比例返回節點中k個最相關的文檔列表以及文檔向量。在大數據的環境下DIK?MEDOIDS算法具有明顯的優勢,提高了數據的查詢速度已經準確度。
技術研發人員:趙志濱;顧佳良;姚蘭;高福祥
受保護的技術使用者:東北大學
技術研發日:2017.05.12
技術公布日:2017.09.15