本公開涉及數據處理,具體涉及向量數據庫,尤其涉及一種面向向量數據庫場景的更新方法、裝置和電子設備。
背景技術:
1、聚類被廣泛地用于向量索引構建中,然而,聚類算法本身速度極慢,對于向量數據庫的更新而言,如何提高向量索引的重構是一個需要解決的痛點。
技術實現思路
1、本公開提供了一種用于面向向量數據庫場景的更新方法、裝置和電子設備。
2、根據本公開的一方面,提供了一種面向向量數據庫場景的更新方法,包括:獲取新增向量和所述新增向量的第一數據量;獲取向量數據庫已有向量的第二數據量;獲取所述第一數據量和第二數據量的差異信息;根據所述差異信息和所述新增向量,對所述向量數據庫進行更新。
3、根據本公開的另一方面,提供了一種面向向量數據庫場景的更新裝置,包括:第一獲取模塊,用于獲取新增向量和所述新增向量的第一數據量;第二獲取模塊,用于獲取向量數據庫已有向量的第二數據量;第三獲取模塊,用于獲取所述第一數據量和第二數據量的差異信息;更新模塊,用于根據所述差異信息和所述新增向量,對所述向量數據庫進行更新。
4、根據本公開的另一方面,提供了一種電子設備,包括:至少一個處理器;以及與所述至少一個處理器通信連接的存儲器;其中,所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行上述一方面實施例所述的面向向量數據庫場景的更新方法。
5、根據本公開另一方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其上存儲有計算機程序/指令,所述計算機指令用于使所述計算機執行上述一方面實施例所述的面向向量數據庫場景的更新方法。
6、根據本公開的另一方面,提供了一種計算機程序產品,包括計算機程序/指令,所述計算機程序/指令被處理器執行時實現上述一方面實施例所述的面向向量數據庫場景的更新方法。
7、應當理解,本部分所描述的內容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。
1.一種面向向量數據庫場景的更新方法,其中,所述方法包括:
2.根據權利要求1所述的方法,其中,所述根據所述差異信息和所述新增向量,對所述向量數據庫進行更新,包括:
3.根據權利要求2所述的方法,其中,所述根據所述差異信息,確定所述向量數據庫的目標更新模式,包括:
4.根據權利要求1-3中任一項所述的方法,其中,所述根據所述差異信息和所述新增向量,對所述向量數據庫進行更新,包括:
5.根據權利要求4所述的方法,其中,所述向所述向量數據庫的已有類簇中加入所述新增向量,包括:
6.根據權利要求1-3中任一項所述的方法,其中,所述根據所述差異信息和所述新增向量,對所述向量數據庫進行更新,包括:
7.根據權利要求5所述的方法,其中,所述以所述類簇中心點為起始中心點,對所述新增向量和所述向量數據庫中已有向量進行索引重建,包括:
8.根據權利要求1-3中任一項所述的方法,其中,所述根據所述差異信息和所述新增向量,對所述向量數據庫進行更新,包括:
9.一種面向向量數據庫場景的更新裝置,其中,所述裝置包括:
10.一種電子設備,包括:
11.一種存儲有計算機指令的非瞬時計算機可讀存儲介質,其中,所述計算機指令用于使所述計算機執行根據權利要求1-8中任一項所述的方法。
12.一種計算機程序產品,包括計算機程序/指令,其特征在于,該計算機程序/指令被處理器執行時實現權利要求1-8中任一項所述的方法。