本公開的實施例涉及計算機,并且更具體地涉及一種用于篩選數據集的方法、裝置、系統、計算機可讀存儲介質以及計算機程序產品。
背景技術:
1、用戶標簽在與互聯網有關的服務中起到了至關重要的作用。通過對用戶進行屬性、行為和興趣的分類和打標簽,企業能夠更深入地了解用戶群體,并為用戶提供定制化的服務。邏輯表達式在分類和打標簽的過程中扮演了重要角色,它能夠幫助定義和生成用戶標簽,確保用戶被正確地歸類到相應的標簽(或標簽組)中。邏輯表達式通常基于用戶的屬性和行為特征來構建。這些特征可以包括用戶的年齡、性別、地理位置、購買歷史、瀏覽記錄、搜索關鍵詞等。通過將這些特征進行邏輯組合,可以形成一系列的條件判斷,從而確定用戶應該被歸類到哪些標簽(或標簽組)中。
技術實現思路
1、提供了一種用于篩選數據集的方案。傳統的篩選數據集的方案需要逐條添加邏輯表示式來確定篩選條件,因此需要一定的學習成本。相比傳統方案,本方案更為便捷和直觀,能夠提升用戶體驗。用戶只需通過點擊操作,逐一添加各個屬性并輸入相應的條件,隨后這些屬性條件會以圖形化標簽的形式進行組合,這種方式使得邏輯表達式中的與、或以及括號等關系一目了然。通過簡化操作流程和提升可視化效果,有效克服了傳統方案的諸多缺陷,為在用戶需要篩選數據集時提供了更為高效和便捷的方式以及更好的用戶體驗。用戶無需手動編寫復雜的邏輯表達式,只需簡單輸入所需條件以及對圖形化標簽標記顏色,系統即可自動生成相應的表達式,實現精準的用戶篩選和標簽歸類。通過直觀的圖形界面,用戶可以輕松地進行屬性添加、條件設置以及邏輯表達式的組合等操作。與傳統的篩選數據集的配置方式相比,圖形化配置更加直觀、易懂,大大降低了用戶的學習成本。同時,圖形化配置還提供了豐富的可視化效果,使得用戶能夠更清晰地了解配置結果,提高操作的準確性。
2、在本公開的第一方面,提供了一種篩選數據集的方法。該方法包括接收針對數據集的圖形添加操作,其中圖形添加操作指示在圖形編輯區域顯示與數據集的多個屬性相關聯的多個圖形化標簽,基于圖形添加操作,在圖形編輯區域顯示多個圖形化標簽。該方法還包括響應于接收到針對多個圖形化標簽的標記操作,在多個圖形化標簽中突出顯示被標記的圖形化區域,將數據集中與被標記的圖形化區域相對應的子集確定為篩選后的數據集,其中標記操作包括以下一項或多項:對所述多個圖形化標簽中至少兩個圖形化標簽的并集進行標記;對所述多個圖形化標簽中至少兩個圖形化標簽的交集進行標記;或者對所述多個圖形化標簽中至少兩個標簽的差集進行標記。根據本公開的第一方面的用于篩選數據集的方法,能夠提升用戶體驗,能夠直觀顯示對多個標簽的不同的組合的多個結果,無需掌握編輯邏輯表達式的規則,降低用戶的使用難度。
3、在第一方面的一種實現方案中,響應于接收到對多個圖形化標簽的標記操作,在多個圖形化標簽中突出顯示被標記的圖形化區域包括:接收基于第一篩選條件確定的第一標記操作,在多個圖形化標簽中突出顯示與第一標記操作相對應的第一被標記的圖形化區域;以及接收基于第二篩選條件確定的第二標記操作,在多個圖形化標簽中突出顯示與第二標記操作相對應的第二被標記的圖形化區域,其中,第一被標記的圖形化區域的顏色不同于第二被標記的圖形化區域的顏色。這樣,能夠在利用不同的顏色來標記所需要篩選的區域,提高了標記的速度。
4、在第一方面的一種實現方案中,其中將與被標記的圖形化區域相對應的、數據集的子集確定為篩選后的數據集包括:將與第一被標記的圖形化區域相對應的數據確定為篩選后的第一數據子集;以及將與第二被標記的圖形化區域相對應的數據確定為篩選后的第二數據子集,其中第一數據子集不同于第二數據子集。這樣,能夠在根據不同的顏色來篩選出所需要數據集,提高了篩選的效率。
5、在第一方面的一種實現方案中,將第一數據子集保存為第一模板;將第二數據子集保存為第二模板;接收對第一模板或第二模板的添加請求;以及在圖形編輯區域顯示與第一模板相對應的第三圖形化標簽或與第二模板相對應的第四圖形化標簽。這樣,利用在后續使用時能夠直接加載所需的模板,提高操作效率。
6、在第一方面的一種實現方案中,其中與數據集的多個屬性相關聯的多個圖形化標簽包括:與多個屬性中的一個屬性相關聯的圖形化標簽;和/或與多個屬性中的至少兩個屬性的組合相關聯的圖形化標簽,其中組合包括交集、并集以及補集。這樣,能夠在加載篩選條件時,使用組合了多個屬性的標簽,能夠進一步提升數據篩選的效率。
7、在第一方面的一種實現方案中,該方法還包括接收對多個圖形化標簽的組合操作;以及組合多個圖形化標簽以顯示組合圖形化標簽,其中組合圖形化標簽能夠被作為單獨的圖形化標簽使用。這樣,能夠在加載篩選條件時,使用組合后的標簽,能夠進一步提升數據篩選的效率。
8、在第一方面的一種實現方案中,該方法還包括接收拆分組合圖形化標簽的拆分操作;以及將組合圖形化標簽顯示為多個單獨的圖形化標簽。這樣,能夠不需要組合標簽時,將已經組合的標簽拆分,拆分后的標簽可以在后續操作中被單獨使用,能夠提升操作的效率。
9、在第一方面的一種實現方案中,該方法還包括在多個圖形化標簽中的每個圖形化標簽上顯示相應的屬性。這樣,能夠更清楚的看到圖形化標簽的含義,避免了出錯并且提升了操作的效率。
10、在第一方面的一種實現方案中,該方法還包括在文字信息編輯區,以文字選項卡的方式呈現多個屬性;以及在文字信息編輯區,以邏輯表達式來表示標記操作。這樣,能夠提供更多的篩選數據的方式,從而為使用者提供了更多的便捷性。
11、在第一方面的一種實現方案中,其中響應于接收到針對多個圖形化標簽的標記操作,在多個圖形化標簽中突出顯示被標記的圖形化區域包括:基于標記操作,在圖形編輯區域中突出顯示被標記的圖形化區域;以及將圖形編輯區域中的標記操作同步到文字信息編輯區的邏輯表達式,并且方法還包括:響應于接收到針對文字信息編輯區的邏輯表達式的編輯操作,將編輯操作同步到圖形編輯區的多個圖形化標簽。這樣,能夠實現圖形化標簽與邏輯表達式的聯動,從而互相補充校驗,在邏輯表達式特別復雜時避免出錯,提高篩選結果的準確性。
12、在本公開的第二方面,提供了一種用于篩選數據集的裝置。裝置包括接收模塊,被配置為接收針對數據集的圖形添加操作,其中圖形添加操作指示在圖形編輯區域顯示與數據集的多個屬性相關聯的多個圖形化標簽;添加模塊,被配置為基于圖形添加操作,在圖形編輯區域顯示多個圖形化標簽;以及標記模塊,被配置為響應于接收到針對多個圖形化標簽的標記操作,在多個圖形化標簽中突出顯示被標記的圖形化區域;以及篩選模塊,被配置為將數據集中與被標記的圖形化區域相對應的子集確定為篩選后的數據集,其中,標記操作包括以下一項或多項:對所述多個圖形化標簽中至少兩個標簽的并集進行標記;對所述多個圖形化標簽中至少兩個第二圖形化標簽的交集進行標記;或者對所述多個圖形化標簽中至少兩個圖形化標簽的差集進行標記。根據本公開的第二方面的用于篩選數據集的裝置,能夠提升用戶體驗,能夠直觀顯示對多個標簽的不同的組合的多個結果,無需掌握編輯邏輯表達式的規則,降低用戶的使用難度。
13、根據本公開的第三方面,提供了一種計算設備集群,包括至少一個計算設備,每個計算設備包括處理器和存儲器,所述至少一個計算設備的處理器用于執行所述至少一個計算設備的存儲器中存儲的指令,以使得所述計算設備集群執行根據本公開的第一方面所述的方法。
14、根據本公開的第四方面,提供了一種計算機可讀存儲介質。該計算機可讀存儲介質存儲有指令,這些指令在被計算設備執行時,使計算機執行根據本公開的第一方面所述的方法。在一些實現方案中,計算機可讀存儲介質可以是非瞬態的。計算機可讀存儲介質包括但不限于易失性存儲器(例如,隨機訪問存儲器)、非易失性存儲器(例如,快閃存儲器、硬盤(hard?disk?drive,hdd)、固態盤(solid?state?drive,ssd)等)。
15、根據本公開的第五方面,提供了一種計算機程序產品。該計算機程序產品包括指令,這些指令在被計算設備執行時,使計算設備執行根據本公開的第一方面所述的方法。在一些實現方案中,計算機程序產品可以包括一個或多個軟件安裝包,在需要使用前述第一方面或其可能的變形提供的方法的情況下,可以下載或拷貝軟件安裝包并且在計算設備上執行。
16、應當理解,上述根據本公開的第三方面的計算設備集群、第四方面的計算機可讀存儲介質、或者第五方面的計算機程序產品用于執行第一方面所述的方法。因此,關于第一方面的解釋或說明同樣適用于第三方面、第四方面和第五方面。此外,第三方面、第四方面和第五方面所能達到的有益效果可以參考對應方法中的有益效果,此處不再贅述。
17、請注意,提供
技術實現要素:
部分是為了以簡化的形式介紹一系列概念,下面將在具體實施方式中進一步描述這些概念。發明內容部分無意于標識本公開內容的關鍵特征或必要特征,也無意于限制本公開內容的范圍。