本公開涉及數(shù)據(jù)檢索領域,尤其涉及一種基于興趣點數(shù)據(jù)的選址方法、裝置、設備及存儲介質(zhì)。
背景技術:
1、在選址推薦任務中,傳統(tǒng)方法通常只考慮單一指標(如客流、租金等),缺乏對競爭和協(xié)作品牌關系的綜合分析。現(xiàn)有方案難以有效處理復雜的競爭-協(xié)作關系對選址影響的建模,尤其是對同一大類下不同品牌的重疊影響分析較為有限。忽視了競爭品牌的影響,也未充分考慮協(xié)作品牌的協(xié)同作用;沒有引入品牌之間的競爭和協(xié)作關系,影響范圍計算不夠精準;僅能基于已有數(shù)據(jù)推測,無法處理新品牌或競爭關系的動態(tài)變化,缺乏靈活性。缺乏對競爭品牌和協(xié)作品牌關系的定量化建模。難以綜合考慮多店選址中的協(xié)作效應和競爭壓制效應。對影響范圍計算較為粗略,忽略了品牌特性、類別權重、以及距離衰減等重要因素。
技術實現(xiàn)思路
1、本公開提供了一種基于興趣點數(shù)據(jù)的選址方法、裝置、設備及存儲介質(zhì),以至少解決現(xiàn)有技術中存在的以上技術問題。
2、根據(jù)本公開的第一方面,提供了一種基于興趣點數(shù)據(jù)的選址方法,所述方法包括:
3、基于網(wǎng)絡爬蟲技術收集全國的興趣點數(shù)據(jù),基于所述興趣點數(shù)據(jù)檢索得到相關數(shù)據(jù),并將所述相關數(shù)據(jù)和所述興趣點數(shù)據(jù)存入數(shù)據(jù)庫;
4、獲取目標數(shù)據(jù),基于所述目標數(shù)據(jù)檢索所述數(shù)據(jù)庫中對應的至少一個第一興趣點數(shù)據(jù)和對應的第一相關數(shù)據(jù);
5、基于所述第一相關數(shù)據(jù)查找所述至少一個第一興趣點數(shù)據(jù)對應的營業(yè)數(shù)據(jù),基于所述營業(yè)數(shù)據(jù)計算所述至少一個第一興趣點數(shù)據(jù)對應的吸引力評分;
6、獲取所述第一相關數(shù)據(jù)中所述至少一個第一興趣點數(shù)據(jù)的位置信息,基于所述位置信息檢索所述相關數(shù)據(jù)中其他興趣點相關數(shù)據(jù),基于所述其他興趣點相關數(shù)據(jù)和所述第一相關數(shù)據(jù)設定第一修正系數(shù);
7、基于所述吸引力評分和所述第一修正系數(shù)計算所述至少一個第一興趣點數(shù)據(jù)的綜合規(guī)模權重;
8、基于所述位置信息檢索所述第一相關數(shù)據(jù)中的居民數(shù)據(jù),基于所述居民數(shù)據(jù)和所述綜合規(guī)模權重計算所述至少一個第一興趣點數(shù)據(jù)的社區(qū)吸引力,將所述至少一個第一興趣點數(shù)據(jù)的社區(qū)吸引力進行累加,得到所述目標數(shù)據(jù)對應的區(qū)域內(nèi)所述第一興趣點數(shù)據(jù)的總體吸引力,基于所述總體吸引力和所述社區(qū)吸引力得到所述區(qū)域內(nèi)的候選地址。
9、在一可實施方式中,所述基于所述營業(yè)數(shù)據(jù)計算所述至少一個第一興趣點數(shù)據(jù)對應的吸引力評分,包括:
10、所述營業(yè)數(shù)據(jù)包括:評價數(shù)據(jù)、營業(yè)規(guī)模數(shù)據(jù)、營業(yè)類別數(shù)據(jù);
11、為所述評價數(shù)據(jù)中的評論數(shù)量和評分星級分別設置評價權重,基于所述評價權重、所述評論數(shù)量和所述評分星級計算所述至少一個第一興趣點數(shù)據(jù)對應品牌影響力評分;
12、基于所述營業(yè)規(guī)模數(shù)據(jù)計算所述至少一個第一興趣點數(shù)據(jù)對應品牌吸引力值,基于所述營業(yè)類別數(shù)據(jù)設定至少一個類別權重,從所述至少一個類別權重中選取所述第一興趣點數(shù)據(jù)對應的第一類別權重,基于所述第一類別權重、所述品牌吸引力值和所述品牌影響力評分計算所述至少一個第一興趣點數(shù)據(jù)對應的吸引力評分。
13、在一可實施方式中,所述基于所述其他興趣點相關數(shù)據(jù)和所述第一相關數(shù)據(jù)設定第一修正系數(shù),包括:
14、所述其他興趣點相關數(shù)據(jù)包括所述其他興趣點對應客戶的實際客流量數(shù)據(jù)和實際消費數(shù)據(jù);
15、基于所述第一相關數(shù)據(jù)設定所述第一興趣點對應的期望客流量數(shù)據(jù)和期望消費數(shù)據(jù);
16、基于所述實際客流量數(shù)據(jù)、所述實際消費數(shù)據(jù)、所述期望客流量數(shù)據(jù)和所述期望消費數(shù)據(jù)計算興趣點競爭強度;
17、基于所述第一相關數(shù)據(jù)和所述其他興趣點相關數(shù)據(jù)獲取興趣點間距離,基于所述興趣點間距離設定競爭距離衰減系數(shù),基于所述競爭距離衰減系數(shù)、所述興趣點間距離和所述興趣點競爭強度設定所述第一修正系數(shù)。
18、在一可實施方式中,所述基于所述居民數(shù)據(jù)和所述綜合規(guī)模權重計算所述至少一個第一興趣點數(shù)據(jù)的社區(qū)吸引力,包括:
19、所述居民數(shù)據(jù)包括:居民畫像特征數(shù)據(jù)和居民交通數(shù)據(jù);
20、基于所述至少一個第一興趣點數(shù)據(jù)和所述第一相關數(shù)據(jù)構建目標群體特征向量,基于所述居民畫像特征提取居民特征向量,計算所述居民特征向量和所述目標群體特征向量的相似度;
21、基于交通類別將所述居民交通數(shù)據(jù)進行分類,基于分類結果分別設置對應的交通方式權重,基于所述分類結果對應的交通距離和所述交通方式權重計算加權可達距離;
22、基于所述相似度、所述加權可達距離和所述綜合規(guī)模權重計算所述至少一個第一興趣點數(shù)據(jù)的社區(qū)吸引力。
23、在一可實施方式中,所述基于所述總體吸引力和所述社區(qū)吸引力得到所述區(qū)域內(nèi)的候選地址,包括:
24、獲取所述區(qū)域內(nèi)的可選地址集合,將每個所述可選地址分別作為一個種子節(jié)點;
25、獲取所述目標數(shù)據(jù)中全部的興趣點分別對應的總體吸引力集合,將所述總體吸引力集合中的數(shù)值大小進行排序,選取數(shù)值最大的所述興趣點對應的種子節(jié)點作為單一候選地址;
26、根據(jù)所述興趣點類型設置調(diào)節(jié)系數(shù),基于所述調(diào)節(jié)系數(shù)、所述總體吸引力集合和所述興趣點競爭強度,計算去除所述數(shù)值最大的所述興趣點后的所述興趣點的吸引力,并重復迭代計算剩余所述興趣點的吸引力,所述重復迭代的次數(shù)達到設定值后,選取計算結果對應的節(jié)點作為多個候選地址。
27、根據(jù)本公開的第二方面,提供了一種基于興趣點數(shù)據(jù)的選址裝置,所述裝置包括:
28、數(shù)據(jù)收集單元,用于基于網(wǎng)絡爬蟲技術收集全國的興趣點數(shù)據(jù),基于所述興趣點數(shù)據(jù)檢索得到相關數(shù)據(jù),并將所述相關數(shù)據(jù)和所述興趣點數(shù)據(jù)存入數(shù)據(jù)庫;
29、目標數(shù)據(jù)檢索單元,用于獲取目標數(shù)據(jù),基于所述目標數(shù)據(jù)檢索所述數(shù)據(jù)庫中對應的至少一個第一興趣點數(shù)據(jù)和對應的第一相關數(shù)據(jù);
30、吸引力評分計算單元,用于基于所述第一相關數(shù)據(jù)查找所述至少一個第一興趣點數(shù)據(jù)對應的營業(yè)數(shù)據(jù),基于所述營業(yè)數(shù)據(jù)計算所述至少一個第一興趣點數(shù)據(jù)對應的吸引力評分;
31、第一修正系數(shù)計算單元,用于獲取所述第一相關數(shù)據(jù)中所述至少一個第一興趣點數(shù)據(jù)的位置信息,基于所述位置信息檢索所述相關數(shù)據(jù)中其他興趣點相關數(shù)據(jù),基于所述其他興趣點相關數(shù)據(jù)和所述第一相關數(shù)據(jù)設定第一修正系數(shù);
32、綜合規(guī)模權重計算單元,用于基于所述吸引力評分和所述第一修正系數(shù)計算所述至少一個第一興趣點數(shù)據(jù)的綜合規(guī)模權重;
33、吸引力計算單元,用于基于所述位置信息檢索所述第一相關數(shù)據(jù)中的居民數(shù)據(jù),基于所述居民數(shù)據(jù)和所述綜合規(guī)模權重計算所述至少一個第一興趣點數(shù)據(jù)的社區(qū)吸引力,將所述至少一個第一興趣點數(shù)據(jù)的社區(qū)吸引力進行累加,得到所述目標數(shù)據(jù)對應的區(qū)域內(nèi)所述第一興趣點數(shù)據(jù)的總體吸引力;
34、選址單元,用于基于所述總體吸引力和所述社區(qū)吸引力得到所述區(qū)域內(nèi)的候選地址。
35、在一可實施方式中,所述吸引力評分計算單元還用于,所述營業(yè)數(shù)據(jù)包括:評價數(shù)據(jù)、營業(yè)規(guī)模數(shù)據(jù)、營業(yè)類別數(shù)據(jù);為所述評價數(shù)據(jù)中的評論數(shù)量和評分星級分別設置評價權重,基于所述評價權重、所述評論數(shù)量和所述評分星級計算所述至少一個第一興趣點數(shù)據(jù)對應品牌影響力評分;基于所述營業(yè)規(guī)模數(shù)據(jù)計算所述至少一個第一興趣點數(shù)據(jù)對應品牌吸引力值,基于所述營業(yè)類別數(shù)據(jù)設定至少一個類別權重,從所述至少一個類別權重中選取所述第一興趣點數(shù)據(jù)對應的第一類別權重,基于所述第一類別權重、所述品牌吸引力值和所述品牌影響力評分計算所述至少一個第一興趣點數(shù)據(jù)對應的吸引力評分;
36、所述吸引力計算單元還用于,所述居民數(shù)據(jù)包括:居民畫像特征數(shù)據(jù)和居民交通數(shù)據(jù);基于所述至少一個第一興趣點數(shù)據(jù)和所述第一相關數(shù)據(jù)構建目標群體特征向量,基于所述居民畫像特征提取居民特征向量,計算所述居民特征向量和所述目標群體特征向量的相似度;基于交通類別將所述居民交通數(shù)據(jù)進行分類,基于分類結果分別設置對應的交通方式權重,基于所述分類結果對應的交通距離和所述交通方式權重計算加權可達距離;基于所述相似度、所述加權可達距離和所述綜合規(guī)模權重計算所述至少一個第一興趣點數(shù)據(jù)的社區(qū)吸引力。
37、在一可實施方式中,所述第一修正系數(shù)計算單元還用于,所述其他興趣點相關數(shù)據(jù)包括所述其他興趣點對應客戶的實際客流量數(shù)據(jù)和實際消費數(shù)據(jù);基于所述第一相關數(shù)據(jù)設定所述第一興趣點對應的期望客流量數(shù)據(jù)和期望消費數(shù)據(jù);基于所述實際客流量數(shù)據(jù)、所述實際消費數(shù)據(jù)、所述期望客流量數(shù)據(jù)和所述期望消費數(shù)據(jù)計算興趣點競爭強度;基于所述第一相關數(shù)據(jù)和所述其他興趣點相關數(shù)據(jù)獲取興趣點間距離,基于所述興趣點間距離設定競爭距離衰減系數(shù),基于所述競爭距離衰減系數(shù)、所述興趣點間距離和所述興趣點競爭強度設定所述第一修正系數(shù);
38、所述選址單元還用于,獲取所述區(qū)域內(nèi)的可選地址集合,將每個所述可選地址分別作為一個種子節(jié)點;獲取所述目標數(shù)據(jù)中全部的興趣點分別對應的總體吸引力集合,將所述總體吸引力集合中的數(shù)值大小進行排序,選取數(shù)值最大的所述興趣點對應的種子節(jié)點作為單一候選地址;根據(jù)所述興趣點類型設置調(diào)節(jié)系數(shù),基于所述調(diào)節(jié)系數(shù)、所述總體吸引力集合和所述興趣點競爭強度,計算去除所述數(shù)值最大的所述興趣點后的所述興趣點的吸引力,并重復迭代計算剩余所述興趣點的吸引力,所述重復迭代的次數(shù)達到設定值后,選取計算結果對應的節(jié)點作為多個候選地址。
39、根據(jù)本公開的第三方面,提供了一種電子設備,包括:
40、至少一個處理器;以及
41、與所述至少一個處理器通信連接的存儲器;其中,
42、所述存儲器存儲有可被所述至少一個處理器執(zhí)行的指令,所述指令被所述至少一個處理器執(zhí)行,以使所述至少一個處理器能夠執(zhí)行本公開所述的方法。
43、根據(jù)本公開的第四方面,提供了一種存儲有計算機指令的非瞬時計算機可讀存儲介質(zhì),所述計算機指令用于使所述計算機執(zhí)行本公開所述的方法。
44、本公開的一種基于興趣點數(shù)據(jù)的選址方法、裝置、設備及存儲介質(zhì),通過分析目標數(shù)據(jù)的不同品牌間的競爭和協(xié)作關系,計算品牌與社區(qū)之間的吸引力,根據(jù)計算結果選取區(qū)域內(nèi)的候選地址。融合了競爭和協(xié)作關系,提升選址模型對復雜場景的適應能力,實現(xiàn)了對多店選址問題的逐步優(yōu)化,避免了因前序選址影響未考慮而導致的全局效率下降,并通過在選址推薦中加入租金成本和客流因素,實現(xiàn)更實用的推薦結果。
45、應當理解,本部分所描述的內(nèi)容并非旨在標識本公開的實施例的關鍵或重要特征,也不用于限制本公開的范圍。本公開的其它特征將通過以下的說明書而變得容易理解。