本技術涉及應急調度,具體而言,涉及一種物資調度路徑規劃方法、電子設備以及存儲介質。
背景技術:
1、在緊急事件發生時,如何快速、精準的預測各需求點的物資需求,并基于各需求點的物資需求以及各供給點的物資存量進行物資調度就成為了需要解決的問題。
2、目前一般是通過調度模型在一開始對需求點的物資需求數據和供給點的物資存量數據進行分析,從而生成整體的物資調度方案。
3、但是,現有的調度模型無法實現對動態需求及時進行響應和調整,并且難以實現對未來一段時間各需求點的需求預測,存在靈活性差、效率低的問題。
技術實現思路
1、本技術的目的在于,針對上述現有技術中的不足,提供一種物資調度路徑規劃方法、電子設備以及存儲介質,以解決現有技術中調度模型無法實現對動態需求及時進行響應和調整,并且難以實現對未來一段時間各需求點的需求預測,存在靈活性差、效率低的問題。
2、為實現上述目的,本技術采用的技術方案如下:
3、第一方面,本技術提供了一種物資調度路徑規劃方法,所述方法包括:
4、根據當前時間周期的實際數據以及交通數據構建實時圖結構,所述實時圖結構包括節點集合以及邊集合,所述節點集合中的節點包括:需求點、供給點或中轉點,所述邊集合中的邊用于表征節點之間的交通連接信息;
5、將所述實時圖結構輸入動態圖神經網絡中,由所述動態圖神經網絡預測得到各需求點在當前時間周期的未來多個時刻的需求預測結果;
6、將各所述需求預測結果以及所述實時圖結構輸入深度強化學習模型,由所述深度強化學習模型預測得到各需求點的目標供給點以及各所述需求點與對應的目標供給點之間的調度路徑。
7、可選地,所述根據當前時間周期的實際數據以及交通數據構建實時圖結構,包括:
8、從所述實際數據中提取得到至少一個需求點、供給點以及中轉點,將各所述需求點、供給點以及中轉點作為所述實時圖結構中的節點;
9、基于各所述需求點、供給點以及中轉點的場所數據,確定各所述節點的第一屬性信息,所述第一屬性信息包括:各所述需求點的人口數量和物資需求量、各供給點的物資存量、可用車輛以及可用人員;
10、從所述交通數據中提取得到各所述需求點、供給點以及中轉點之間的連通路徑,并根據各所述連通路徑生成所述實時圖結構中對應的邊;
11、基于各所述連通路徑的路段狀況、道路通行時間確定各所述邊的第二屬性信息,所述第二屬性信息包括:道路通行時間、路段狀況、道路距離。
12、可選地,所述將所述實時圖結構輸入動態圖神經網絡中,由所述動態圖神經網絡預測得到各需求點在當前時間周期的未來多個時刻的需求預測結果,包括:
13、將所述實時圖結構輸入所述動態圖神經網絡中,由所述動態圖神經網絡的特征提取層對所述實時圖結構中的目標需求點進行特征提取,得到各所述目標需求點的節點特征,并將各所述節點特征輸入卷積層;
14、由所述動態圖神經網絡的卷積層對各所述目標需求點的節點特征進行時間序列卷積處理,得到動態圖序列,并將所述動態圖序列輸入輸出層;
15、由所述動態圖神經網絡的輸出層對所述動態圖序列進行預測,得到各所述需求點在未來多個時段的需求預測結果。
16、可選地,所述由所述深度強化學習模型預測得到各需求點的目標供給點以及各所述需求點與對應的目標供給點之間的調度路徑,包括:
17、根據所述實時圖結構構建狀態空間以及動作空間,所述狀態空間包括:所述需求點對應的節點的需求預測結果、所述供給點的物資存量數據以及各邊的交通連接信息,所述動作空間包括:從供給點到各所述需求點的可選路徑;
18、由所述深度強化學習模型根據各所述需求點的當前狀態、所述狀態空間以及所述動作空間進行預測,得到各需求點的目標供給點以及各所述需求點與對應的目標供給點之間的調度路徑。
19、可選地,所述由所述深度強化學習模型根據各所述需求點的當前狀態、所述狀態空間以及所述動作空間進行預測,得到各需求點的目標供給點以及各所述需求點與對應的目標供給點之間的調度路徑,包括:
20、a、由所述深度強化學習模型根據起始點的當前狀態以及所述動作空間,確定與所述起始點連通的第一可選節點,所述起始點為所述實時圖結構中的任意一個需求點;
21、b、記錄所述第一可選節點,并確定所述第一可選節點是否為目標供給點;
22、c、若是,則將所述第一可選節點作為所述目標供給點,并生成從所述起始點到所述第一可選節點的調度路徑,若否,則根據所述第一可選節點的當前狀態以及所述動作空間,確定與所述第一可選節點連通的第二可選節點;
23、d、將所述第二可選節點作為新的第一可選節點,根據所述狀態空間確定所述第一可選節點的當前狀態,并重復執行步驟b-c,直至所述第一可選節點為目標供給點,將所述第一可選節點作為所述目標供給點,并生成從所述起始點到所述目標供給點的調度路徑。
24、可選地,所述由所述深度強化學習模型根據起始點的當前狀態以及所述動作空間,確定與所述起始點連通的第一可選節點,包括:
25、由所述深度強化學習模型根據所述起始點的當前狀態以及所述動作空間,確定與所述起始點連通的至少一個連通節點;
26、根據各所述連通節點的獎勵值,從所述至少一個連通節點中確定所述第一可選節點。
27、可選地,所述確定所述第一可選節點是否為目標供給點,包括:
28、獲取所述第一可選節點的節點屬性,若所述節點屬性指示所述第一可選節點為供給點,且所述第一可選節點的物資存量與所述起始點的物資需求量滿足預設條件,則將所述第一可選點作為目標供給點。
29、可選地,所述生成從所述起始點到所述目標供給點的調度路徑,包括:
30、從所述起始點開始,按照各所述第一可選節點的記錄順序對各所述第一可選節點進行排列,將所述目標供給點作為最后一個節點,得到從所述起始點到所述目標供給點的調度路徑。
31、第二方面,本技術實施例還提供了一種電子設備,包括:處理器、存儲介質和總線,所述存儲介質存儲有所述處理器可執行的機器可讀指令,當電子設備運行時,所述處理器與所述存儲介質之間通過總線通信,所述處理器執行所述機器可讀指令,以執行如第一方面中任一項所述的一種物資調度路徑規劃方法的步驟。
32、第三方面,本技術實施例還提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質上存儲有計算機程序,所述計算機程序被處理器運行時執行如第一方面中任一項所述的一種物資調度路徑規劃方法的步驟。
33、本技術的有益效果是:通過對需求點、供給點以及中轉點構建實時圖結構,可以更好的表征各場所之間的時空關系。通過動態圖神經網絡對實時圖結構進行預測,得到各需求點的需求預測結果,可以實現對各需求點在未來一段時間內物資需求的動態評估,有助于優化供需匹配。通過深度強化學習模型對需求預測結果以及實時圖結構進行預測,得到調度路徑,即使道路狀況發生了改變,也可以實現基于環境變化響應更新調度路徑,從而確保物資到達需求點的效率與及時性。并且本技術在每個時間周期內進行滾動的需求預測以及路徑生成,可以實現對動態需求的及時響應和調整,提升了調度路徑規劃的靈活性以及物資調度的效率。
34、為使本技術的上述目的、特征和優點能更明顯易懂,下文特舉較佳實施例,并配合所附附圖,作詳細說明如下。