技術特征:
技術總結
本發明公開了一種車載網環境下基于深度強化學習的任務調度方法,包括以下步驟:步驟1:獲取每一個路側單元覆蓋范圍內的車流量數據;步驟2:獲取每一個路側單元的負載數據,并將此數據以多播形式傳遞給其他路側單元;步驟3:構架深度神經網絡,對相關變量進行初始化;步驟4:初始時間內,對于范圍內到達的請求,隨機選擇在本地執行或者負載到任意其他路側單元執行記錄請求從到達到完成的時間;步驟5:當步驟4收集的數據到達一定規模,對神經網絡進行更新;步驟6:對于新到達的請求,根據各區域車流量以及各路側單元的負載,使用更新過的神經網絡進行分配;步驟7:收集數據,重復執行步驟5~6。
技術研發人員:竇萬春;費凡
受保護的技術使用者:南京大學
技術研發日:2017.05.23
技術公布日:2017.09.08