1.一種分布式推演方法(1),所述方法(1)包括:
2.根據權利要求1所述的方法(1),其中,啟動(15)所述本地推演和/或所述遠程推演包括:
3.根據權利要求2所述的方法(1),其中,所述數據樣本(x)包括以下之一:數字圖像,和時間序列的一部分;
4.根據權利要求2或3所述的方法(1),所述移動設備(2)的所述環境的所述狀態(s)包括以下一項或多項:
5.根據權利要求4所述的方法(1),所述信道測量結果包括信道質量指示(c∈{1,…,c})。
6.根據權利要求4或5所述的方法(1),所述負載指示包括以下一項或多項:
7.根據上述權利要求中任一項所述的方法(1),其中,轉發(16)所述處理后的數據樣本(z)包括:
8.根據上述權利要求中任一項所述的方法(1),其中,轉發(16)所述處理后的數據樣本(z)包括:
9.根據上述權利要求中任一項所述的方法(1),其中,提供(19)所述最終結果(yfinal)包括:
10.根據上述權利要求中任一項所述的方法(1),所述第一、第三、第四dnn推演函數(f021、f1?24、f2?31)分別包括卷積神經網絡或全連接前饋神經網絡。
11.根據權利要求10所述的方法(1),還包括:
12.根據權利要求11所述的方法(1),其中,執行(11)所述第一、第三、第四dnn推演函數(f0?21、f1?24、f2?31)的所述聯合訓練包括:
13.根據權利要求12所述的方法(1),其中,計算(111)所述聯合損失(l=l(y,y1,y2))包括:
14.根據權利要求12所述的方法(1),其中,計算(111)所述聯合損失(l=l(y,y1,y2))包括:
15.根據權利要求14所述的方法(1),其中,計算(1114)所述聯合損失(l=l(y,y1,y2))包括:
16.根據權利要求12至15中任一項所述的方法(1),其中,計算(1114)所述聯合損失包括:
17.根據權利要求12至16中任一項所述的方法(1),所述第二dnn推演函數(fc?22)包括策略深度q網絡dqn、目標dqn和狀態轉換存儲器(bc),所述策略dqn和所述目標dqn用于提供與本地推演相關聯的相應第一q值(q1(x,s))和與遠程推演相關聯的相應第二q值(q2(x,s)),所述目標dqn還用于每k個訓練步驟從所述策略dqn中復制權重參數(θc)。
18.根據權利要求17所述的方法(1),還包括:
19.根據權利要求18所述的方法(1),其中,執行(12)所述第二dnn推演函數(fc?22)的所述訓練包括:
20.根據權利要求19所述的方法(1),其中,啟動(122)所述本地推演或所述遠程推演包括:
21.根據權利要求19或20所述的方法(1),其中,確定(124)與所述啟動的本地推演或遠程推演相關聯的所述成本(cost)包括:
22.根據權利要求19至21中任一項所述的方法(1),在所述數據樣本(x)的生命周期內,所述環境的所述狀態(s=[c,q])發生一次或多次變化。
23.根據權利要求12至22中任一項所述的方法(1),所述第五推演函數(fg?25)包括第五dnn推演函數(fg?25),所述第五dnn推演函數(fg?25)包括卷積神經網絡或全連接前饋神經網絡。
24.根據權利要求23所述的方法(1),還包括:
25.根據權利要求24所述的方法(1),其中,執行(13)所述第五dnn推演函數(fg?25)的所述訓練包括:
26.根據權利要求25所述的方法(1),其中,計算(131)所述損失包括:
27.根據權利要求25所述的方法(1),其中,計算(131)所述損失包括:
28.一種分布式推演系統(2、3),包括:
29.一種計算機程序,包括: