本公開涉及多智能體系統一致性領域,尤其涉及一種基于多智能體強化學習的社交網絡觀點一致性方法、裝置。
背景技術:
1、觀點作為一種輿情的表現形式廣泛存在于公眾生活之中。隨著無線通信網絡和互聯網技術的快速發展,利用互聯網平臺在網絡社區中進行發聲與評議逐漸成為公眾的日常活動。在網絡社區中,公眾利用微信,微博,qq等互聯網平臺表達自我觀點,發表個體看法。多個觀點的出現以及個體間觀點的不斷交互,使得群體觀點逐步呈現出一致、分散和極化等不同現象。當前,社交網絡輿情管理的核心問題之一就是“如何讓公眾觀點達成一致”。
2、多智能體系統是一種新型的分布式控制系統,相比與中央控制器的傳統的集中控制系統,分布式控制的多智能體系統所具有的優勢主要表現為:系統功能強大,系統易于擴展,高性價比,高可靠性、高靈活性、強魯棒性。
3、在現有多智能體觀點一致性增強方法,大多基于優化交互規則、領袖跟隨法、信任機制、外部壓力等方法結合,然而在密度分布不均勻和大規模高密度的社交網絡場景,絕大多數算法在上述場景在大規模智能體系統結構下收斂過慢,并不適用且對于如何利用外部媒體信息來實現一致性增強的相關工作尚不多見。
技術實現思路
1、本公開目的是克服現有的一致性算法在大規模智能體系統結構下收斂過慢的問題,提供了一種基于多智能體強化學習的媒體-公眾社交網絡觀點一致性,利用外部媒體信息并優化基于有限置信區間的關鍵鄰居選擇策略,選取更有價值的鄰居進行通信,降低了通信代價,提升了收斂速度。
2、本公開中提出的基于多智能體強化學習的社交網絡觀點一致性方法,媒體通過強化學習來預測公眾群體觀點偏好,而公眾智能體綜合考慮外部媒體信息和關鍵鄰居信息來進行狀態更新和演化,具體步驟如下:
3、一種基于多智能體強化學習的社交網絡觀點一致性方法,包括:
4、在分布式離散時間連續狀態空間的觀點動力學模型下,智能體在任一時刻,掃描所有公眾鄰居智能體,存儲位于有限置信區間內的鄰居信息;
5、所述智能體在所述鄰居信息中找到與自身狀態差值最大的一個智能體,找到與自身狀態差異最小的智能體;
6、所述智能體根據所有有限置信區間內的任一鄰居信息計算和諧度;
7、利用強化學習,判斷公眾智能體能夠接受外部媒體信息;
8、所述公眾智能體與篩選后的智能體信息進行信息交換,通過一致性協議得到控制輸入,通過控制輸入量來更新自身的狀態信息,能有效結合所有智能體鄰居的信息和外部媒體信息,達到社交網絡觀點一致;
9、所述智能體信息,包括公眾智能體和外部媒體智能體的信息。
10、所述利用強化學習,判斷公眾智能體能夠接受外部媒體信息,包括:
11、預設媒體數量固定為1,公眾智能體每迭代一次,媒體隨機選取部分公眾的信息進行強化學習,經過訓練后,按照其正態概率分布隨機選取一個值作為新的外部媒體信息xm(k),若|xm(k)-xi(k)|≤hd則說明公眾智能體能夠接受外部媒體信息xm(k);xi(k)為k時刻公眾智能體i的觀點信息。
12、多智能體系統是一個狀態依賴的拓撲結構,智能體的觀點信息表示的是其狀態信息,只考慮智能體的一維觀點信息,智能體下一時刻觀點由其置信區間內的鄰居和外部媒體信息的觀點共同決定,其下一時刻的狀態信息可表示為:xi(k+1)=xi(k)+ui(k);xi(k)為智能體i在k時刻的狀態信息;ui(k)為外部媒體信息。
13、鄰居信息ni的定義為:對于公眾智能體i和j,若||xi-xj||≤r,r為智能體置信區間長度,則智能體i,j互為鄰居;
14、而對于公眾智能體i能否接受外部媒體信息xm(k)取決于||xi-xm||≤hdi是否成立,hdi表示智能體i的和諧度,若成立則表示智能體i可接受外部媒體信息。
15、所述一致性協議為:
16、
17、其中,α,β為調整因子,是一個大于0且小于1的數,bim表示公眾智能體i和外部媒體是否有連接。
18、所述公眾智能體和外部媒體的通信拓撲連接也是時變的,用bim表示,若|xm(k)-xi(k)|≤hd,則為1,否則為0;
19、公眾智能體達到一致的條件是:
20、對于公眾智能體i和j,若滿足條件limx→∞||xi-xj||=0,則達到一致,即完成了觀點一致的任務。
21、和諧度是衡量公眾智能體i和其所有鄰居之間觀點差異大小的指標,定義如下:
22、
23、其中n是公眾的數量,xi和xj分別表示公眾智能體i和公眾智能體j的觀點信息。
24、一種社交網絡觀點一致性電子裝置,包括:
25、存儲介質,用于存儲計算機程序;
26、處理單元,與所述存儲介質進行數據交換,用于在進行三維超聲成像時,通過所述處理單元執行所述計算機程序,進行如上所述的基于多智能體強化學習的社交網絡觀點一致性方法的步驟。
27、一種可讀存儲介質,其特征在于:
28、所述可讀存儲介質內存儲有計算機程序;
29、所述計算機程序在運行時,執行如上所述的基于多智能體強化學習的社交網絡觀點一致性方法的步驟。
30、有益效果:
31、本公開的有益效果至少包括:
32、本公開所述的基于多智能體強化學習的社交網絡觀點一致性方法,利用外部媒體信息的社交網絡觀點一致性算法,同時優化基于有限置信區間的關鍵鄰居選擇策略,減少冗余信息,從而快速實現分布式多智能體系統的一致性。
1.一種基于多智能體強化學習的社交網絡觀點一致性方法,其特征在于,包括:
2.根據權利要求1所述的基于多智能體強化學習的社交網絡觀點一致性方法,其特征在于,所述利用強化學習,判斷公眾智能體能夠接受外部媒體信息,包括:
3.根據權利要求1所述的基于多智能體強化學習的社交網絡觀點一致性方法,其特征在于:
4.根據權利要求1所述的基于多智能體強化學習的社交網絡觀點一致性方法,其特征在于:
5.根據權利要求1所述的基于多智能體強化學習的社交網絡觀點一致性方法,其特征在于:
6.根據權利要求5所述的基于多智能體強化學習的社交網絡觀點一致性方法,其特征在于:
7.根據權利要求1所述的基于多智能體強化學習的社交網絡觀點一致性方法,其特征在于:
8.根據權利要求1所述的基于多智能體強化學習的社交網絡觀點一致性方法,其特征在于:
9.一種社交網絡觀點一致性電子裝置,其特征在于,包括:
10.一種可讀存儲介質,其特征在于: