本發(fā)明涉及二集值通信環(huán)境下速度不可測的二階多智能體系統(tǒng)的一致性控制方法及系統(tǒng),屬于多智能體系統(tǒng)分布式協(xié)同控制。
背景技術:
1、多智能體系統(tǒng)(multi-agent?system,mas)由多個智能體(agent)組成,它們通過智能體之間的相互協(xié)調(diào)共同完成復雜任務,其中單個智能體為具有一定的傳感、計算、存儲與通信能力的個體。一致性(consensus)控制指在分布式多智能體系統(tǒng)中,擁有不同初始狀態(tài)值的智能體節(jié)點僅通過與其相鄰節(jié)點交換信息,使所有智能體個體的狀態(tài)值達成一致。多智能體系統(tǒng)的分布式一致性控制與協(xié)作問題可用于解決復雜群集式的控制問題,在無人機編隊、移動機器人、衛(wèi)星網(wǎng)絡和傳感器網(wǎng)絡等領域有著廣泛的應用前景。
2、在多智能體系統(tǒng)中,一致性問題的研究開始主要集中于一階動力學系統(tǒng),但是由于一階動力學系統(tǒng)本身結構簡單,僅考慮位置一種狀態(tài),并不能描述實際工程以及自然界中的大多數(shù)系統(tǒng),如生物體的聚集、蜂擁以及無人機的編隊控制等。在由二階動力學系統(tǒng)刻畫的多智能體系統(tǒng)中,每個智能體需要同時考慮智能體的位置和速度,與一階系統(tǒng)相比,能夠更好的刻畫實際工程中的物理系統(tǒng)。目前,二階多智能體系統(tǒng)的一致性問題已經(jīng)廣泛應用于衛(wèi)星編隊飛行和智能電網(wǎng)等領域。
3、目前二階多智能體系統(tǒng)的一致性控制存在兩個基本挑戰(zhàn):一方面,在實際應用中,由于傳感器損壞或精度不足,或在復雜地形中,智能體無法測量速度信息,需要考慮如何在鄰居智能體速度信息未知的情況下設計一致性控制協(xié)議。另一方面,在通信資源有限的情況下,二集值通信可以通過簡化信息來減少傳輸?shù)臄?shù)據(jù)量,提高系統(tǒng)的魯棒性和安全性,需要考慮如何在二集值通信環(huán)境下為智能體系統(tǒng)設計一致性控制協(xié)議。
技術實現(xiàn)思路
1、針對現(xiàn)有技術的不足,本發(fā)明提出一種基于遞推投影辨識算法的分布式一致性控制方法,來解決具有二集值通信和鄰居速度信息丟失的二階多智能體系統(tǒng)的一致性控制問題,該協(xié)議僅需要鄰居的位置信息和智能體自身的狀態(tài)信息,使得多智能體狀態(tài)最終實現(xiàn)靜態(tài)一致。
2、本發(fā)明基于鄰居智能體的二集值位置信息和遞推投影算法來在線估計鄰居智能體的位置,并利用估計的鄰居智能體的位置信息來更新自身的狀態(tài),從而解決二集值通信環(huán)境下鄰居智能體速度信息未知時二階多智能體的一致性控制問題。
3、本發(fā)明還提供了基于二集值通信和鄰居速度未知下二階多智能體的一致性控制系統(tǒng)。
4、本發(fā)明的技術方案為:
5、二集值通信環(huán)境下速度不可測的二階多智能體系統(tǒng)的一致性控制方法,包括:
6、步驟1:初始化迭代次數(shù),構建二階多智能體系統(tǒng)的多智能體之間相互通訊的拓撲結構圖;設置參數(shù);
7、步驟2:建立二階多智能體系統(tǒng)的動力學模型;
8、步驟3:建立多智能體系統(tǒng)鄰居節(jié)點間的二集值通信模型,智能體傳遞的位置信息量化為二值信息;
9、步驟4:設計一致性協(xié)議,根據(jù)鄰居的位置的二值信息以及自身的狀態(tài)信息通過遞推投影算法進行狀態(tài)估計,將估計值代替真實值來設計一致性控制協(xié)議,來實現(xiàn)二階多智能體系統(tǒng)的靜態(tài)一致的目標;
10、步驟5:迭代更新,重復執(zhí)行步驟4,來實現(xiàn)二階多智能體系統(tǒng)的一致性。
11、根據(jù)本發(fā)明優(yōu)選的,構建二階多智能體系統(tǒng)的多智能體之間相互通訊的拓撲結構圖;包括:
12、建立由n個智能體組成的拓撲結構圖;拓撲結構圖表示為其中,是節(jié)點集;ε為邊集,(j,i)表示邊用有序?qū)Γ?j,i)∈ε,表示節(jié)點i接收到節(jié)點j的信息;為鄰接矩陣,當(j,i)∈ε時,aij=1,否則aij=0;節(jié)點i的鄰居集定義為拉普拉斯矩陣用來描述節(jié)點與邊的關系;拉普拉斯矩陣滿足
13、設第i個智能體的位置、速度初始狀態(tài)和初始估計分別為xi(1)、
14、初始狀態(tài)滿足:|xi(1)|≤m,m>0,是一個常數(shù)定值;位置閾值為c/;j是指智能體i即節(jié)點i的鄰居智能體。
15、根據(jù)本發(fā)明優(yōu)選的,建立二階多智能體系統(tǒng)的動力學模型;包括:
16、將每個智能體視為一個節(jié)點,則二階多智能體系統(tǒng)的多智能體之間相互通訊的拓撲結構圖中每個節(jié)點遵循以下動態(tài)方程:
17、xi(t+1)=xi(t)+vi(t)
18、vi(t+1)=vi(t)+ui(t)
19、其中:xi(t)、vi(t)、ui(k)分別表示第i個節(jié)點迭代t次的位置、速度、控制協(xié)議,xi(t+1)、vi(t+1)分別表示第i個節(jié)點迭代t+1次的位置、速度;該動態(tài)方程即建立的第i個節(jié)點的動力學模型。
20、根據(jù)本發(fā)明優(yōu)選的,建立多智能體系統(tǒng)鄰居節(jié)點間的二集值通信模型:系統(tǒng)節(jié)點i只能收到其鄰居節(jié)點j的二集值信息,其集值通信模型如下:
21、
22、y/ij(t)=xi(t)+d/ij(t)
23、其中,表示t時刻節(jié)點i收到鄰居節(jié)點j的二集值信息,i{.}為示性函數(shù),其定義為表示t時刻節(jié)點j發(fā)送給節(jié)點i的帶噪聲的位置狀態(tài),c/為二集值通信下位置信息的閾值,表示服從均值為0,方差為δ的正態(tài)分布的獨立同分布的通信噪聲,其分布函數(shù)和概率密度函數(shù)分別為f(x)和f(x)=df(x)/dx≠0。
24、根據(jù)本發(fā)明優(yōu)選的,設計一致性協(xié)議,包括:
25、初始化系統(tǒng):設第i個節(jié)點的初始位置狀態(tài)、初始速度狀態(tài)和對鄰居節(jié)點初始位置估計分別為xi(0)、vi(0)、初始位置狀態(tài)滿足|xi(0)|≤m,m是一個大于零的常數(shù);
26、狀態(tài)估計:節(jié)點i基于接收到的鄰居智能體j位置的二值信息利用遞推投影算法對鄰居節(jié)點j的位置xj(t)進行估計,得到估計值
27、
28、其中,πe(·)是一個投影算子,定義為m>0,是一個給定的常數(shù),為t-1時刻節(jié)點i對節(jié)點j的位置信息的估計值,估計步長β>0,f為通信噪聲的分布函數(shù),c/為集值通信下位置信息的閾值,為t時刻節(jié)點i收到的節(jié)點j的位置二集值信息;
29、控制更新:根據(jù)得到的位置狀態(tài)估計值節(jié)點i通過如下控制協(xié)議進行一致性控制:
30、
31、其中,i=1,2,...,n,步長a(t)為正值遞減序列,滿足控制參數(shù)ko,ku滿足如下條件:矩陣有一個重數(shù)為1的特征值1,且其它特征值均在單位圓內(nèi);
32、迭代更新。
33、重復執(zhí)行狀態(tài)估計和控制更新,直至實現(xiàn)二階多智能體系統(tǒng)的一致。
34、一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)二集值通信環(huán)境下速度不可測的二階多智能體系統(tǒng)的一致性控制方法的步驟。
35、一種計算機可讀存儲介質(zhì),其上存儲有計算機程序,所述計算機程序被處理器執(zhí)行時實現(xiàn)二集值通信環(huán)境下速度不可測的二階多智能體系統(tǒng)的一致性控制方法的步驟。
36、二集值通信環(huán)境下速度不可測的二階多智能體系統(tǒng)的一致性控制系統(tǒng),包括:
37、初始化及拓撲結構圖構建模塊,被配置為:初始化迭代次數(shù)t為0,構建二階多智能體系統(tǒng)的多智能體之間相互通訊的拓撲結構圖;設置參數(shù);
38、二階多智能體系統(tǒng)的動力學模型建立模塊,被配置為:建立二階多智能體系統(tǒng)的動力學模型;
39、二階多智能體系統(tǒng)的通訊模型建立模塊,被配置為:建立多智能體系統(tǒng)鄰居節(jié)點間的二集值通信模型,智能體傳遞的位置信息量化為二值信息;
40、二階多智能體系統(tǒng)的靜態(tài)一致實現(xiàn)模塊,被配置為:設計一致性協(xié)議,根據(jù)鄰居的位置的二值信息以及自身的狀態(tài)信息通過遞推投影算法進行狀態(tài)估計,將估計值代替真實值來設計一致性控制協(xié)議,來實現(xiàn)二階多智能體系統(tǒng)的靜態(tài)一致的目標;
41、迭代更新模塊,被配置為:重復執(zhí)行二階多智能體系統(tǒng)的靜態(tài)一致實現(xiàn)步驟,最終實現(xiàn)二階多智能體系統(tǒng)的一致性。
42、本發(fā)明有以下有益效果:
43、1、本發(fā)明針對二集值通信和二階多智能體系統(tǒng),研究了鄰居速度信息未知情況下的一致性問題。本發(fā)明利用在線數(shù)據(jù),將遞推投影辨識算法應用到二階多智能體系統(tǒng)中,實現(xiàn)了多智能體系統(tǒng)的靜態(tài)一致性,該方法降低了系統(tǒng)對數(shù)據(jù)精度的依賴,極大的節(jié)省了通信資源的消耗。
44、2、相對于精確通信環(huán)境下一般的控制協(xié)議,本發(fā)明引入了控制步長,這一特性放寬了控制參數(shù)的選擇范圍,從而能更容易找到合適的參數(shù)來實現(xiàn)期望的控制效果。
45、3、在實際應用中,鄰居速度傳感器損壞或信息丟失的情況,智能體無法獲得鄰居的速度信息,本發(fā)明考慮這種情況下如何設計一致性協(xié)議是現(xiàn)實且有用的。