本發(fā)明涉及機器人控制技術(shù)領(lǐng)域,具體為一種基于模糊控制算法的AUVs搜索和圍捕任務(wù)分配控制方法。
背景技術(shù):
移動目標(biāo)圍捕就是追捕者對移動目標(biāo)進(jìn)行包圍,使得移動目標(biāo)無路可逃,進(jìn)而采取下一步行動。這就需要多追捕者之間不能是單純的獨立追捕,而是要進(jìn)行協(xié)作,從而高效地完成圍捕任務(wù)。這種多追捕者之間的協(xié)作在機器人學(xué)中被作為一個機器人系統(tǒng),成為一個具有挑戰(zhàn)性的關(guān)鍵問題,產(chǎn)生了很多研究成果。目前對多機器人圍捕問題的研究大體可以分為兩個模型基于傳感器的模型和已知定位模型。在基于傳感器的模型中,常見的控制方法是在未知環(huán)境中進(jìn)行捕獲,通過引入傳感器數(shù)據(jù)的方法進(jìn)行引導(dǎo)和控制。在已知定位模型中,逃避者的位置是已知的,通常用一些人工智能的方法。水下機器人(AUVs)也稱無人遙控潛水器,是一種工作于水下的極限作業(yè)機器人。水下環(huán)境惡劣危險,人的潛水深度有限,所以水下機器人(AUVs)已成為開發(fā)海洋的重要工具。無人遙控潛水器主要有:有纜遙控潛水器和無纜遙控潛水器兩種,其中有纜遙控潛水器又分為水中自航式、拖航式和能在海底結(jié)構(gòu)物上爬行式三種。目前水下環(huán)境多變,很多的水下機器人在搜索圍捕的時候都會遇到困難,因此設(shè)計了一種基于模糊控制算法的AUVs搜索和圍捕任務(wù)分配控制方法。
技術(shù)實現(xiàn)要素:
針對以上問題,本發(fā)明提供了一種基于模糊控制算法的AUVs搜索和圍捕任務(wù)分配控制方法,通過S型模糊神經(jīng)網(wǎng)絡(luò)實現(xiàn)對于水下機器人的非線性時變的動力控制,根據(jù)輸入輸出的樣本來自動設(shè)計和調(diào)整模糊系統(tǒng)的設(shè)計參數(shù),實現(xiàn)模糊系統(tǒng)的自學(xué)習(xí)和自適應(yīng)功能,結(jié)合混合分層式體系結(jié)構(gòu),使得AUVs能夠適應(yīng)不同的復(fù)雜環(huán)境,加大了AUVs的協(xié)作效率,值得推廣。
為實現(xiàn)上述目的,本發(fā)明提供如下技術(shù)方案:一種基于模糊控制算法的AUVs搜索和圍捕任務(wù)分配控制方法,本方法采用四層模糊神經(jīng)網(wǎng)絡(luò)來實現(xiàn)對于AUVs的控制,所使用的模糊神經(jīng)網(wǎng)絡(luò)自上而下為輸入層、模糊化層、規(guī)則層與解模糊層,對應(yīng)的階段子任務(wù)為:
(1)搜索:AUVs采用分區(qū)隨機搜索方式對水下工作區(qū)域進(jìn)行初步搜索,在工作的時候,根據(jù)傳感器的信息進(jìn)行避碰與路徑規(guī)劃,其中各個AUVs單獨完成搜索,自主執(zhí)行規(guī)劃;
(2)圍捕:單個AUV在工作區(qū)域中發(fā)現(xiàn)了規(guī)劃執(zhí)行目標(biāo)之后,通知混合分層式體系中其他AUVs,并且第一個發(fā)現(xiàn)目標(biāo)的AUV成為當(dāng)前l(fā)eader,本leader 基于成員和目標(biāo)航行器的位置信息分配圍捕任務(wù),并將各子任務(wù)發(fā)布給相應(yīng)的圍捕成員。各成員收到任務(wù)后迅速向目標(biāo)點運動,對入侵者實施圍捕;
(3)避障:確定目標(biāo)之后,AUV在自身行進(jìn)轉(zhuǎn)輪的驅(qū)動下進(jìn)行接近,基于傳感器感知到的障礙信息選擇避碰路線,其中障礙包括靜態(tài)障礙物、團隊成員與敵方AUV;
(4)分散:搜索和圍捕目標(biāo)完成之后,自動分散AUVs回到規(guī)劃執(zhí)行的工作區(qū)域內(nèi),準(zhǔn)備下一次目標(biāo)的搜索和圍捕。
作為本發(fā)明一種優(yōu)選的技術(shù)方案,搜索策略:
某個AUV設(shè)定當(dāng)前位置為(xi,yi), 搜索范圍為xil≤xi≤xir,yid≤yi≤yiu,則當(dāng)前的AUV隨機選取搜索點(x'i,y'i)滿足式子:
其中l(wèi) 為一常值,表示AUV 的下一個目標(biāo)點離所有AUV當(dāng)前位置的最小距離不能低于此值,可以定義為工作的規(guī)劃區(qū)域;
圍捕策略:
H1、H2、H3、H4、H5為當(dāng)前參與搜索和圍捕的AUV,α表示當(dāng)前目標(biāo)與AUV之間的夾角,則目標(biāo)運動勢點坐標(biāo)表示需滿足式子:
然后將各個航行器按照極角從小到大排序,與勢點坐標(biāo)集合匹配,按序排列之后得出最優(yōu)化的圍捕分配方式;
避障策略:
基于螞蟻算法,應(yīng)用人工勢場法,使得障礙物對AUV產(chǎn)生斥力,基于已有的AUV六自由度運動模型和PID 控制器。
作為本發(fā)明一種優(yōu)選的技術(shù)方案,模糊神經(jīng)網(wǎng)絡(luò)中:
第一層:輸入節(jié)點層,一共設(shè)置有兩個節(jié)點,其中分別表示控制過程中的偏差與偏差變化率,不對信號進(jìn)行任何非線性處理;
第二層:輸入隸屬度函數(shù)節(jié)點層,每個輸入節(jié)點對應(yīng)13個模糊分區(qū),為保持水下機器人控制的多對稱性,對應(yīng)輸入變量隸屬度函數(shù)的位置;
第三層:模糊規(guī)則節(jié)點層,每一節(jié)點完成一條模糊規(guī)則的蘊含關(guān)系計算,對每一規(guī)則進(jìn)行AND運算;
第四層:輸出節(jié)點層,輸出AUV各個行動主軸上的控制力力矩,偏差和偏差變化率的隸屬度函數(shù)采用相同的分布方式。
作為本發(fā)明一種優(yōu)選的技術(shù)方案,模糊神經(jīng)網(wǎng)絡(luò)中,開始加速與基于高斯函數(shù)的模糊神經(jīng)網(wǎng)絡(luò)相差不大,由于S型隸屬函數(shù)自身的特征,基于S 型隸屬函數(shù)的模糊神經(jīng)網(wǎng)絡(luò)必然比基于高斯型隸屬函數(shù)的模糊神經(jīng)網(wǎng)絡(luò)更快地跟上速度規(guī)劃器,向目標(biāo)點靠近,同樣由于前面分析的原因,速度一旦達(dá)到一個相對穩(wěn)定的值后,則不容易隨位置偏差的變化重新調(diào)整。
作為本發(fā)明一種優(yōu)選的技術(shù)方案,混合分層式體系包括各個AUV內(nèi)設(shè)置有任務(wù)規(guī)劃層,任務(wù)規(guī)劃層與行為控制層之間相互聯(lián)系,行為控制層則通過傳感模塊接收環(huán)境信息反饋,通過控制器來控制AUV運動模型,在環(huán)境中進(jìn)行移動。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是:
本發(fā)明通過S型模糊神經(jīng)網(wǎng)絡(luò)實現(xiàn)對于水下機器人的非線性時變的動力控制,根據(jù)輸入輸出的樣本來自動設(shè)計和調(diào)整模糊系統(tǒng)的設(shè)計參數(shù),實現(xiàn)模糊系統(tǒng)的自學(xué)習(xí)和自適應(yīng)功能,結(jié)合混合分層式體系結(jié)構(gòu),使得AUVs能夠適應(yīng)不同的復(fù)雜環(huán)境,加大了AUVs的協(xié)作效率,值得推廣。
附圖說明
圖1為本發(fā)明圍捕過程中的任務(wù)分配示意簡圖;
圖2為本發(fā)明模糊神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)示意簡圖;
圖3為本發(fā)明避障規(guī)劃示意簡圖;
圖4為本發(fā)明混合分層式體系結(jié)構(gòu)框圖。
具體實施方式
下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例。基于本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
實施例:
請參閱圖1至圖4,本發(fā)明提供一種技術(shù)方案:
本發(fā)明的一種基于模糊控制算法的AUVs搜索和圍捕任務(wù)分配控制方法,本方法采用四層模糊神經(jīng)網(wǎng)絡(luò)來實現(xiàn)對于AUVs的控制,所使用的模糊神經(jīng)網(wǎng)絡(luò)自上而下為輸入層、模糊化層、規(guī)則層與解模糊層,對應(yīng)的階段子任務(wù)為:
(1)搜索:AUVs采用分區(qū)隨機搜索方式對水下工作區(qū)域進(jìn)行初步搜索,在工作的時候,根據(jù)傳感器的信息進(jìn)行避碰與路徑規(guī)劃,其中各個AUVs單獨完成搜索,自主執(zhí)行規(guī)劃;
(2)圍捕:單個AUV在工作區(qū)域中發(fā)現(xiàn)了規(guī)劃執(zhí)行目標(biāo)P之后,通知混合分層式體系中其他AUVs,并且第一個發(fā)現(xiàn)目標(biāo)的AUV成為當(dāng)前l(fā)eader,本leader 基于成員和目標(biāo)航行器的位置信息分配圍捕任務(wù),并將各子任務(wù)發(fā)布給相應(yīng)的圍捕成員H n(n=1.2.3.4.5……)。各成員收到任務(wù)后迅速向目標(biāo)點Tn(n=1.2.3.4.5……)運動,對入侵者實施圍捕;
(3)避障:確定目標(biāo)之后,AUV在自身行進(jìn)轉(zhuǎn)輪的驅(qū)動下進(jìn)行接近,基于傳感器感知到的障礙信息選擇避碰路線,其中障礙包括靜態(tài)障礙物、團隊成員與敵方AUV;
(4)分散:搜索和圍捕目標(biāo)完成之后,自動分散AUVs回到規(guī)劃執(zhí)行的工作區(qū)域內(nèi),準(zhǔn)備下一次目標(biāo)的搜索和圍捕。
其中,搜索策略:
某個AUV設(shè)定當(dāng)前位置為(xi,yi),搜索范圍為xil≤xi≤xir ,yid≤yi≤yiu,則當(dāng)前的AUV隨機選取搜索點(x'i,y'i)滿足式子:
其中l(wèi) 為一常值,表示AUV 的下一個目標(biāo)點離所有AUV 當(dāng)前位置的最小距離不能低于此值,可以定義為工作的規(guī)劃區(qū)域;
圍捕策略:
H1、H2、H3、H4、H5為當(dāng)前參與搜索和圍捕的AUV,α表示當(dāng)前目標(biāo)與AUV之間的夾角,則目標(biāo)運動勢點坐標(biāo)表示需滿足式子:
然后將各個航行器按照極角從小到大排序,與勢點坐標(biāo)集合匹配,按序排列之后得出最優(yōu)化的圍捕分配方式;
避障策略:
基于螞蟻算法,應(yīng)用人工勢場法,使得障礙物對AUV產(chǎn)生斥力,基于已有的AUV六自由度運動模型和PID控制器。
模糊神經(jīng)網(wǎng)絡(luò)中:
第一層:輸入節(jié)點層,一共設(shè)置有兩個節(jié)點,其中分別表示控制過程中的偏差與偏差變化率,不對信號進(jìn)行任何非線性處理;
第二層:輸入隸屬度函數(shù)節(jié)點層,每個輸入節(jié)點對應(yīng)13個模糊分區(qū),為保持水下機器人控制的多對稱性,對應(yīng)輸入變量隸屬度函數(shù)的位置;
第三層:模糊規(guī)則節(jié)點層,每一節(jié)點完成一條模糊規(guī)則的蘊含關(guān)系計算,對每一規(guī)則進(jìn)行AND運算;
第四層:輸出節(jié)點層,輸出AUV各個行動主軸上的控制力力矩,偏差和偏差變化率的隸屬度函數(shù)采用相同的分布方式。
模糊神經(jīng)網(wǎng)絡(luò)中,開始加速與基于高斯函數(shù)的模糊神經(jīng)網(wǎng)絡(luò)相差不大,由于S型隸屬函數(shù)自身的特征,基于S型隸屬函數(shù)的模糊神經(jīng)網(wǎng)絡(luò)必然比基于高斯型隸屬函數(shù)的模糊神經(jīng)網(wǎng)絡(luò)更快地跟上速度規(guī)劃器,向目標(biāo)點靠近,同樣由于前面分析的原因,速度一旦達(dá)到一個相對穩(wěn)定的值后,則不容易隨位置偏差的變化重新調(diào)整。
混合分層式體系包括各個AUV內(nèi)設(shè)置有任務(wù)規(guī)劃層,任務(wù)規(guī)劃層與行為控制層之間相互聯(lián)系,行為控制層則通過傳感模塊接收環(huán)境信息反饋,通過控制器來控制AUV運動模型,在環(huán)境中進(jìn)行移動。
本發(fā)明通過S型模糊神經(jīng)網(wǎng)絡(luò)實現(xiàn)對于水下機器人的非線性時變的動力控制,根據(jù)輸入輸出的樣本來自動設(shè)計和調(diào)整模糊系統(tǒng)的設(shè)計參數(shù),實現(xiàn)模糊系統(tǒng)的自學(xué)習(xí)和自適應(yīng)功能,結(jié)合混合分層式體系結(jié)構(gòu),使得AUVs能夠適應(yīng)不同的復(fù)雜環(huán)境,加大了AUVs的協(xié)作效率,值得推廣。
以上所述僅為本發(fā)明的較佳實施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。