麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

一種基于改進低熵策略及網絡結構的無人艇智能控制方法

文檔序號:41774682發布日期:2025-04-29 18:48閱讀:來源:國知局

技術特征:

1.一種基于改進低熵策略及網絡結構的無人艇智能控制方法,其特征在于,包括以下步驟:

2.根據權利要求1所述的一種基于改進低熵策略及網絡結構的無人艇智能控制方法,其特征在于,所述無人艇的動作空間包括無人艇左電機控制率、右電機控制率、與目標點距離以及與障礙物距離,所述狀態空間包括無人艇線速度、角速度、與目標點距離、與障礙物距離、左電機控制率和右電機控制率。

3.根據權利要求1所述的一種基于改進低熵策略及網絡結構的無人艇智能控制方法,其特征在于,所述獎勵函數的表達式為:

4.根據權利要求1所述的一種基于改進低熵策略及網絡結構的無人艇智能控制方法,其特征在于,所述actor網絡為雙策略網絡,包括actor_1子網絡和actor_2子網絡,所述actor_1子網絡和actor_2子網絡并行地與環境進行交互,輸出控制動作。

5.根據權利要求1所述的一種基于改進低熵策略及網絡結構的無人艇智能控制方法,其特征在于,所述critic網絡包括critic_1子網絡和critc_2子網絡,所述critic_1子網絡和critc_2子網絡并行執行所述價值估計,其中價值估計結果包括狀態值函數和狀態-動作價值函數,表達式分別為:

6.根據權利要求1所述的一種基于改進低熵策略及網絡結構的無人艇智能控制方法,其特征在于,所述采用低熵動作選擇機制選擇低熵動作的運算表達式為:

7.根據權利要求1所述的一種基于改進低熵策略及網絡結構的無人艇智能控制方法,其特征在于,所述改進的lstm網絡對輸入門計算過程中細胞狀態的更新方式進行改進,改進后的細胞狀態的更新表達式為:

8.根據權利要求1所述的一種基于改進低熵策略及網絡結構的無人艇智能控制方法,其特征在于,所述指導actor網絡輸出控制動作是指基于價值評估結果對網絡參數進行更新,以選取最優控制動作,具體步驟包括:

9.根據權利要求1所述的一種基于改進低熵策略及網絡結構的無人艇智能控制方法,其特征在于,所述無人艇控制器更新的目標函數為:

10.根據權利要求1所述的一種基于改進低熵策略及網絡結構的無人艇智能控制方法,其特征在于,所述無人艇控制器的訓練過程包括:


技術總結
本發明涉及一種基于改進低熵策略及網絡結構的無人艇智能控制方法,該方法包括以下步驟:設置無人艇的動作空間和狀態空間,根據無人艇的多任務目標需求設置獎勵函數,并采用結合低熵動作選擇機制及改進的LSTM網絡的無人艇控制器進行智能控制,直至到達目標點,完成無人艇的智能控制過程,其中所述無人艇控制器包括Actor網絡、Critic網絡和改進的LSTM網絡。與現有技術相比,本發明無人艇能夠在復雜水域中,滿足多任務目標需求,實現智能控制等優點。

技術研發人員:黃志堅,華頓,吳賢坤,張思渝,劉雁集,王仁洪,劉忠利
受保護的技術使用者:上海海事大學
技術研發日:
技術公布日:2025/4/28
當前第2頁1 2 
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
主站蜘蛛池模板: 峡江县| 黑水县| 三穗县| 秦皇岛市| 岳阳市| 西峡县| 交城县| 永仁县| 郎溪县| 南投市| 东乡县| 哈巴河县| 新宁县| 宕昌县| 新昌县| 昌宁县| 阿鲁科尔沁旗| 南宁市| 藁城市| 上杭县| 永德县| 阿尔山市| 琼海市| 花莲市| 浦东新区| 盐亭县| 平顺县| 禹州市| 通渭县| 永昌县| 涿州市| 响水县| 吉林市| 无锡市| 新巴尔虎左旗| 剑河县| 长宁县| 松潘县| 开平市| 镇原县| 正定县|