技術特征:1.一種基于強化學習的雙臂協同采摘方法,采用雙臂六自由度機器人,雙臂六自由度機器人包括兩個機械臂和一個電控裝置,各機械臂的末端均具有用于采摘蘋果的末端執行器;電控裝置為工控計算機;其特征在于:雙臂六自由度機器人通過兩個機械臂上安裝的攝像頭實時采集目標物體的當前狀態信息st,st包括目標蘋果的位置信息、目標蘋果的姿態信息,目標蘋果相對兩個機械臂的距離信息、障礙物的位置信息以及兩個機械臂與障礙物的距離信息;
2.根據權利要求1所述的一種基于強化學習的雙臂協同采摘方法,其特征在于:
3.根據權利要求1或2所述的一種基于強化學習的雙臂協同采摘方法,其特征在于:
4.根據權利要求3所述的一種基于強化學習的雙臂協同采摘方法,其特征在于:雙臂六自由度機器人按以下步驟采摘蘋果:
技術總結本發明公開了一種基于強化學習的雙臂協同采摘方法,采用雙臂六自由度機器人,電控裝置中存儲有基于強化學習的雙智能體算法,包括行動者網絡、評論家網絡、經驗回放緩沖區、兩個智能體以及存儲有s<subgt;t</subgt;信息的環境模塊;兩個智能體分別對應一個機械臂;兩個智能體在工作中連續讀取joint<subgt;t</subgt;,評估獎勵總和r<subgt;t</subgt;;通過優勢函數計算行動者網絡的目標函數,對評論家網絡進行優化,執行動態避障策略,執行多目標貪心采摘策略,劃分獨立工作空間和公共工作空間,實現雙臂協作高效采摘蘋果。本發明融合了MAPPO強化學習與多目標貪心采摘策略(MOGPS)算法,解決雙臂動作同步和任務分配的難題,克服傳統算法在雙臂協作中的局限性,不僅提高雙臂協作采摘效率,還增強機器人在不同作業場景下的適應能力。
技術研發人員:牛金星,于青源,李昱珩,趙俊龍
受保護的技術使用者:華北水利水電大學
技術研發日:技術公布日:2025/4/28