麻豆精品无码国产在线播放,国产亚洲精品成人AA片新蒲金,国模无码大尺度一区二区三区,神马免费午夜福利剧场

面向移動(dòng)機(jī)械臂全身運(yùn)動(dòng)規(guī)劃的優(yōu)化方法

文檔序號(hào):41737676發(fā)布日期:2025-04-25 17:11閱讀:來源:國知局

技術(shù)特征:

1.一種面向移動(dòng)機(jī)械臂全身運(yùn)動(dòng)規(guī)劃的優(yōu)化方法,其特征在于,包括:

2.根據(jù)權(quán)利要求1所述的面向移動(dòng)機(jī)械臂全身運(yùn)動(dòng)規(guī)劃的優(yōu)化方法,其特征在于,所述基于移動(dòng)機(jī)械臂拍攝的深度圖像,確定環(huán)境特征以及移動(dòng)機(jī)械臂關(guān)節(jié)變化時(shí)的位置梯度,包括:

3.根據(jù)權(quán)利要求1所述的面向移動(dòng)機(jī)械臂全身運(yùn)動(dòng)規(guī)劃的優(yōu)化方法,其特征在于,所述通過強(qiáng)化學(xué)習(xí)訓(xùn)練的演員-評(píng)論家網(wǎng)絡(luò)對移動(dòng)機(jī)械臂的運(yùn)動(dòng)狀態(tài)和運(yùn)動(dòng)動(dòng)作進(jìn)行策略規(guī)劃,得到移動(dòng)機(jī)械臂中末端執(zhí)行器的期望速度,包括:

4.根據(jù)權(quán)利要求3所述的面向移動(dòng)機(jī)械臂全身運(yùn)動(dòng)規(guī)劃的優(yōu)化方法,其特征在于,所述構(gòu)建演員-評(píng)論家網(wǎng)絡(luò)在強(qiáng)化學(xué)習(xí)的迭代時(shí)間步上的最大熵,包括:

5.根據(jù)權(quán)利要求3所述的面向移動(dòng)機(jī)械臂全身運(yùn)動(dòng)規(guī)劃的優(yōu)化方法,其特征在于,所述演員-評(píng)論家網(wǎng)絡(luò)的策略規(guī)劃訓(xùn)練過程包括:

6.根據(jù)權(quán)利要求5所述的面向移動(dòng)機(jī)械臂全身運(yùn)動(dòng)規(guī)劃的優(yōu)化方法,其特征在于,所述通過最小化所述kl散度來更新所述演員網(wǎng)絡(luò)的參數(shù)和所述評(píng)論網(wǎng)絡(luò)的參數(shù),是通過計(jì)算所述kl散度的更新梯度、并將所述更新梯度的更新目標(biāo)設(shè)置為當(dāng)前軟狀態(tài)動(dòng)作回報(bào)的時(shí)間差分誤差來實(shí)現(xiàn)的,所述更新梯度的計(jì)算過程包括:

7.根據(jù)權(quán)利要求6所述的面向移動(dòng)機(jī)械臂全身運(yùn)動(dòng)規(guī)劃的優(yōu)化方法,其特征在于,所述演員-評(píng)論家網(wǎng)絡(luò)中包括兩個(gè)評(píng)論網(wǎng)絡(luò),所述當(dāng)前軟狀態(tài)動(dòng)作回報(bào)的分布是通過調(diào)用貝葉斯控制函數(shù),對兩個(gè)評(píng)論網(wǎng)絡(luò)在進(jìn)行策略評(píng)估時(shí)輸出的軟狀態(tài)動(dòng)作回報(bào)的分布進(jìn)行混合估計(jì)得到的,所述貝葉斯控制函數(shù)進(jìn)行混合估計(jì)的過程,包括:

8.根據(jù)權(quán)利要求1所述的面向移動(dòng)機(jī)械臂全身運(yùn)動(dòng)規(guī)劃的優(yōu)化方法,其特征在于,所述基于所述位置梯度構(gòu)建用于移動(dòng)機(jī)械臂避障的位置約束條件,包括:

9.根據(jù)權(quán)利要求1所述的面向移動(dòng)機(jī)械臂全身運(yùn)動(dòng)規(guī)劃的優(yōu)化方法,其特征在于,所述關(guān)節(jié)約束參數(shù)包括約束權(quán)重和優(yōu)化偏置,所述構(gòu)建用于對決策變量進(jìn)行約束的關(guān)節(jié)約束參數(shù),包括:

10.一種面向移動(dòng)機(jī)械臂全身運(yùn)動(dòng)規(guī)劃的優(yōu)化裝置,其特征在于,包括:


技術(shù)總結(jié)
本發(fā)明提供一種面向移動(dòng)機(jī)械臂全身運(yùn)動(dòng)規(guī)劃的優(yōu)化方法,涉及機(jī)械臂運(yùn)動(dòng)規(guī)劃技術(shù)領(lǐng)域,方法包括:基于移動(dòng)機(jī)械臂拍攝的深度圖像,確定環(huán)境特征以及移動(dòng)機(jī)械臂關(guān)節(jié)變化時(shí)的位置梯度;通過強(qiáng)化學(xué)習(xí)訓(xùn)練的演員?評(píng)論家網(wǎng)絡(luò)對移動(dòng)機(jī)械臂的運(yùn)動(dòng)狀態(tài)和運(yùn)動(dòng)動(dòng)作進(jìn)行策略規(guī)劃,得到移動(dòng)機(jī)械臂中末端執(zhí)行器的期望速度;基于位置梯度構(gòu)建用于移動(dòng)機(jī)械臂避障的位置約束條件,并構(gòu)建用于對決策變量進(jìn)行約束的關(guān)節(jié)約束參數(shù);基于位置約束條件、關(guān)節(jié)約束參數(shù)確定的二次規(guī)劃求解器對決策變量進(jìn)行優(yōu)化,得到關(guān)節(jié)速度的規(guī)劃結(jié)果。通過本申請,克服移動(dòng)機(jī)械臂運(yùn)動(dòng)規(guī)劃時(shí),在規(guī)劃任務(wù)完成、環(huán)境感知、約束表達(dá)、障礙規(guī)避、以及運(yùn)動(dòng)協(xié)調(diào)性方面均存在局限性的問題。

技術(shù)研發(fā)人員:孫世穎,張宸宇,趙曉光,張宇佳,常慧
受保護(hù)的技術(shù)使用者:中國科學(xué)院自動(dòng)化研究所
技術(shù)研發(fā)日:
技術(shù)公布日:2025/4/24
當(dāng)前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
主站蜘蛛池模板: 新乡市| 古丈县| 镇原县| 洛川县| 德江县| 高青县| 华池县| 合江县| 普洱| 招远市| 三都| 新兴县| 年辖:市辖区| 曲靖市| 利川市| 桐城市| 大连市| 洮南市| 盐池县| 泸州市| 互助| 新化县| 西盟| 新蔡县| 文成县| 葵青区| 吉水县| 元朗区| 岱山县| 工布江达县| 巴南区| 民乐县| 望奎县| 喜德县| 通化市| 玉门市| 任丘市| 崇仁县| 长武县| 达拉特旗| 宁蒗|