国产伦乱,一曲二曲欧美日韩,AV在线不卡免费在线不卡免费,搞91AV视频

當前位置:主頁 > 科技論文 > 航空航天論文 >

基于DDQN的運載火箭姿態(tài)控制器參數(shù)設(shè)計

發(fā)布時間:2024-07-02 02:42
  探索了利用深度強化學習算法訓練智能體,以代替人類工程師進行火箭姿態(tài)控制器參數(shù)的離線設(shè)計方案。建立了多特征秒的火箭頻域分析模型,選定了設(shè)計參數(shù)。選擇深度強化學習算法中的雙深度Q學習(Double Deep Q Network,DDQN)算法,通過記憶回放和時間差分迭代的方式讓智能體在與環(huán)境交互過程中不斷學習。設(shè)計了對應(yīng)的馬爾科夫決策過程模型,進行了智能體的訓練和前向測試。結(jié)果說明該方法對于運載火箭姿控設(shè)計具有一定參考價值。

【文章頁數(shù)】:6 頁

【部分圖文】:

圖1俯仰通道姿控系統(tǒng)閉環(huán)回路結(jié)構(gòu)圖

圖1俯仰通道姿控系統(tǒng)閉環(huán)回路結(jié)構(gòu)圖

要進行火箭姿態(tài)控制器設(shè)計首先要建立姿控系統(tǒng)的頻域分析模型。控制策略選擇工程上常用的基于“小擾動線性化”的增益預(yù)置法。本文僅考慮俯仰通道,整個姿控系統(tǒng)閉環(huán)回路的結(jié)構(gòu)如圖1所示[9]。


圖2智能體訓練算法流程圖

圖2智能體訓練算法流程圖

首先初始化記憶回放單元D和兩個網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)θ和θ-,開始進行實驗。每次實驗智能體最多可進行1500次調(diào)參。每次調(diào)參后,頻域分析得到的裕度值作為狀態(tài)st經(jīng)過式(16)預(yù)處理,得到,將其作為當前值網(wǎng)絡(luò)的輸入,輸出各動作的狀態(tài)行為值,使用ε-greedy算法選擇動作at并執(zhí)行,得到下....


圖3累計誤差變化隨訓練次數(shù)變化曲線

圖3累計誤差變化隨訓練次數(shù)變化曲線

當網(wǎng)絡(luò)在一定程度上收斂時結(jié)束智能體訓練。訓練累計誤差結(jié)果如圖3所示。訓練開始時誤差較大,累計變化的斜率很大,隨著訓練次數(shù)的增多,誤差減小,斜率放緩。每次實驗的累計回報隨訓練次數(shù)的變化曲線如圖4所示,經(jīng)過一定量的實驗后單次實驗的累計回報能相對穩(wěn)定在20左右。由于智能體的探索以及其他....


圖4單次實驗累計回報隨實驗次數(shù)變化曲線

圖4單次實驗累計回報隨實驗次數(shù)變化曲線

由于火箭姿態(tài)控制器參數(shù)設(shè)計沒有嚴格意義上的最優(yōu)參數(shù)集合,所以理論上控制器的可行參數(shù)集合有無窮個。訓練的目的就是讓智能體模擬人類設(shè)計師的設(shè)計過程,在不斷調(diào)整參數(shù)分析系統(tǒng)性能的過程中,逐漸變得“老道”,從而成為一位優(yōu)秀的控制器“設(shè)計師”。3.2智能體前向測試



本文編號:3999568

資料下載
論文發(fā)表

本文鏈接:http://www.lk138.cn/kejilunwen/hangkongsky/3999568.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6dcfe***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
黄色A片色| 久久久久久久久亚洲精品免费电影| 激情av另类一区| 欧美 A A A| 近親相姦一区二区三区| 黄色91啪啪啪视频| 在线观看日本舔阴视频| 国产清纯综合| 视频在线一区二区图片区| 无码免费1区| 操日本美女免费视频| 国产一区成人二区中文另类| 黄色小说网站亚| 亚洲A99成人| 亚州图区一区二区| 亚洲福利区一区| WWW.一区二区三区无码| 亚洲性高潮久久久久久| 色综合天天综合国产成人网| 飘零电影| 伊人欧美激情| 网页观看AV| 国产一区二区超猛烈| 国外草b网站| www.九九麻豆黄色一级网站| 欧美人妻日韩人妻在线看| 午夜福利成人性生活视频| 草莓丝瓜一区二区三区在线观看| 七月丁香综合| 亚洲午夜激情成人网站| 宁化县| 台湾无码1区2区| 日本高清二区视频| 河南熟女黄片| 囯产亚洲精品综合| 日韩av一区二区麻豆| 芜湖市| 色香色欲综合网| 三级特黄久久久久| \麻豆视频二区| 久碰精997|