طراحي كنترل‌كننده تناسبي-انتگرالي-مشتقي مبتني بر يادگيري تقويتي عميق براي يك نمونه ربات پوشيدني

شماره ركورد
25169
شماره راهنما
ELE2 505
نويسنده
باقري حاجي ابادي، محمد
عنوان
طراحي كنترل‌كننده تناسبي-انتگرالي-مشتقي مبتني بر يادگيري تقويتي عميق براي يك نمونه ربات پوشيدني
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي برق - كنترل
دانشكده
فني و مهندسي
تاريخ دفاع
1404/07/20
صفحه شمار
83 ص.
استاد راهنما
نگين سياف , مهدي ادريسي
كليدواژه فارسي
ربات پوشيدني , كنترل‌كننده تناسبي-انتگرالي-مشتقي , يادگيري تقويتي عميق , شبكه عصبي اسپايكي , روش تاگوچي , سيستم‌هاي چند ورودي-چند خروج
چكيده فارسي
در اين پژوهش، يك روش نوين براي طراحي كنترل‌كننده تناسبي-انتگرالي-مشتقي هوشمند براي يك نمونه ربات پوشيدني سه ‌درجه آزادي كه وظيفه توانبخشي حركت نشستن و برخاستن را دارد، ارائه شده است. هدف اصلي، خودكارسازي و بهينه‌سازي ضرايب كنترل‌كننده به‌صورت آنلاين با بهره‌گيري از هوش مصنوعي و غلبه بر چالش‌هاي كنترل سيستم‌هاي غيرخطي و چند ورودي-چند خروجي است. براي اين منظور، يك ساختار كنترلي مبتني بر خطي‌سازي فيدبك به‌عنوان زيرساخت انتخاب و دو خانواده از روش‌هاي هوشمند براي تنظيم ضرايب PID، طراحي، پياده‌سازي و مقايسه شده‌اند كه در اين ميان، چهار الگوريتم يادگيري تقويتي عميق (DDPG, TD3, SAC, PPO) و دو مدل شبكه عصبي اسپايكي( Rate-BasedوLIF ) قرار دارد. براي تضمين يك مقايسه عادلانه و دستيابي به بهترين عملكرد، فراپارامترهاي تمامي الگوريتم‌ها با استفاده از روش آماري تاگوچي بهينه‌سازي شده‌اند. نتايج شبيه‌سازي در محيط متلب نشان مي‌دهد كه تمامي كنترل‌كننده‌هاي هوشمند عملكرد بسيار خوبي دارند. در عين حال، تحليل مقايسه‌اي دقيق‌تر مشخص كرد كه كنترل‌كننده‌هاي مبتني بر شبكه‌هاي عصبي اسپايكي، به ويژه مدلLIF، با ارائه سيگنال‌هاي كنترلي نرم‌تر و مصرف انرژي كمتر، عملكرد بهتري نسبت به الگوريتم‌هاي يادگيري تقويتي از خود به نمايش گذاشتند كه اين امر پتانسيل بالاي رويكردهاي نورومورفيك را در كاربردهاي پيچيده كنترل رباتيك تأييد مي‌كند.
كليدواژه لاتين
Wearable Robot , Proportional-Integral-Derivative (PID) Controller , Deep Reinforcement Learning (DRL) , Spiking Neural Network (SNN) , Taguchi Method , MIMO Systems
عنوان لاتين
Design of a Proportional-Integral-Derivative Controller Based on Deep Reinforcement Learning for a Wearable Robot Example
گروه آموزشي
مهندسي برق
چكيده لاتين
This research presents a novel method for designing an intelligent Proportional-Integral-Derivative (PID) controller for a 3-DOF wearable robot performing the sit-to-stan‎d (STS) rehabilitation task. The main objective is to automate an‎d optimize the controller gains online using artificial intelligence, overcoming the challenges of controlling nonlinear an‎d Multi-Input Multi-Output (MIMO) systems. To this end, a control architecture based on feedback linearization was chosen as the underlying structure, an‎d two families of intelligent methods were implemented an‎d compared for tuning the PID coefficients: four Deep Reinforcement Learning (DRL) algorithms (DDPG, TD3, SAC, PPO) an‎d two Spiking Neural Network (SNN) models (Rate-Based an‎d LIF). To ensure a fair comparison an‎d achieve optimal performance, the hyperparameters of all algorithms were systematically optimized using the Taguchi method. Simulation results in the MATLAB environment demonstrate that all intelligent controllers significantly outperform the classic PID. A more detailed comparative analysis revealed that the SNN-based controllers, particularly the LIF model, exhibited superior performance compared to the reinforcement learning algorithms by providing smoother control signals an‎d lower energy consumption. This finding confirms the high potential of neuromorphic approaches in complex robotic control applications.
تعداد فصل ها
5
فهرست مطالب pdf
148083
لينک به اين مدرک :
https://lib.ui.ac.ir/dL/search/default.aspx?Term=25169&Field=0&DTC=3

کلیه حقوق این اثر برای شرکت مهندسی ارتباطات پيام مشرق محفوظ می باشد

باقري حاجي ابادي، محمد

طراحي كنترل‌كننده تناسبي-انتگرالي-مشتقي مبتني بر يادگيري تقويتي عميق براي يك نمونه ربات پوشيدني