-
شماره ركورد
25169
-
شماره راهنما
ELE2 505
-
نويسنده
باقري حاجي ابادي، محمد
-
عنوان
طراحي كنترلكننده تناسبي-انتگرالي-مشتقي مبتني بر يادگيري تقويتي عميق براي يك نمونه ربات پوشيدني
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي برق - كنترل
-
دانشكده
فني و مهندسي
-
تاريخ دفاع
1404/07/20
-
صفحه شمار
83 ص.
-
استاد راهنما
نگين سياف , مهدي ادريسي
-
كليدواژه فارسي
ربات پوشيدني , كنترلكننده تناسبي-انتگرالي-مشتقي , يادگيري تقويتي عميق , شبكه عصبي اسپايكي , روش تاگوچي , سيستمهاي چند ورودي-چند خروج
-
چكيده فارسي
در اين پژوهش، يك روش نوين براي طراحي كنترلكننده تناسبي-انتگرالي-مشتقي هوشمند براي يك نمونه ربات پوشيدني سه درجه آزادي كه وظيفه توانبخشي حركت نشستن و برخاستن را دارد، ارائه شده است. هدف اصلي، خودكارسازي و بهينهسازي ضرايب كنترلكننده بهصورت آنلاين با بهرهگيري از هوش مصنوعي و غلبه بر چالشهاي كنترل سيستمهاي غيرخطي و چند ورودي-چند خروجي است. براي اين منظور، يك ساختار كنترلي مبتني بر خطيسازي فيدبك بهعنوان زيرساخت انتخاب و دو خانواده از روشهاي هوشمند براي تنظيم ضرايب PID، طراحي، پيادهسازي و مقايسه شدهاند كه در اين ميان، چهار الگوريتم يادگيري تقويتي عميق (DDPG, TD3, SAC, PPO) و دو مدل شبكه عصبي اسپايكي( Rate-BasedوLIF ) قرار دارد. براي تضمين يك مقايسه عادلانه و دستيابي به بهترين عملكرد، فراپارامترهاي تمامي الگوريتمها با استفاده از روش آماري تاگوچي بهينهسازي شدهاند. نتايج شبيهسازي در محيط متلب نشان ميدهد كه تمامي كنترلكنندههاي هوشمند عملكرد بسيار خوبي دارند. در عين حال، تحليل مقايسهاي دقيقتر مشخص كرد كه كنترلكنندههاي مبتني بر شبكههاي عصبي اسپايكي، به ويژه مدلLIF، با ارائه سيگنالهاي كنترلي نرمتر و مصرف انرژي كمتر، عملكرد بهتري نسبت به الگوريتمهاي يادگيري تقويتي از خود به نمايش گذاشتند كه اين امر پتانسيل بالاي رويكردهاي نورومورفيك را در كاربردهاي پيچيده كنترل رباتيك تأييد ميكند.
-
كليدواژه لاتين
Wearable Robot , Proportional-Integral-Derivative (PID) Controller , Deep Reinforcement Learning (DRL) , Spiking Neural Network (SNN) , Taguchi Method , MIMO Systems
-
عنوان لاتين
Design of a Proportional-Integral-Derivative Controller Based on Deep Reinforcement Learning for a Wearable Robot Example
-
گروه آموزشي
مهندسي برق
-
چكيده لاتين
This research presents a novel method for designing an intelligent Proportional-Integral-Derivative (PID) controller for a 3-DOF wearable robot performing the sit-to-stand (STS) rehabilitation task. The main objective is to automate and optimize the controller gains online using artificial intelligence, overcoming the challenges of controlling nonlinear and Multi-Input Multi-Output (MIMO) systems. To this end, a control architecture based on feedback linearization was chosen as the underlying structure, and two families of intelligent methods were implemented and compared for tuning the PID coefficients: four Deep Reinforcement Learning (DRL) algorithms (DDPG, TD3, SAC, PPO) and two Spiking Neural Network (SNN) models (Rate-Based and LIF). To ensure a fair comparison and achieve optimal performance, the hyperparameters of all algorithms were systematically optimized using the Taguchi method. Simulation results in the MATLAB environment demonstrate that all intelligent controllers significantly outperform the classic PID. A more detailed comparative analysis revealed that the SNN-based controllers, particularly the LIF model, exhibited superior performance compared to the reinforcement learning algorithms by providing smoother control signals and lower energy consumption. This finding confirms the high potential of neuromorphic approaches in complex robotic control applications.
-
تعداد فصل ها
5
-
لينک به اين مدرک :