-
شماره ركورد
24966
-
شماره راهنما
ELE2 496
-
نويسنده
اشرف العقلايي، مجتبي
-
عنوان
كنترل ايمن بازوي ربات با استفاده از يادگيري تقويتي عميق
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي برق - كنترل
-
دانشكده
فني و مهندسي
-
تاريخ دفاع
1404/06/25
-
صفحه شمار
106 ص .
-
استاد راهنما
محمد عطائي , نگين سياف
-
استاد مشاور
محمد مطهري فر
-
كليدواژه فارسي
يادگيري تقويتي ايمن , كنترل ايمن بازوي ربات , انجام ايمن وظايف، همزيستي ايمن , ايمني , اجتناب از مانع
-
چكيده فارسي
پژوهش حاضر به توسعه و پيادهسازي يك چهارچوب كنترلي هوشمند براي كنترل ايمن بازوي رباتيك در محيطهاي پويا با استفاده از يادگيري تقويتي عميق پرداخته است. با توجه به نقش كليدي بازوهاي رباتيك در صنايع نوين، تضمين ايمني آنها حين تعامل با محيط و موانع متحرك، يكي از چالشهاي اساسي پيش روي اين فناوري است.
در اين پژوهش، بهمنظور يافتن بهينهترين سياست كنترلي، ابتدا الگوريتمهاي پيشرفته يادگيري تقويتي شاملDDPG ،TD3 و SAC مورد ارزيابي قرار گرفتهاند. نتايج اين ارزيابي، برتري قابل توجه الگوريتمSAC را در مواجهه با اين مسئله نشان داده است؛ از اين رو، اين الگوريتم براي آموزش سياست كنترلي بازوي ربات پاندا فرانكا انتخاب شده است. نوآوري اصلي اين پژوهش، طراحي يك ساختار كنترلي يكپارچه است كه در آن يك رويتگر حالت، سرعتهاي مفصلي را بهصورت آنلاين تخمين زده و اين اطلاعات مستقيماً در تابع پاداش براي جريمه كردن حركات ناگهاني و پرخطر بهكار گرفته ميشود. اين رويكرد، ربات را به سمت يادگيري حركات ذاتاً ايمن و هموار هدايت ميكند. عملكرد سيستم در محيط شبيهسازي PyBullet و در سناريوي پيچيده رسيدن به هدف و اجتناب از مانع ارزيابي گرديده است.
نتايج شبيهسازي حاكي از آن است كه روش پيشنهادي مبتني بر الگوريتم SAC، با نرخ موفقيت بالا، وظيفه خود را به انجام رسانده و در مقايسه با الگوريتمهاي ديگر، مسيرهايي به مراتب ايمنتر و هموارتر توليد ميكند. علاوه بر اين، امكانسنجي عملي اين رويكرد از طريق پيادهسازي و اعتبارسنجي اجزاي كليدي آن بر روي سختافزار واقعي، مورد تأييد قرار گرفت. اين دستاورد به توسعه نسل جديدي از رباتهاي هوشمند و قابل اعتماد كمك كرده و گامي مؤثر در راستاي تحقق اهداف صنعت نسل پنجم، يعني تعامل ايمن و كارآمد انسان و ربات، محسوب ميشود.
-
كليدواژه لاتين
Safe Reinforcement Learning , Safe Control of Robot Manipulator , Obstacle Avoidance , Safe Coexistence , Safety , Safe Task Execution
-
عنوان لاتين
Safe Control of a Robot Manipulator Using Deep Reinforcement Learning
-
گروه آموزشي
مهندسي برق
-
چكيده لاتين
This research focuses on the development and implementation of an intelligent control framework for the safe control of robotic arms in dynamic environments using deep reinforcement learning. Given the pivotal role of robotic arms in modern industries, ensuring their safety during interaction with the environment and moving obstacles remains a fundamental challenge for this technology.
In this study, to find the optimal control policy, advanced reinforcement learning algorithms, including DDPG, TD3, and SAC, were initially evaluated. The results of this assessment demonstrated the significant superiority of the SAC algorithm in addressing this problem; therefore, SAC was selected for training the control policy of the Franka Panda robotic arm. The main innovation of this research is the design of an integrated control architecture where a state observer estimates joint velocities online, and this information is directly incorporated into the reward function to penalize abrupt and risky movements. This approach guides the robot toward learning intrinsically safe and smooth motions. The systemʹs performance was evaluated in the PyBullet simulation environment within complex scenarios involving reaching a target and obstacle avoidance.
Simulation results indicate that the proposed method, based on the SAC algorithm, successfully accomplishes its task with a high success rate and generates significantly safer and smoother trajectories compared to other algorithms. Furthermore, the practical feasibility of this approach was confirmed through the implementation and validation of its key components on real hardware. This achievement contributes to the development of a new generation of intelligent and reliable robots, marking an effective step towards realizing the goals of Industry 5.0, namely safe and efficient human-robot collaboration.
-
تعداد فصل ها
5
-
لينک به اين مدرک :