• شماره ركورد
    24966
  • شماره راهنما
    ELE2 496
  • عنوان

    كنترل ايمن بازوي ربات با استفاده از يادگيري تقويتي عميق

  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي برق - كنترل
  • دانشكده
    فني و مهندسي
  • تاريخ دفاع
    1404/06/25
  • صفحه شمار
    106 ص .
  • استاد راهنما
    محمد عطائي , نگين سياف
  • استاد مشاور
    محمد مطهري فر
  • كليدواژه فارسي
    يادگيري تقويتي ايمن , كنترل ايمن بازوي ربات , انجام ايمن وظايف، هم‌زيستي ايمن , ايمني , اجتناب از مانع
  • چكيده فارسي
    پژوهش حاضر به توسعه و پياده‌سازي يك چهارچوب كنترلي هوشمند براي كنترل ايمن بازوي رباتيك در محيط‌هاي پويا با استفاده از يادگيري تقويتي عميق پرداخته است. با توجه به نقش كليدي بازوهاي رباتيك در صنايع نوين، تضمين ايمني آن‌ها ‌حين تعامل با محيط و موانع متحرك، يكي از چالش‌هاي اساسي پيش روي اين فناوري است. در اين پژوهش، به‌منظور يافتن بهينه‌ترين سياست كنترلي، ابتدا الگوريتم‌هاي پيشرفته يادگيري تقويتي شاملDDPG ،TD3 و SAC مورد ارزيابي قرار گرفته‌اند. نتايج اين ارزيابي، برتري قابل توجه الگوريتمSAC را در مواجهه با اين مسئله نشان داده است؛ از اين رو، اين الگوريتم براي آموزش سياست كنترلي بازوي ربات پاندا فرانكا انتخاب شده است. نوآوري اصلي اين پژوهش، طراحي يك ساختار كنترلي يكپارچه است كه در آن يك رويتگر حالت، سرعت‌هاي مفصلي را به‌صورت آنلاين تخمين زده و اين اطلاعات مستقيماً در تابع پاداش براي جريمه كردن حركات ناگهاني و پرخطر به‌كار گرفته مي‌شود. اين رويكرد، ربات را به سمت يادگيري حركات ذاتاً ايمن و هموار هدايت مي‌كند. عملكرد سيستم در محيط شبيه‌سازي PyBullet و در سناريوي پيچيده رسيدن به هدف و اجتناب از مانع ارزيابي گرديده است. نتايج شبيه‌سازي حاكي از آن است كه روش پيشنهادي مبتني بر الگوريتم SAC، با نرخ موفقيت بالا، وظيفه خود را به انجام رسانده و در مقايسه با الگوريتم‌هاي ديگر، مسيرهايي به مراتب ايمن‌تر و هموارتر توليد مي‌كند. علاوه بر اين، امكان‌سنجي عملي اين رويكرد از طريق پياده‌سازي و اعتبارسنجي اجزاي كليدي آن بر روي سخت‌افزار واقعي، مورد تأييد قرار گرفت. اين دستاورد به توسعه نسل جديدي از ربات‌هاي هوشمند و قابل اعتماد كمك كرده و گامي مؤثر در راستاي تحقق اهداف صنعت نسل پنجم، يعني تعامل ايمن و كارآمد انسان و ربات، محسوب مي‌شود.
  • كليدواژه لاتين
    Safe Reinforcement Learning , Safe Control of Robot Manipulator , Obstacle Avoidance , Safe Coexistence , Safety , Safe Task Execution
  • عنوان لاتين
    Safe Control of a Robot Manipulator Using Deep Reinforcement Learning
  • گروه آموزشي
    مهندسي برق
  • چكيده لاتين
    This research focuses on the development an‎d implementation of an intelligent control framework for the safe control of robotic arms in dynamic environments using deep reinforcement learning. Given the pivotal role of robotic arms in modern industries, ensuring their safety during interaction with the environment an‎d moving obstacles remains a fundamental challenge for this technology. In this study, to find the optimal control policy, advanced reinforcement learning algorithms, including DDPG, TD3, an‎d SAC, were initially eva‎luated. The results of this assessment demonstrated the significant superiority of the SAC algorithm in addressing this problem; therefore, SAC was selec‎ted for training the control policy of the Franka Pan‎da robotic arm. The main innovation of this research is the design of an integrated control architecture where a state observer estimates joint velocities online, an‎d this information is directly incorporated into the reward function to penalize abrupt an‎d risky movements. This approach guides the robot toward learning intrinsically safe an‎d smooth motions. The systemʹs performance was eva‎luated in the PyBullet simulation environment within complex scenarios involving reaching a target an‎d obstacle avoidance. Simulation results indicate that the proposed method, based on the SAC algorithm, successfully accomplishes its task with a high success rate an‎d generates significantly safer an‎d smoother trajectories compared to other algorithms. Furthermore, the practical feasibility of this approach was confirmed through the implementation an‎d validation of its key components on real hardware. This achievement contributes to the development of a new generation of intelligent an‎d reliable robots, marking an effective step towards realizing the goals of Industry 5.0, namely safe an‎d efficient human-robot collaboration.
  • تعداد فصل ها
    5
  • فهرست مطالب pdf
    144944
  • نويسنده

    اشرف العقلايي، مجتبي