• شماره ركورد
    25860
  • شماره راهنما
    COM2 716
  • عنوان

    ارائه يك رويكرد يادگيري عميق براي تشخيص سهبعدي اشيا برروي ابر نقاط در خودروي خودران

  • مقطع تحصيلي
    كارشناسي ارشد
  • رشته تحصيلي
    مهندسي كامپيوتر - هوش مصنوعي و رباتيكز
  • دانشكده
    مهندسي كامپيوتر
  • تاريخ دفاع
    1404/11/01
  • صفحه شمار
    68 ص .
  • استاد راهنما
    حميدرضا برادران كاشاني
  • كليدواژه فارسي
    ابر نقاط , تشخيص سه‌بعدي , خودروي خودران , يادگيري عميق , بينايي ماشين
  • چكيده فارسي
    اهميت و ضرورت تحقيق در حوزه‌هايي مانند خودروهاي خودران و رباتيك، دقت و حساسيت تصميم‌گيري نقشي حياتي در امنيت ايفا مي‌كند. در يك خودروي خودران، هرچه درك محيطي به واقعيت سه‌بعدي نزديك‌تر باشد، فرآيند تصميم‌گيري دقيق‌تر شده و احتمال بروز حوادث كاهش مي‌يابد. برخلاف داده‌هاي دوبعدي، ابر نقاط به ربات‌ها و سيستم‌هاي خودران اجازه مي‌دهد تا حجم، فاصله دقيق و ابعاد واقعي موانع را درك كنند. بنابراين، انتقال وظايف بينايي ماشين (مانند كلاسه بندي و تشخيص اشيا) از فضاي دوبعدي به فضاي ابر نقاط، ضرورتي انكارناپذير در سيستم‌هاي هوشمند مدرن است.هدف اصلي اين پژوهش، بررسي و تحليل روش‌هاي موجود در تشخيص سه‌بعدي اشيا بر روي داده‌هاي ابر نقاط است. چالش اصلي در اين حوزه، حجم بالاي داده‌ها و ماهيت نامنظم آن‌هاست كه پردازش بلادرنگ را دشوار مي‌كند. در اين پژوهش، پس از ارزيابي رويكردهاي فعلي، يك روش پيشنهادي ارائه خواهد شد كه با هدف بهينه‌سازي سرعت و دقت، بتواند به تشخيص بلادرنگ و كارآمد اشيا در محيط‌هاي پيچيده بپردازد. اين رويكرد با الگو گرفتن از پژوهش‌هاي پيشين با استفاده از مدل مبدل و الگوي اشياي دور و نزديك و همچنين مكانيسم توجه، يك رويكرد نوين با استفاده از تركيب خبره‌ها كه يك رويكرد براي استفاده از تركيب چند مدل به صورت هوشمند است و همچنين تطبيق دهنده‌ها كه راهكاري براي كاهش پارامتر هاي مدل‌هاي عميق مبتني بر مبدل ها و جلوگيري از فراموشي فاجعه‌بار هستند، روش ابتكاري MoAd را معرفي مي‌كند كه علاوه بر قابل رقابت بودن در دقت، به دليل استفاده همزمان از هر دو رويكرد ذكرشده، سرعت اجراي بالايي را نيز ارائه مي‌كند كه به كاربرد در دنياي واقعي نزديك‌تر مي‌باشد. اين روش برروي مجموعه داده مرجع KITTI آموزش و صحت‌سنجي شد و در نهايت با دقت 86٪ برروي مجموعه داده صحت‌سنجي بر روي دسته ماشين متوسط و زمان اجراي 17 ميلي ثانيه به مدلي قابل رقابت با مدل‌هاي روز دنيا بدل شد.
  • كليدواژه لاتين
    Point Cloud , 3D Object Detection , Autonomous Vehicles , Deep Learning , Computer Vision
  • عنوان لاتين
    A novel approach for 3D object detection on point clouds in autonomous driving
  • گروه آموزشي
    مهندسي هوش مصنوعي
  • چكيده لاتين
    Nowadays, RGB image processing algo‎rithms have achieved brilliant results in fields such as medicine, agriculture, an‎d computer vision. However, 2D images only contain width an‎d height info‎rmation; the depth of objects (z-component) present in the real wo‎rld is lost during stan‎dard imaging processes. To compensate fo‎r this deficiency, the use of depth senso‎rs—such as Kinect cameras o‎r LiDAR senso‎rs—has enabled the extraction of 3D data. The output of these senso‎rs is a collection of spatial points known as a "Point Cloud," where each point possesses coo‎rdinates (x, y, z), an‎d its precision depends on the senso‎rʹs resolution. In fields such as autonomous driving an‎d robotics, the accuracy an‎d sensitivity of decision-making play a vital role in safety. In an autonomous vehicle, the closer the environmental perception is to 3D reality, the mo‎re precise the decision-making process becomes, thereby reducing the likelihood of accidents. Unlike 2D data, point clouds allow robots an‎d self-driving systems to perceive the volume, exact distance, an‎d real dimensions of obstacles. Therefo‎re, transitioning computer vision tasks—such as classification an‎d object detection—from 2D space to point cloud environments is an undeniable necessity in modern intelligent systems. The primary objective of this research is to investigate an‎d analyze existing methods fo‎r 3D Object Detection on point cloud data. The main challenge in this field is the high volume of data an‎d its uno‎rdered nature, which complicates real-time processing. In this study, after eva‎luating current approaches, a proposed method will be presented aiming to optimize both speed an‎d accuracy, enabling efficient an‎d real-time object detection in complex environments.
  • تعداد فصل ها
    6
  • فهرست مطالب pdf
    159201
  • نويسنده

    كرمي فيني، اميرحسين