شماره ركورد
25860
شماره راهنما
COM2 716
عنوان
ارائه يك رويكرد يادگيري عميق براي تشخيص سهبعدي اشيا برروي ابر نقاط در خودروي خودران
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي كامپيوتر - هوش مصنوعي و رباتيكز
دانشكده
مهندسي كامپيوتر
تاريخ دفاع
1404/11/01
صفحه شمار
68 ص .
استاد راهنما
حميدرضا برادران كاشاني
كليدواژه فارسي
ابر نقاط , تشخيص سهبعدي , خودروي خودران , يادگيري عميق , بينايي ماشين
چكيده فارسي
اهميت و ضرورت تحقيق در حوزههايي مانند خودروهاي خودران و رباتيك، دقت و حساسيت تصميمگيري نقشي حياتي در امنيت ايفا ميكند. در يك خودروي خودران، هرچه درك محيطي به واقعيت سهبعدي نزديكتر باشد، فرآيند تصميمگيري دقيقتر شده و احتمال بروز حوادث كاهش مييابد. برخلاف دادههاي دوبعدي، ابر نقاط به رباتها و سيستمهاي خودران اجازه ميدهد تا حجم، فاصله دقيق و ابعاد واقعي موانع را درك كنند. بنابراين، انتقال وظايف بينايي ماشين (مانند كلاسه بندي و تشخيص اشيا) از فضاي دوبعدي به فضاي ابر نقاط، ضرورتي انكارناپذير در سيستمهاي هوشمند مدرن است.هدف اصلي اين پژوهش، بررسي و تحليل روشهاي موجود در تشخيص سهبعدي اشيا بر روي دادههاي ابر نقاط است. چالش اصلي در اين حوزه، حجم بالاي دادهها و ماهيت نامنظم آنهاست كه پردازش بلادرنگ را دشوار ميكند.
در اين پژوهش، پس از ارزيابي رويكردهاي فعلي، يك روش پيشنهادي ارائه خواهد شد كه با هدف بهينهسازي سرعت و دقت، بتواند به تشخيص بلادرنگ و كارآمد اشيا در محيطهاي پيچيده بپردازد. اين رويكرد با الگو گرفتن از پژوهشهاي پيشين با استفاده از مدل مبدل و الگوي اشياي دور و نزديك و همچنين مكانيسم توجه، يك رويكرد نوين با استفاده از تركيب خبرهها كه يك رويكرد براي استفاده از تركيب چند مدل به صورت هوشمند است و همچنين تطبيق دهندهها كه راهكاري براي كاهش پارامتر هاي مدلهاي عميق مبتني بر مبدل ها و جلوگيري از فراموشي فاجعهبار هستند، روش ابتكاري MoAd را معرفي ميكند كه علاوه بر قابل رقابت بودن در دقت، به دليل استفاده همزمان از هر دو رويكرد ذكرشده، سرعت اجراي بالايي را نيز ارائه ميكند كه به كاربرد در دنياي واقعي نزديكتر ميباشد. اين روش برروي مجموعه داده مرجع KITTI آموزش و صحتسنجي شد و در نهايت با دقت 86٪ برروي مجموعه داده صحتسنجي بر روي دسته ماشين متوسط و زمان اجراي 17 ميلي ثانيه به مدلي قابل رقابت با مدلهاي روز دنيا بدل شد.
كليدواژه لاتين
Point Cloud , 3D Object Detection , Autonomous Vehicles , Deep Learning , Computer Vision
عنوان لاتين
A novel approach for 3D object detection on point clouds in autonomous driving
گروه آموزشي
مهندسي هوش مصنوعي
چكيده لاتين
Nowadays, RGB image processing algorithms have achieved brilliant results in fields such as medicine, agriculture, and computer vision. However, 2D images only contain width and height information; the depth of objects (z-component) present in the real world is lost during standard imaging processes. To compensate for this deficiency, the use of depth sensors—such as Kinect cameras or LiDAR sensors—has enabled the extraction of 3D data. The output of these sensors is a collection of spatial points known as a "Point Cloud," where each point possesses coordinates (x, y, z), and its precision depends on the sensorʹs resolution. In fields such as autonomous driving and robotics, the accuracy and sensitivity of decision-making play a vital role in safety. In an autonomous vehicle, the closer the environmental perception is to 3D reality, the more precise the decision-making process becomes, thereby reducing the likelihood of accidents. Unlike 2D data, point clouds allow robots and self-driving systems to perceive the volume, exact distance, and real dimensions of obstacles. Therefore, transitioning computer vision tasks—such as classification and object detection—from 2D space to point cloud environments is an undeniable necessity in modern intelligent systems. The primary objective of this research is to investigate and analyze existing methods for 3D Object Detection on point cloud data. The main challenge in this field is the high volume of data and its unordered nature, which complicates real-time processing. In this study, after evaluating current approaches, a proposed method will be presented aiming to optimize both speed and accuracy, enabling efficient and real-time object detection in complex environments.
تعداد فصل ها
6
فهرست مطالب pdf
159201
نويسنده