-
شماره ركورد
24467
-
شماره راهنما
ELE2 479
-
نويسنده
اسدي نيا، محمدامين
-
عنوان
پيادهسازي بهينه الگوريتم تشخيص اشياء بر روي سختافزار مبتني بر ZYNQ
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي برق - سيستم هاي الكترونيك ديجيتال
-
دانشكده
فني و مهندسي
-
تاريخ دفاع
1402/11/02
-
صفحه شمار
83 ص.
-
استاد راهنما
محمد كاظمي ورنامخاستي
-
كليدواژه فارسي
تشخيص شي , ZYNQ , Vitis-AI , چندي سازي , شبكههاي عصبي عميق , DPU
-
چكيده فارسي
تشخيص شي يكي از وظايف اساسي در بينايي كامپيوتر است كه به شناسايي، مكانيابي و طبقهبندي اشياء در تصاوير و ويدئوها ميپردازد و در كاربردهايي نظير خودروهاي خودران، تصاوير پزشكي و نظارت ويدئويي اهميت دارد. روشهاي مبتني بر شبكههاي عصبي عميق براي تشخيص شي شامل روشهاي تكمرحلهاي مانند YOLO و SSD براي كاربردهاي بلادرنگ و روشهاي دومرحلهاي مانند Faster R-CNN براي دقت بالاتر هستند. پيادهسازي شبكههاي عصبي عميق تشخيص شي بر روي سختافزارهايي نظير تراشههاي ZYNQ، كه بر پايه فناوري FPGA طراحي شدهاند و علاوه بر مصرف انرژي پايين از قابليت پردازش موازي بهرهمند هستند، با چالشهاي قابلتوجهي مواجه است. اين چالشها شامل محدوديت منابع ذخيرهسازي و محاسباتي، مديريت مصرف انرژي و حفظ دقت مدل ميباشد.
در اين پژوهش، پيادهسازي مدل تشخيص شي تكمرحلهاي YOLOv7-Tiny بر روي سختافزار مبتني بر تراشه ZYNQ با استفاده از مجموعهداده VisDrone مورد بررسي قرار گرفته است. به منظور غلبه بر چالش هاي ذكر شده، از تكنيك چنديسازي براي فشردهسازي مدل استفاده شده است. با اين حال، چنديسازي منجر به افزايش جعبههاي مثبت كاذب شده و در نتيجه دقت مدل تا 5 درصد كاهش يافته و كيفيت بصري نتايج مدل نيز به طور محسوسي كاهش يافته است.براي رفع اين مشكل و اصلاح جعبههاي مرزي پيشبينيشده، از اطلاعات محلي جعبههاي پيشبينيشده و همچنين فيلتر تشخيص لبهي Canny استفاده شده است. نتايج حاصل از اين پژوهش نشان ميدهد كه اين روش اصلاحي موجب بهبود دقت مدل به ميزان 2 درصد شده است.
-
كليدواژه لاتين
Object detection , ZYNQ , Vitis-AI , Quantization , Deep Neural Network , DPU
-
عنوان لاتين
Optimal implementation of object detection on ZYNQ-Based Hardware
-
گروه آموزشي
مهندسي برق
-
چكيده لاتين
Object detection has been one of the fundamental tasks in computer vision, focusing on the identification, localization, and classification of objects in images and videos. Its applications include autonomous vehicles, medical imaging, and video surveillance, among others. The deep learning-based approach to object detection includes single-stage methods like YOLO and SSD for real-time applications and two-stage methods like Faster R-CNN with higher accuracy. The deep learning object detection networksʹ hardware platform implementation, based on ZYNQ chips with the advantages of low energy consumption and parallel processing capabilities designed using FPGA technology, suffers from great challenges. Some of these include: limitations in storage and computing resources, energy consumption management, and model accuracy preservation.
This work discusses the deployment of the single-stage object detection model YOLOv7-Tiny on ZYNQ chip-based hardware with the VisDrone dataset. Towards the encountered problems, a model compression technique quantization has been performed. However, quantization resulted in more false positive bounding boxes and thus decreased model precision by up to 5 percent and reduced the visual quality of the results produced by the model. In this regard, local information of the predicted bounding boxes and the Canny edge detection filter are used to refine the predicted bounding boxes. The results of this research demonstrate that this correction method has improved the modelʹs precision by 2 percent.
-
تعداد فصل ها
5
-
لينک به اين مدرک :