-
شماره ركورد
24602
-
شماره راهنما
ELE2 484
-
نويسنده
توفيقي، محمدتقي
-
عنوان
قطعهبندي معنايي تصاوير معابر شهري ايران
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي برق - سيستم هاي الكترونيك ديجيتال
-
دانشكده
فني و مهندسي
-
تاريخ دفاع
1404/01/20
-
صفحه شمار
77 ص.
-
استاد راهنما
محمد كاظمي ورنامخواستي , محمدفرزان صباحي
-
كليدواژه فارسي
قطعهبندي معنايي , ماشينهاي خودران , شبكههاي عصبي عميق , درختهاي تصميمگيري , جنگل تصادفي
-
چكيده فارسي
قطعهبندي معنايي تصاوير نقش مهمي در سامانههاي خودروهاي خودران، تشخيص تومور در تصاوير پزشكي و واقعيت افزوده دارد؛ اما در حوزهي خودروهاي خودران، مدلهاي موجود دقت مناسبي براي معابر داخلي حاصل نميكنند و مدلهاي مبتني بر يادگيري عميق در مواجهه با تصاويري كه ناآشنا هستند دچار اشكال ميشوند. در اين پژوهش قصد بر آن است تا مدلي براي قطعهبندي تصاوير داخل كشور ارائه شود و سعي شود تا برخي از ايرادات قطعهبندي كاهش دادهشود.
بدين منظور، يك مجموعه داده جديد با استفاده از تصاوير شهري بانام IranUrban گردآوريشده و به كمك نرمافزار CVAT، برچسبگذاري شده است. سپس، شبكهي PIDNet-L با اين دادهها آموزش ديد كه دقت آن برحسب mIoU از 91/44% به 84/68% افزايش پيدا كرد.
همچنين يك روش جديد براي بهبود كيفيت قطعهبندي معنايي تصاوير ارائهشده است تا ايرادات حاصل از تصاوير ناآشنا را تا حد مناسبي كاهش دهد. اين روش به تصوير خروجي قطعهبندي معنايي مانند تصويري متشكل از تعدادي چندضلعي نگاه خواهد كرد. سپس، ويژگيهاي اين چندضلعيها استخراج خواهند شد و با يك الگوريتم تصميمگيري جنگل تصادفي، درستي و يا نادرستي چندضلعيها برحسب ويژگيهاي آنها، بررسي خواهد شد. منظور از درستي يا نادرستي چندضلعيها، آن است كه آيا چندضلعي موجود با توجه به ويژگيهاي آن، امكان وجود دارد يا خير. در پايان چندضلعيهاي نادرست از تصوير خروجي حذف و با جانشيني مناسب پر ميشوند. ميتوان ديد كه اين روش پيشنهادي در عين سادگي و سبكي، توانايي بالايي براي بهبود دقت قطعهبندي معنايي به كمك درختهاي تصميمگيري دارد. بهطوريكه بعد از پيادهسازي به كمك جنگل تصادفي و حذف اشياء نادرست در خروجي PIDNet-L، براي دو مجموعه دادهي CityScapes و IranUrban، در كلاسهايي مانند موتورسيكلت 2 درصد و انسان حدود 1 درصد بهبود داشتهاند و در برخي كلاسها مانند خيابان و ساختمان بهبودي حاصل نشده است. درمجموع روش پيشنهادي 27/0% بهبود برحسب mIoU براي PIDNet-L در مجموعه دادهي CityScapes و 91/0% بهبود برحسب mIoU در مجموعه دادهي IranUrban حاصل كرده است.
-
كليدواژه لاتين
Semantic Segmentation , Self-Driving Cars , Deep Neural Networks , Decision Trees , Random Forest
-
عنوان لاتين
Semantic Segmentation of Iran’s Urban Roads
-
گروه آموزشي
مهندسي برق
-
چكيده لاتين
Semantic Segmentation plays a significant role in self-driving cars, tumor detection and virtual reality. However, since existing self-driving models cannot provide suitable performance for domestic roads and deep-learning based models struggle with unseen images, this research seeks to introduce a neural network suited for the task of semantic segmentation of domestic images and tries to minimize segmentation errors.
For this purpose, a new semantic segmentation dataset called IranUrban is introduced and is labeled by using CVAT, the computer vision annotation tool. Subsequently, PIDNet-L is trained on this dataset, and the resulting accuracy is improved from 44.91% to 68.84% mIoU.
Additionally, a novel method for improving the quality of semantic segmentation is introduced to reduce the error of unseen images. This method views the image segmentation map as a combination of polygons. Afterwards, the features of these polygons are extracted and are judged by a random forest model. Finally, the wrong polygons are removed and filled with a suitable replacement. The polygons are judged based on their features to ascertain whether they should exist. It is discussed that the newly proposed method, while being simple, has a decent potential for improving the quality of semantic segmentation by utilizing decision tree models. It is seen that the implementation of the proposed method with the help of random forest and removing the wrongly detected objects improved the results of PIDNet-L, by 2 percent for motorcycle class and 1 percent for person class on both CityScapes and IranUrban datasets. While some classes were unaffected by the proposed method, the overall accuracy of PIDNet-L has improved by 0.27% on CityScapes and 0.91% mIoU on IranUrban datasets.
-
تعداد فصل ها
5
-
لينک به اين مدرک :