شماره ركورد
25072
شماره راهنما
COM3 147
عنوان
رهگيري اشياء چندگانه در محيطهاي غيرقطعي اينترنت اشياء با استفاده از يادگيري عميق
مقطع تحصيلي
دكتري
رشته تحصيلي
مهندسي كامپيوتر - نرم افزار
دانشكده
مهندسي كامپيوتر
تاريخ دفاع
1404/06/17
صفحه شمار
205 ص.
استاد راهنما
احمد براآني دستجردي , رضا رمضاني
كليدواژه فارسي
رهگيري چندگانه اشياء , مدلسازي احتمالي حركت , يادگيري عميق , بينايي ماشين
چكيده فارسي
رهگيري چندگانه اشياء از جمله مؤلفههاي حياتي در سامانههاي ناوبري هوشمند و فناوريهاي مبتني بر ادراك محيطي بهشمار ميرود كه در كاربردهايي نظير وسايل نقليه خودران و سامانههاي پايش محيطي نقش محوري ايفا ميكند. بخش قابلتوجهي از روشهاي مطرح موجود، مبتني بر مدلهاي حركتي ساده، همچون مدلهاي سرعت ثابت و شتاب ثابت، طراحي شدهاند و فرآيند رهگيري را صرفاً با تكيه بر يك پيشبيني منفرد از وضعيت آينده هر شيء انجام ميدهند. اگرچه اين دسته از رويكردها، بهدليل سادگي ساختار و كارايي محاسباتي بالا، در بسياري از سناريوهاي معمول رهگيري عملكردي مناسب ارائه ميدهند، اما در مواجهه با پيچيدگيهاي ذاتي محيطهاي متراكم و غيرقطعي، از جمله سرعت بالاي اشياء، مانورهاي ناگهاني و اختفاهاي جزئي يا كامل، با افت معناداري در دقت و پايداري رهگيري مواجه ميشوند. بهمنظور غلبه بر اين چالشها، در اين رساله روشي نوين با عنوان PMM-MOT پيشنهاد شده است كه با هدف رفع محدوديتهاي رويكردهاي متداول مبتني بر تخمينهاي تكفرضيهاي، از يك راهبرد چندفرضيهاي بهره ميگيرد. رويكردي كه در آن براي هر مسير فعال، مجموعهاي از پيشبينيهاي حركتي محتمل بهصورت همزمان توليد ميشود و احتمال وقوع هر يك از آنها نيز بهصورت مستقل و مبتني بر تحليل دادهمحور رفتار اخير اشياء برآورد ميگردد. نوآوري كليدي روش PMM-MOT بر توليد پيشبينيهاي چندگانه براي هر مسير فعال استوار است؛ پيشبينيهايي كه نه بهصورت تصادفي، بلكه بر مبناي تحليلي تطبيقي و با استفاده از بازخورد حاصل از تاريخچه حركتي اخير و تخمين زاويه انحراف آن نسبت به جهتگيري فعلي شكل ميگيرند. در اين راستا، در گام نخست، زاويه انحراف مذكور با بهرهگيري از يك مدل يادگيري عميق مبتني بر شبكه بازگشتي GRU برآورد ميشود. سپس، با اتكا به اين تخمين، مسيرهاي حركتي جايگزين در دو جهت چپگرد و راستگرد نسبت به مسير مرجع توليد ميگردند تا فضاي مانور شيء بهگونهاي هدفمند و منطبق با ويژگيهاي رفتاري آن بازنمايي شود. علاوهبراين، بهمنظور سنجش ميزان واقعگرايي هر يك از مسيرهاي پيشبينيشده، روش پيشنهادي از يك مدل رگرسيون لجستيك مبتني بر كميت فيزيكي تكانه بهره ميگيرد تا احتمال وقوع هر پيشبيني را متناسب با ويژگيهاي حركتي شيء تخمين بزند. بهبيان ديگر، مسيرهايي كه با اينرسي و ويژگيهاي فيزيكي شيء سازگاري بيشتري دارند، محتملترند و در نتيجه، شانس انطباق موفق آنها با تشخيصهاي جديد افزايش مييابد. بهمنظور ارزيابي عملكرد روش پيشنهادي PMM-MOT، مجموعهاي از آزمايشهاي تجربي بر روي دو دادگان مرجع KITTI و nuScenes انجام شده است. در ارزيابي رهگيري دوبعدي بر روي دادگان KITTI، اين روش با دستيابي به مقادير HOTA معادل 80٫27 براي كلاس خودرو و 52٫48 براي كلاس عابر پياده، همراه با ثبت مقادير بالاي AssA و MOTP، عملكردي برتر نسبت به ساير رويكردهاي شاخص ارائه داده است. افزونبراين، در ارزيابي رهگيري سهبعدي بر روي دادگان nuScenes، با كسب بالاترين مقدار AMOTA معادل 75٫5 و كاهش قابلتوجه IDS، جايگاه نخست را در ميان تمامي روشهاي گزارششده به دست آورده است.
كليدواژه لاتين
Multiple Object Tracking , Probabilistic Motion Modeling , Deep Learning , Computer Vision
عنوان لاتين
Multi-Object Tracking in IoT Uncertain Environments using Deep Learning
گروه آموزشي
مهندسي نرم افزار
چكيده لاتين
Multiple Object Tracking is a vital component in intelligent navigation systems and perception-based technologies, playing a central role in applications such as autonomous vehicles, mobile robots, and advanced environmental monitoring systems. A significant portion of existing state-of-the-art methods is designed based on simple and deterministic motion models, such as constant velocity and constant acceleration models, and performs tracking solely by relying on a single prediction of each object’s future state. While these approaches, due to their structural simplicity and high computational efficiency, offer acceptable performance in many conventional tracking scenarios, they experience a notable decline in tracking accuracy and stability when confronted with the inherent complexities of dense and uncertain environments, including high object velocities, abrupt maneuvers, intermittent reappearances, and partial or full occlusions. To address these challenges, this dissertation proposes a novel method, termed PMM-MOT, aimed at overcoming the limitations of conventional single-hypothesis estimation approaches by adopting a multi-hypothesis strategy. In this approach, for each active track, a set of plausible motion predictions is generated simultaneously, and the probability of each prediction is independently estimated based on a data-driven analysis of the object’s recent motion behavior. The key innovation of PMM-MOT lies in producing multiple predictions for each active track, predictions that are not generated randomly or independently of the object’s dynamic state, but rather through an adaptive analysis that leverages feedback from the recent motion history and estimates the deviation angle relative to the current heading. In the first stage, the deviation angle is estimated using a deep learning model based on a GRU network. Subsequently, guided by this estimate, alternative motion trajectories are generated in both left-turning and right-turning directions relative to the reference path, enabling a targeted representation of the object’s maneuvering space in accordance with its behavioral characteristics. Furthermore, to evaluate the physical plausibility of each predicted trajectory, the proposed method employs a logistic regression model based on the physical quantity of momentum to estimate the likelihood of each prediction in proportion to the object’s dynamic properties. In other words, trajectories that exhibit greater consistency with the object’s inertia and physical characteristics are assigned higher occurrence probabilities and are consequently more likely to achieve successful alignment with new detections during the data association process. To comprehensively assess the performance of PMM-MOT, a series of experimental evaluations was conducted on the widely recognized KITTI and nuScenes benchmark datasets. In the 2D MOT evaluation on KITTI, PMM-MOT achieved HOTA scores of 80.27 for the Car class and 52.48 for the Pedestrian class, along with high AssA and MOTP values, outperforming other notable approaches. Moreover, in the 3D MOT evaluation on nuScenes, the proposed method attained the highest reported AMOTA score of 75.5 while significantly reducing the number of identity switches, ranking first among all reported methods.
سازمان طرف قرارداد
شركت فولاد مباركه اصفهان
تعداد فصل ها
6
فهرست مطالب pdf
146759
نويسنده