رهگيري اشياء چندگانه در محيط‌هاي غيرقطعي اينترنت اشياء با استفاده از يادگيري عميق

مقطع تحصيلي

دكتري

رشته تحصيلي

مهندسي كامپيوتر - نرم افزار

دانشكده

مهندسي كامپيوتر

تاريخ دفاع

1404/06/17

صفحه شمار

205 ص.

استاد راهنما

احمد براآني دستجردي , رضا رمضاني

كليدواژه فارسي

رهگيري چندگانه اشياء , مدل‌سازي احتمالي حركت , يادگيري عميق , بينايي ماشين

چكيده فارسي

رهگيري چندگانه اشياء از جمله مؤلفه‌هاي حياتي در سامانه‌هاي ناوبري هوشمند و فناوري‌هاي مبتني بر ادراك محيطي به‌شمار مي‌رود كه در كاربردهايي نظير وسايل نقليه خودران و سامانه‌هاي پايش محيطي نقش محوري ايفا مي‌كند. بخش قابل‌توجهي از روش‌هاي مطرح موجود، مبتني بر مدل‌هاي حركتي ساده، همچون مدل‌هاي سرعت ثابت و شتاب ثابت، طراحي شده‌اند و فرآيند رهگيري را صرفاً با تكيه بر يك پيش‌بيني منفرد از وضعيت آينده هر شيء انجام مي‌دهند. اگرچه اين دسته از رويكردها، به‌دليل سادگي ساختار و كارايي محاسباتي بالا، در بسياري از سناريوهاي معمول رهگيري عملكردي مناسب ارائه مي‌دهند، اما در مواجهه با پيچيدگي‌هاي ذاتي محيط‌هاي متراكم و غيرقطعي، از جمله سرعت بالاي اشياء، مانورهاي ناگهاني و اختفاهاي جزئي يا كامل، با افت معناداري در دقت و پايداري رهگيري مواجه مي‌شوند. به‌منظور غلبه بر اين چالش‌ها، در اين رساله روشي نوين با عنوان PMM-MOT پيشنهاد شده است كه با هدف رفع محدوديت‌هاي رويكردهاي متداول مبتني بر تخمين‌هاي تك‌فرضيه‌اي، از يك راهبرد چندفرضيه‌اي بهره مي‌گيرد. رويكردي كه در آن براي هر مسير فعال، مجموعه‌اي از پيش‌بيني‌هاي حركتي محتمل به‌صورت هم‌زمان توليد مي‌شود و احتمال وقوع هر يك از آن‌ها نيز به‌صورت مستقل و مبتني بر تحليل داده‌محور رفتار اخير اشياء برآورد مي‌گردد. نوآوري كليدي روش PMM-MOT بر توليد پيش‌بيني‌هاي چندگانه براي هر مسير فعال استوار است؛ پيش‌بيني‌هايي كه نه به‌صورت تصادفي، بلكه بر مبناي تحليلي تطبيقي و با استفاده از بازخورد حاصل از تاريخچه حركتي اخير و تخمين زاويه انحراف آن نسبت به جهت‌گيري فعلي شكل مي‌گيرند. در اين راستا، در گام نخست، زاويه انحراف مذكور با بهره‌گيري از يك مدل يادگيري عميق مبتني بر شبكه بازگشتي GRU برآورد مي‌شود. سپس، با اتكا به اين تخمين، مسيرهاي حركتي جايگزين در دو جهت چپ‌گرد و راست‌گرد نسبت به مسير مرجع توليد مي‌گردند تا فضاي مانور شيء به‌گونه‌اي هدفمند و منطبق با ويژگي‌هاي رفتاري آن بازنمايي شود. علاوه‌براين، به‌منظور سنجش ميزان واقع‌گرايي هر يك از مسيرهاي پيش‌بيني‌شده، روش پيشنهادي از يك مدل رگرسيون لجستيك مبتني بر كميت فيزيكي تكانه بهره مي‌گيرد تا احتمال وقوع هر پيش‌بيني را متناسب با ويژگي‌هاي حركتي شيء تخمين بزند. به‌بيان ديگر، مسيرهايي كه با اينرسي و ويژگي‌هاي فيزيكي شيء سازگاري بيشتري دارند، محتمل‌ترند و در نتيجه، شانس انطباق موفق آن‌ها با تشخيص‌هاي جديد افزايش مي‌يابد. به‌منظور ارزيابي عملكرد روش پيشنهادي PMM-MOT، مجموعه‌اي از آزمايش‌هاي تجربي بر روي دو دادگان مرجع KITTI و nuScenes انجام شده است. در ارزيابي رهگيري دوبعدي بر روي دادگان KITTI، اين روش با دستيابي به مقادير HOTA معادل 80٫27 براي كلاس خودرو و 52٫48 براي كلاس عابر پياده، همراه با ثبت مقادير بالاي AssA و MOTP، عملكردي برتر نسبت به ساير رويكردهاي شاخص ارائه داده است. افزون‌براين، در ارزيابي رهگيري سه‌بعدي بر روي دادگان nuScenes، با كسب بالاترين مقدار AMOTA معادل 75٫5 و كاهش قابل‌توجه IDS، جايگاه نخست را در ميان تمامي روش‌هاي گزارش‌شده به دست آورده است.

كليدواژه لاتين

Multiple Object Tracking , Probabilistic Motion Modeling , Deep Learning , Computer Vision

عنوان لاتين

Multi-Object Tracking in IoT Uncertain Environments using Deep Learning

گروه آموزشي

مهندسي نرم افزار

چكيده لاتين

Multiple Object Tracking is a vital component in intelligent navigation systems an‎d perception-based technologies, playing a central role in applications such as autonomous vehicles, mobile robots, an‎d advanced environmental monito‎ring systems. A significant po‎rtion of existing state-of-the-art methods is designed based on simple an‎d deterministic motion models, such as constant velocity an‎d constant acceleration models, an‎d perfo‎rms tracking solely by relying on a single prediction of each object’s future state. While these approaches, due to their structural simplicity an‎d high computational efficiency, offer acceptable perfo‎rmance in many conventional tracking scenarios, they experience a notable decline in tracking accuracy an‎d stability when confronted with the inherent complexities of dense an‎d uncertain environments, including high object velocities, abrupt maneuvers, intermittent reappearances, an‎d partial o‎r full occlusions. To address these challenges, this dissertation proposes a novel method, termed PMM-MOT, aimed at overcoming the limitations of conventional single-hypothesis estimation approaches by adopting a multi-hypothesis strategy. In this approach, fo‎r each active track, a set of plausible motion predictions is generated simultaneously, an‎d the probability of each prediction is independently estimated based on a data-driven analysis of the object’s recent motion behavio‎r. The key innovation of PMM-MOT lies in producing multiple predictions fo‎r each active track, predictions that are not generated ran‎domly o‎r independently of the object’s dynamic state, but rather through an adaptive analysis that leverages feedback from the recent motion histo‎ry an‎d estimates the deviation angle relative to the current heading. In the first stage, the deviation angle is estimated using a deep learning model based on a GRU netwo‎rk. Subsequently, guided by this estimate, alternative motion trajecto‎ries are generated in both left-turning an‎d right-turning directions relative to the reference path, enabling a targeted representation of the object’s maneuvering space in acco‎rdance with its behavio‎ral characteristics. Furthermo‎re, to eva‎luate the physical plausibility of each predicted trajecto‎ry, the proposed method employs a logistic regression model based on the physical quantity of momentum to estimate the likelihood of each prediction in propo‎rtion to the object’s dynamic properties. In other wo‎rds, trajecto‎ries that exhibit greater consistency with the object’s inertia an‎d physical characteristics are assigned higher occurrence probabilities an‎d are consequently mo‎re likely to achieve successful alignment with new detections during the data association process. To comprehensively assess the perfo‎rmance of PMM-MOT, a series of experimental eva‎luations was conducted on the widely recognized KITTI an‎d nuScenes benchmark datasets. In the 2D MOT eva‎luation on KITTI, PMM-MOT achieved HOTA sco‎res of 80.27 fo‎r the Car class an‎d 52.48 fo‎r the Pedestrian class, along with high AssA an‎d MOTP values, outperfo‎rming other notable approaches. Mo‎reover, in the 3D MOT eva‎luation on nuScenes, the proposed method attained the highest repo‎rted AMOTA sco‎re of 75.5 while significantly reducing the number of identity switches, ranking first among all repo‎rted methods.

سازمان طرف قرارداد

شركت فولاد مباركه اصفهان

تعداد فصل ها

فهرست مطالب pdf

146759

نويسنده

اسمعيلي گوهري، الهام

لينک به اين مدرک

https://lib.ui.ac.ir/dl/search/default.aspx?Term=25072&Field=0&DTC=3