شماره ركورد
25721
شماره راهنما
MAT2 724
عنوان
تحليل مولفه هاي اصلي استوار براي خانواده نمايي در شناسايي ناهنجاري ها و استخراج ساختارهاي كم رتبه
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
رياضي كاربردي- علوم داده
دانشكده
رياضي و آمار
تاريخ دفاع
1404/11/01
صفحه شمار
142 ص.
استاد راهنما
ايرج كاظمي , محسن علمبردار ميبدي
كليدواژه فارسي
تحليل مؤلفههاي اصلي، خانواده توزيعهاي نمايي، تجزيه ماتريس كمرتبه–تنك، جريمه نرم هستهاي، نرم l_1 ، بهينهسازي محدب، دادههاي نويزي غيرگاوسي.
چكيده فارسي
در دنياي امروز، دادهها اغلب پيچيده، حجيم و آلوده به نويز و مقادير پرت هستند؛ مسئلهاي كه تحليل و كشف الگوهاي پنهان را دشوار كرده و كارايي روشهاي كلاسيك همچون تحليل مؤلفههاي اصلي را كاهش ميدهد. اگرچه اين روش ساختارهاي اصلي داده را از طريق كاهش بُعد آشكار ميسازد، اما در مواجهه با دادههاي ناهنجار عملكرد مطلوبي ندارد. براي رفع اين مشكل، تحليل مؤلفههاي اصلي استوار معرفي شده است كه داده را به بخش كمرتبه و بخش ناهنجار تجزيه ميكند. با اين حال، اغلب پژوهشها بر توزيع نرمال تمركز داشتهاند، در حاليكه بسياري از دادههاي واقعي، از جمله دادههاي باينري و شمارشي، به خانواده توزيعهاي نمايي تعلق دارند.
در اين پژوهش، چارچوب تحليل مؤلفههاي اصلي استوار براي خانواده نمايي ارائه ميشود كه تعميمي از روشهاي استوار به دادههاي غيرنرمال است. اين چارچوب با بهرهگيري از واگرايي برِگمان، تركيب نرمهستهاي و نرم (l_1)، ساختارهاي كمرتبه و ناهنجار را با دقت مدلسازي ميكند. براي حل مسئله بهينهسازي، الگوريتمي كارآمد مبتني بر روش جهتهاي متناوب ضربكنندهها طراحي شده است. كارايي روش پيشنهادي در دو مطالعه واقعي، شامل تشخيص عيوب ورقهاي فولادي و تحليل رخدادهاي جرمشناسي شهري، بررسي شده و نتايج نشان ميدهد كه اين چارچوب در استخراج ساختارهاي پنهان دادههاي پيچيده، پراكنده و ناهنجار، عملكردي دقيق و قابل اتكا دارد. افزون بر اهميت نظري، اين روش در توسعه سامانههاي پايش هوشمند، تشخيص ناهنجاري و تصميمگيري دادهمحور كاربردهاي گستردهاي دارد.
كليدواژه لاتين
Robust principal component analysis, Exponential family distributions, Low-rank–sparse matrix decomposition, Nuclear-norm regularization, l_1 norm, Convex optimization, Noisy non-Gaussian data.
عنوان لاتين
Robust Principal Component Analysis for Exponential Family in Anomaly Detection and Low-Rank Structure Extraction
گروه آموزشي
رياضي كاربردي و علوم كامپيوتر
چكيده لاتين
In practical scenarios, data structures are frequently appeared to be complicated due to high-dimensional, and affected by noise or outliers. Therefore, analysts need sophisticated techniques to analyze data for discovering hidden patterns and reducing dimensions. Traditional principal component analysis (PCA) is widely employed for dimension reduction, yet it tends to be unstable in dealing with anomalous data. To address this issue, robust PCA is introduced, which separates the data into low-rank and anomalous components. However, much of the research has concentrated on normal distribution for continuous responses. Nonetheless, numerous real-world datasets, including binary and count data, belong to the exponential family of distributions. This thesis presents a robust principal component analysis framework adapted for the exponential family, extending robust methods to non-normal responses. This framework utilizes Bregman divergence and combines kernel and (l_1)-norm regularizations to effectively model low-rank and anomalous structures. An efficient algorithm operating the alternating direction method of multipliers has been developed to solve the optimization problem. The proposed methodʹs effectiveness is assessed through two real-world studies: surface defect detection in steel sheets and urban crime event analysis. Results reveal that the framework successfully extracts hidden structures in complex, sparse, and anomalous data. Beyond its theoretical insights, this methodology holds significant potential for applications in areas such as intelligent monitoring systems, anomaly detection, and data-driven decision-making processes.
تعداد فصل ها
4
فهرست مطالب pdf
157574
نويسنده