-
شماره ركورد
24792
-
شماره راهنما
COM3 139
-
نويسنده
قاضي عسگر، مهران
-
عنوان
معيارهاي جديد فاصله برمبناي هندسه دادهها و استفاده از هندسههاي نااقليدسي
-
مقطع تحصيلي
دكتري
-
رشته تحصيلي
مهندسي كامپيوتر - هوش مصنوعي و رباتيكز
-
دانشكده
مهندسي كامپيوتر
-
تاريخ دفاع
1404/3/27
-
صفحه شمار
106 ص.
-
استاد راهنما
حسين ماهوش محمدي
-
استاد مشاور
=پيمان اديبي
-
كليدواژه فارسي
هندسههاي نااقليدسي , معيار فاصله , خمينه , تانسور ريماني
-
چكيده فارسي
بسياري از الگوريتمهاي يادگيري ماشين از فاصله اقليدسي، بهعنوان يك معيار مهم در ارزيابي شباهت مابين نمونهها، استفاده ميكنند. ولي در هرصورت، اين معيار وقتي كه دادهها در فضاي خمينه با انحناي غيرصفر قرار دارند معتبر نيست. بنابراين، در اين رساله يك روش غيرخطي ارائه ميشود كه از انحنا براي محاسبهي فاصله استفاده ميكند. انحنا يك ويژگي مهم از دادهها است، كه با انجام تبديلات ايزومتريك تغيير نميكند. در اين رساله، دو فرمول جديد براي اندازهگيري فاصله در يك خمينه با انحناي ثابت ارائه شدهاست، و درستي اين فرمولها با استفاده از قوانين مرتبط در هندسه ديفرانسيل اثبات شدهاند. با بهكارگيري اين فرمولها، الگوريتمي براي اندازهگيري فاصلهي يك نمونه تا مركز يك دسته توسعه داده شدهاست. در الگوريتم پيشنهادي، مسيرهاي ژئودزيك به قطعات كوچك خطي تقسيم شدهاند و فرض ميشود انحنا در اين قطعات ثابت باقي بماند. درست بودن اين فرض در بسياري از دادهها بهصورت تجربي آزمايش شدهاست. براي تخمين اين انحناي ثابت در هر قطعه، از نمونههايي كه در همسايگي آن قطعه قرار دارند استفاده شدهاست. در آخر، فاصلهي نهايي از مجموع اين فاصلههاي كوچك نااقليدسي بهدست ميآيد. روش پيشنهادي از مفاهيم الگوريتم k-means استفاده ميكند ولي عملكرد آن بهصورت بانظارت است، اين روش را NEK-centers ميناميم. درستي اين روش توسط تانسور ريماني، و قوانين مرتبط در هندسه ديفرانسيل اثبات ميشود. علاوه بر اين، نتايج آزمايشهاي تجربي نشان ميدهند اين مدل در مسائل واقعي دستهبندي دادهها بهخوبي عمل ميكند. براي انجام آزمايشها، از فضاي ماتريسهاي متقارن و اكيداً مثبت (SPD) استفاده شدهاست. اين ماتريسها معمولاً با استفاده از معيارهاي نااقليدسي تقويت ميشوند، و اين معيارها انحنا را به اين فضا اضافه ميكنند.
-
كليدواژه لاتين
Non-Euclidean Geometries , Distance Metric , Manifold , Riemann Tensor
-
عنوان لاتين
New Distance Metrics Based on the Geometry of Data and Using Non-Euclidean Geometries
-
گروه آموزشي
مهندسي هوش مصنوعي
-
چكيده لاتين
Many machine learning algorithms use Euclidean distance as a common metric to calculate similarities between data. However, Euclidean distance is not valid when data lie on a manifold with non-zero curvatures. Therefore, we propose a new non-parametric approach that uses curvatures to calculate distances. Curvature is an appealing feature for this purpose since it is not altered by isometries. In this thesis, we propose two formulas for measuring distances on a manifold with constant curvature, and their validities are proven using the theorems of differential geometry. Utilizing these formulas, an algorithm is developed to measure the distance between a point and the center of a class. In the proposed algorithm geodesies are divided into equal linear segments, assuming that the curvature remains constant within each segment. This assumption is shown to be valid in many data spaces experimentally. Observed data near each segment is used to estimate the curvatures and calculate the distance within each segment. Finally, the total distance is computed by summing up the non-Euclidean lengths of all segments. The proposed method is a supervised version of k-means, named non-Euclidean centers (NEK-centers). the correctness of the proposed method is validated using the Riemann tensor and its related theorems in differential geometry. Furthermore, experimental results show that our method performs well in real-world data classification applications. Symmetric positive definite (SPD) matrices, which lie on manifolds, are used for input data representations.
-
تعداد فصل ها
6
-
لينک به اين مدرک :