• شماره ركورد
    24792
  • شماره راهنما
    COM3 139
  • عنوان

    معيارهاي جديد فاصله برمبناي هندسه داده‌ها و استفاده از هندسه‌هاي نااقليدسي

  • مقطع تحصيلي
    دكتري
  • رشته تحصيلي
    مهندسي كامپيوتر - هوش مصنوعي و رباتيكز
  • دانشكده
    مهندسي كامپيوتر
  • تاريخ دفاع
    1404/3/27
  • صفحه شمار
    106 ص.
  • استاد راهنما
    حسين ماهوش محمدي
  • استاد مشاور
    =پيمان اديبي
  • كليدواژه فارسي
    هندسه‌هاي نااقليدسي , معيار فاصله , خمينه , تانسور ريماني
  • چكيده فارسي
    بسياري از الگوريتم‌هاي يادگيري ماشين از فاصله اقليدسي، به‌عنوان يك معيار مهم در ارزيابي شباهت مابين نمونه‌ها، استفاده مي‌كنند. ولي در هرصورت، اين معيار وقتي كه داده‌ها در فضاي خمينه با انحناي غيرصفر قرار دارند معتبر نيست. بنابراين، در اين رساله يك روش غيرخطي ارائه مي‌شود كه از انحنا براي محاسبه‌ي فاصله استفاده مي‌كند. انحنا يك ويژگي مهم از داده‌ها است، كه با انجام تبديلات ايزومتريك تغيير نمي‌‌كند. در اين رساله، دو فرمول جديد براي اندازه‌گيري فاصله در يك خمينه با انحناي ثابت ارائه شده‌است، و درستي اين فرمول‌ها با استفاده از قوانين مرتبط در هندسه ديفرانسيل اثبات شده‌اند. با به‌كارگيري اين فرمول‌ها، الگوريتمي براي اندازه‌گيري فاصله‌ي يك نمونه تا مركز يك دسته توسعه داده شده‌است. در الگوريتم پيشنهادي، مسيرهاي ژئودزيك به قطعات كوچك خطي تقسيم شده‌اند و فرض مي‌شود انحنا در اين قطعات ثابت باقي بماند. درست بودن اين فرض در بسياري از داده‌ها به‌صورت تجربي آزمايش شده‌است. براي تخمين اين انحناي ثابت در هر قطعه، از نمونه‌هايي كه در همسايگي آن قطعه قرار دارند استفاده شده‌است. در آخر، فاصله‌ي نهايي از مجموع اين فاصله‌هاي كوچك نااقليدسي به‌دست مي‌آيد. روش پيشنهادي از مفاهيم الگوريتم k-means استفاده مي‌كند ولي عملكرد آن به‌صورت بانظارت است، اين روش را NEK-centers مي‌ناميم. درستي اين روش توسط تانسور ريماني، و قوانين مرتبط در هندسه ديفرانسيل اثبات مي‌شود. علاوه‌‌ بر ‌اين، نتايج آزمايش‌هاي تجربي نشان مي‌دهند اين مدل در مسائل واقعي دسته‌بندي داده‌ها به‌خوبي عمل مي‌كند. براي انجام آزمايش‌ها، از فضاي ماتريس‌هاي متقارن و اكيداً مثبت (SPD) استفاده شده‌است. اين ماتريس‌ها معمولاً با استفاده از معيارهاي نااقليدسي تقويت مي‌شوند، و اين معيارها انحنا را به اين فضا اضافه مي‌كنند.
  • كليدواژه لاتين
    Non-Euclidean Geometries , Distance Metric , Manifold , Riemann Tensor
  • عنوان لاتين
    New Distance Metrics Based on the Geometry of Data an‎d Using Non-Euclidean Geometries
  • گروه آموزشي
    مهندسي هوش مصنوعي
  • چكيده لاتين
    Many machine learning algorithms use Euclidean distance as a common metric to calculate similarities between data. However, Euclidean distance is not valid when data lie on a manifold with non-zero curvatures. Therefore, we propose a new non-parametric approach that uses curvatures to calculate distances. Curvature is an appealing feature for this purpose since it is not altered by isometries. In this thesis, we propose two formulas for measuring distances on a manifold with constant curvature, an‎d their validities are proven using the theorems of differential geometry. Utilizing these formulas, an algorithm is developed to measure the distance between a point an‎d the center of a class. In the proposed algorithm geodesies are divided into equal linear segments, assuming that the curvature remains constant within each segment. This assumption is shown to be valid in many data spaces experimentally. Observed data near each segment is used to estimate the curvatures an‎d calculate the distance within each segment. Finally, the total distance is computed by summing up the non-Euclidean lengths of all segments. The proposed method is a supervised version of k-means, named non-Euclidean centers (NEK-centers). the correctness of the proposed method is validated using the Riemann tensor an‎d its related theorems in differential geometry. Furthermore, experimental results show that our method performs well in real-world data classification applications. Symmetric positive definite (SPD) matrices, which lie on manifolds, are used for input data representations.
  • تعداد فصل ها
    6
  • فهرست مطالب pdf
    137584
  • نويسنده

    قاضي عسگر، مهران