• شماره ركورد
    24024
  • شماره راهنما
    COM3 129
  • عنوان

    فرايادگيري در فضاهاي ريماني

  • مقطع تحصيلي
    دكتري
  • رشته تحصيلي
    مهندسي كامپيوتر - هوش مصنوعي و رباتيكز
  • دانشكده
    مهندسي كامپيوتر
  • تاريخ دفاع
    1403/06/13
  • صفحه شمار
    102 ص.
  • استاد راهنما
    پيمان اديبي , حسين كارشناس
  • كليدواژه فارسي
    فرايادگيري , دسته‌بندي با تعداد نمونه كم , فضاي نااقليدسي , بهينه‌سازي ريماني , فرايادگيري چندماهيتي
  • چكيده فارسي
    هدف غايي يادگيري ماشين، ايجاد توانايي آموختن در كامپيوتر است. فرايادگيري حوزه‌اي نو در يادگيري ماشين است كه به كامپيوتر اجازه مي‌دهد كه چگونگي آموختن را بياموزد و عمل آموزش را با تعداد كمي از مشاهدات و همچنين بهره‌گيري از تجارب حل وظايف يادگيري ديگر انجام دهد. از آن‌جا كه بسياري از مسائل يادگيري ماشين در فضاهاي ريماني و نه اقليدسي مدل‌سازي و حل مي‌گردند، ارائه روش‌هاي فرايادگيري در فضاهاي نااقليدسي ضروري است. در اين پژوهش، چارچوبي براي فرايادگيري نا اقليدسي ارائه مي‌شود كه مبتني‌بر بهينه‌سازي است. اگرچه روش پيشنهادي را مي‌توان براي طيف وسيعي از منيفولدهاي ريماني به‌ كار برد، اما ما به طور ويژه تأثير استفاده از شرط تعامد در پارامترهاي شبكه عصبي مصنوعي را بررسي مي‌كنيم كه با فرايادگيري بر روي منيفولد استيفل معادل است. براي پياده‌سازي روش پيشنهادي، يك روش بهينه‌سازي ريماني كه توسعه‌اي از روش بهينه‌سازي اقليدسي lr{Adam} است توسعه داده شده است. از طرفي مسأله فرايادگيري شامل يك مسأله بهينه‌سازي دوسطحي است كه پيچيدگي محاسباتي بالا و نياز به حافظه زيادي دارد؛ زيرا نيازمند حل دو مسأله بهينه‌سازي تو در تو و محاسبه تانسورهاي مشتقات درجه دوم است. اين چالش در فرايادگيري ريماني بيشتر خواهد بود زيرا براي بهينه‌سازي در آن فضا، از عملگرهاي غيرخطي پيچيده استفاده مي‌شود. لذا در ادامه پژوهش، يك روش مبتني‌بر تخمين مرتبه اول نيز ارائه مي‌گردد. روش‌ پيشنهادي علاوه‌بر عدم نياز به محاسبه مشتقات درجه دوم، پيشنهاد مي‌كند كه علاوه‌بر استفاده از قيد تعامد بر روي ماتريس پارامترهاي لايه دسته‌بند مدل، داده ورودي آن لايه نيز نرمال‌سازي گردد. اين عمل منجر به يادگيري مناسب‌تر مدل خواهد شد. چالش ديگر مسائل فرايادگيري، مواجهه با وظايفي است كه از ماهيت‌هاي متفاوتي نمونه‌برداري شده‌اند. براي حل اين چالش، يك روش چندماهيتي مبتني بر مدولاسيون ارائه مي‌دهيم كه براي توليد ضرايب مدولاسيون از منيفولد استيفل استفاده مي‌كند. هر سه روش پيشنهادي توسط آزمايش‌هاي دسته‌بندي با تعداد نمونه كم ارزيابي و با روش‌هاي رقيب مقايسه شده‌اند. براي انجام آزمايش‌ها دو سناريوي فرايادگيري تك دامنه‌اي و ميان‌دامنه‌اي استفاده شده است. نتايج روش ارائه شده اول نشان مي‌دهد كه صحت دسته‌بندي با تعداد نمونه كم تا 9 نسبت به همتاي اقليدسي خود افزايش يافته است و نتايج برتري نسبت به روش‌هاي فرايادگيري رقيب كسب كرده است. همچنين براي روش پيشنهادي مرتبه اول، با وجود عدم استفاده از متشقات دوم، نتايج نسبت به روش نااقليدسي اول رقابتي و نسبت به ساير روش‌هاي رقيب برتر مي‌باشند. از لحاظ حافظه ويدئويي مصرفي و زمان اجرا، روش مرتبه اول در مقايسه با نسخه غير تقريبي آن مقدار قابل توجهي (در حدود 12 برابر سريعتر) بهبود نشان مي‌دهد. علاوه‌بر اين، اگرچه از عمليات ريماني استفاده مي‌كند كه از نظر محاسباتي پيچيده‌تر هستند، اما در مقايسه با روش‌هاي اقليدسي، از لحاظ حافظه مصرفي و زمان اجرا شرايطي رقابتي با آن‌ها دارد. روش پيشنهادي سوم براي فرايادگيري چندماهيتي نيز با بهبود كيفيت و جلوگيري از انفجار گراديان‌هاي مدل، صحت دسته‌بندي بهتري نسبت به رقباي خود داشته است.
  • كليدواژه لاتين
    Meta-learning , Riemannian space , Few-shot learning , Multi-modal meta-learning
  • عنوان لاتين
    Meta-Learning in Riemannian Spaces
  • گروه آموزشي
    مهندسي هوش مصنوعي
  • چكيده لاتين
    Meta-learning is a new field of machine learning that allows computers to perform the learning task with a small number of observations and take advantage of past experiences gained from solving other learning tasks. Since many machine-learning problems are modeled and solved in Riemannian spaces, it is necessary to provide meta-learning methods in non-Euclidean spaces. In this research, a framework for Riemannian meta-learning is presented, which is based on a bi-level constrained optimization problem. We also investigate the effect of using the orthogonality constraints on the parameters of the artificial neural networks, equivalent to meta-learning on the Stifel manifold. To implement the proposed method, we have developed a Riemannian optimization method entitled cAdam, an extension of the well-known Euclidean optimization method, Adam. The meta-learning problem includes a two-level optimization problem that is heavy in terms of runtime, computation, and video memory consumption, Because it requires solving two nested optimization problems and calculating tensors of second-order derivatives. This challenge will be greater in Riemannian meta-learning because complex nonlinear operators are used for optimization in that space. Therefore, a first-order method is also presented. Our proposed method, FORML, does not require calculating the second-order derivatives. Also, the proposed method suggests that in addition to using the orthogonality constraint on the parameter matrix of the classifier layer, the input data of that layer should also be normalized, leading to a smoother optimization, decreasing the intra-class variance, and preventing the model from overfitting. Another challenge in meta-learning is dealing with tasks that are sampled from a complex and multimodal distribution. To solve this challenge, we present a modulation-based method that uses the Stifel manifold to generate the modulation coefficients. All three proposed methods have been eva‎luated by extensive few-shot learning experiments. The results of the first presented method show that the few-shot classification accuracy has increased up to 9 compared to its Euclidean counterpart, and it has obtained superior results compared to other sota methods. Also, for the first-order method, the results are competitive compared to its first-order Euclidean counterpart and outperforms other competing methods. In terms of video memory consumption and execution time, FORML shows a significant improvement (12x faster) compared to its non-approximated version, RMAML. In addition, although it uses Riemannian operations, which are computationally complex, it is competitive with the first-order and second-order Euclidean methods, in terms of memory consumption and execution time. The third proposed method for multi-modal meta-learning also has better classification accuracy than its competitors.
  • تعداد فصل ها
    7
  • فهرست مطالب pdf
    77255
  • نويسنده

    تابع الحجه، هادي