شماره ركورد
24024
شماره راهنما
COM3 129
عنوان
فرايادگيري در فضاهاي ريماني
مقطع تحصيلي
دكتري
رشته تحصيلي
مهندسي كامپيوتر - هوش مصنوعي و رباتيكز
دانشكده
مهندسي كامپيوتر
تاريخ دفاع
1403/06/13
صفحه شمار
102 ص.
استاد راهنما
پيمان اديبي , حسين كارشناس
كليدواژه فارسي
فرايادگيري , دستهبندي با تعداد نمونه كم , فضاي نااقليدسي , بهينهسازي ريماني , فرايادگيري چندماهيتي
چكيده فارسي
هدف غايي يادگيري ماشين، ايجاد توانايي آموختن در كامپيوتر است. فرايادگيري حوزهاي نو در يادگيري ماشين است كه به كامپيوتر اجازه ميدهد كه چگونگي آموختن را بياموزد و عمل آموزش را با تعداد كمي از مشاهدات و همچنين بهرهگيري از تجارب حل وظايف يادگيري ديگر انجام دهد. از آنجا كه بسياري از مسائل يادگيري ماشين در فضاهاي ريماني و نه اقليدسي مدلسازي و حل ميگردند، ارائه روشهاي فرايادگيري در فضاهاي نااقليدسي ضروري است. در اين پژوهش، چارچوبي براي فرايادگيري نا اقليدسي ارائه ميشود كه مبتنيبر بهينهسازي است. اگرچه روش پيشنهادي را ميتوان براي طيف وسيعي از منيفولدهاي ريماني به كار برد، اما ما به طور ويژه تأثير استفاده از شرط تعامد در پارامترهاي شبكه عصبي مصنوعي را بررسي ميكنيم كه با فرايادگيري بر روي منيفولد استيفل معادل است. براي پيادهسازي روش پيشنهادي، يك روش بهينهسازي ريماني كه توسعهاي از روش بهينهسازي اقليدسي lr{Adam} است توسعه داده شده است. از طرفي مسأله فرايادگيري شامل يك مسأله بهينهسازي دوسطحي است كه پيچيدگي محاسباتي بالا و نياز به حافظه زيادي دارد؛ زيرا نيازمند حل دو مسأله بهينهسازي تو در تو و محاسبه تانسورهاي مشتقات درجه دوم است. اين چالش در فرايادگيري ريماني بيشتر خواهد بود زيرا براي بهينهسازي در آن فضا، از عملگرهاي غيرخطي پيچيده استفاده ميشود. لذا در ادامه پژوهش، يك روش مبتنيبر تخمين مرتبه اول نيز ارائه ميگردد. روش پيشنهادي علاوهبر عدم نياز به محاسبه مشتقات درجه دوم، پيشنهاد ميكند كه علاوهبر استفاده از قيد تعامد بر روي ماتريس پارامترهاي لايه دستهبند مدل، داده ورودي آن لايه نيز نرمالسازي گردد. اين عمل منجر به يادگيري مناسبتر مدل خواهد شد. چالش ديگر مسائل فرايادگيري، مواجهه با وظايفي است كه از ماهيتهاي متفاوتي نمونهبرداري شدهاند. براي حل اين چالش، يك روش چندماهيتي مبتني بر مدولاسيون ارائه ميدهيم كه براي توليد ضرايب مدولاسيون از منيفولد استيفل استفاده ميكند. هر سه روش پيشنهادي توسط آزمايشهاي دستهبندي با تعداد نمونه كم ارزيابي و با روشهاي رقيب مقايسه شدهاند. براي انجام آزمايشها دو سناريوي فرايادگيري تك دامنهاي و مياندامنهاي استفاده شده است. نتايج روش ارائه شده اول نشان ميدهد كه صحت دستهبندي با تعداد نمونه كم تا 9 نسبت به همتاي اقليدسي خود افزايش يافته است و نتايج برتري نسبت به روشهاي فرايادگيري رقيب كسب كرده است. همچنين براي روش پيشنهادي مرتبه اول، با وجود عدم استفاده از متشقات دوم، نتايج نسبت به روش نااقليدسي اول رقابتي و نسبت به ساير روشهاي رقيب برتر ميباشند. از لحاظ حافظه ويدئويي مصرفي و زمان اجرا، روش مرتبه اول در مقايسه با نسخه غير تقريبي آن مقدار قابل توجهي (در حدود 12 برابر سريعتر) بهبود نشان ميدهد. علاوهبر اين، اگرچه از عمليات ريماني استفاده ميكند كه از نظر محاسباتي پيچيدهتر هستند، اما در مقايسه با روشهاي اقليدسي، از لحاظ حافظه مصرفي و زمان اجرا شرايطي رقابتي با آنها دارد. روش پيشنهادي سوم براي فرايادگيري چندماهيتي نيز با بهبود كيفيت و جلوگيري از انفجار گراديانهاي مدل، صحت دستهبندي بهتري نسبت به رقباي خود داشته است.
كليدواژه لاتين
Meta-learning , Riemannian space , Few-shot learning , Multi-modal meta-learning
عنوان لاتين
Meta-Learning in Riemannian Spaces
گروه آموزشي
مهندسي هوش مصنوعي
چكيده لاتين
Meta-learning is a new field of machine learning that allows computers to perform the learning task with a small number of observations and take advantage of past experiences gained from solving other learning tasks. Since many machine-learning problems are modeled and solved in Riemannian spaces, it is necessary to provide meta-learning methods in non-Euclidean spaces. In this research, a framework for Riemannian meta-learning is presented, which is based on a bi-level constrained optimization problem. We also investigate the effect of using the orthogonality constraints on the parameters of the artificial neural networks, equivalent to meta-learning on the Stifel manifold. To implement the proposed method, we have developed a Riemannian optimization method entitled cAdam, an extension of the well-known Euclidean optimization method, Adam. The meta-learning problem includes a two-level optimization problem that is heavy in terms of runtime, computation, and video memory consumption, Because it requires solving two nested optimization problems and calculating tensors of second-order derivatives. This challenge will be greater in Riemannian meta-learning because complex nonlinear operators are used for optimization in that space. Therefore, a first-order method is also presented. Our proposed method, FORML, does not require calculating the second-order derivatives. Also, the proposed method suggests that in addition to using the orthogonality constraint on the parameter matrix of the classifier layer, the input data of that layer should also be normalized, leading to a smoother optimization, decreasing the intra-class variance, and preventing the model from overfitting. Another challenge in meta-learning is dealing with tasks that are sampled from a complex and multimodal distribution. To solve this challenge, we present a modulation-based method that uses the Stifel manifold to generate the modulation coefficients. All three proposed methods have been evaluated by extensive few-shot learning experiments. The results of the first presented method show that the few-shot classification accuracy has increased up to 9 compared to its Euclidean counterpart, and it has obtained superior results compared to other sota methods. Also, for the first-order method, the results are competitive compared to its first-order Euclidean counterpart and outperforms other competing methods. In terms of video memory consumption and execution time, FORML shows a significant improvement (12x faster) compared to its non-approximated version, RMAML. In addition, although it uses Riemannian operations, which are computationally complex, it is competitive with the first-order and second-order Euclidean methods, in terms of memory consumption and execution time. The third proposed method for multi-modal meta-learning also has better classification accuracy than its competitors.
تعداد فصل ها
7
فهرست مطالب pdf
77255
نويسنده