-
شماره ركورد
25218
-
شماره راهنما
COM2 694
-
نويسنده
ليتويي، فرشته سادات
-
عنوان
تحليل احساسات چندماهيتي مبتني برجنبه با غنيسازي نمايش دادهها
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي كامپيوتر - هوش مصنوعي و رباتيكز
-
دانشكده
مهندسي كامپيوتر
-
تاريخ دفاع
1404/06/29
-
صفحه شمار
104 ص.
-
استاد راهنما
حسين كارشناس نجف آبادي
-
كليدواژه فارسي
تحليل احساسات مبتني بر جنبه , يادگيري چندماهيتي , ارزيابي زيباشناختي و عاطفي تصوير , شبكههاي عصبي گرافي , يادگيري چندوظيفهاي
-
چكيده فارسي
تحليل احساسات، ب هويژه در محيط پوياي شبك ههاي اجتماعي، براي درك افكار و واكنشهاي كاربران از
اهميت بالايي برخوردار است. در اين ميان، تحليل احساسات مبتني بر جنبه با هدف شناسايي همزمان
جنبههاي خاص مورد بحث در متن و تعيين دقيق احساسات مرتبط با هر يك از آ نها به عنوان يك مسأله
چندوظيفهاي مورد توجه قرار گرفته است. از طرف ديگر استفاده از محتواي تركيبي )متن و تصوير( براي
كمك به تحليل احساسات به دليل ناتواني مدلهاي موجود در استخراج جامع اطلاعات از هر دو ماهيت
و ايجاد يك ه مراستايي معنايي مؤثر براي انجام دو وظيفه توأمان )استخراج جنبه و طبقهبندي احساس(
به يك چالش اساسي تبديل شده است . اين پژوهش با تمركز بر مفهوم غنيسازي هدفمند نمايش دادهها،
دو چارچوب يكپارچه و نوين را براي حل اين چالشها ارائه ميدهد. نوآوري محوري كار حاضر در يك
استراتژي غن يسازي دوگانه و متمركز بر وظيفه نهفته است كه رويكرد اصلي آن بر استفاده جامع و هدفمند
از اطلاعات عاطفي تصوير و رويكرد ثانويه بر تحليل ساختاري متن بنا شده است . رويكرد اصلي براي
غنيسازي نمايش تصويري، بهرهگيري از اطلاعات عاطفي و زيباشناختي تصوير است تا عملكرد
طبقهبندي احساسي جنبههاي استخراج شده به طور چشمگيري ارتقاء يابد. براي پيادهسازي اين ايده،
چارچوب معرفي شده Emotelligence-Adv ، با بهكارگيري توانايي مدلهاي بينايي-زباني در توليد
توصيفات عاطفي غني از تصوير و متن، يك نمايش قدرتمند و هدفمند از محتواي چندماهيتي ايجاد
ميكند. همچنين، براي تضمين هدايت ويژگيهاي استخراجشده به سمت مؤلفههاي عاطفي و
زيباييشناختي، يك وظيفه كمكي نيز به پيشبيني مستقيم عاطفه و زيياشناختي تصوير اختصاص داده
شده است . در موازات با اين رويكرد، براي غنيسازي نمايش متني و بهبود وظيفه استخراج جنبهها، از
ساختارهاي گرافي و مدلسازي روابط نحوي متن براي ارتقاء سطح ويژگيهاي متني استفاده ميشود .
اين رويكردها در يك چارچوب واحد تلفيق شده و به يك رويكرد همافزا دست يافته است . نتايج آزمايشها
روي مجموعهدادههاي Twitter-2015 و Twitter-2017 نشان داد كه دو چارچوب پيشنهادي عملكرد
را نسبت به مدل پايه بهبود بخشيده اند. بهطور خاص، رويكرد Emotelligence-Adv همراه با ماژول
گرافي متن، امتياز F1 را به ترتيب حدود 1.88 و 73 / 1 درصد نسبت به مدل پايه افزايش داد و به بهترين
عملكرد در هر دو مجموعهداده دست يافت. نكته حائز اهميت اين است كه اين مدل، با بهرهگيري از
مدلهاي قدرتمند زباني-بصري، با تعداد پارامترهاي قابل آموزش كمتري نسبت به ساير مدلهاي مورد
بررسي طراحي شده كه كارايي محاسباتي آن را برجسته ميسازد. اين پژوهش نشان ميدهد كه تلفيق
هوشمندانه جنبههاي عاطفي و ساختاري، راهكاري مؤثر براي تحليل دقيقتر و قويتر احساسات در
محيطهاي پيچيده چندماهيتي است .
-
كليدواژه لاتين
Aspect-based sentiment analysis , Multimodal learning , aesthetic/emotional assessment , Graph neural networks , Multi-task learning
-
عنوان لاتين
Multimodal Aspect-based Sentiment Analysis by data representation enrichment
-
گروه آموزشي
مهندسي هوش مصنوعي
-
چكيده لاتين
Sentiment analysis, especially in the dynamic environment of social networks, is crucial for understanding user opinions and reactions. Among its variants, Aspect-Based Sentiment Analysis (ABSA) has gained attention as a multi-task problem aiming to simultaneously identify specific aspects discussed in a text and determine the precise sentiment associated with each. The use of multimodal content (text and image) to aid sentiment analysis poses a significant challenge, however, due to the inability of existing models to comprehensively extract information from both modalities and create an effective semantic alignment for the two concurrent tasks (aspect extraction and sentiment classification). This research focuses on the concept of targeted data representation enrichment and proposes two novel, integrated frameworks to address these challenges. The core innovation lies in a dual, task-focused enrichment strategy: the primary approach centers on the comprehensive and purposeful utilization of image affective information, and the secondary approach is based on the structural analysis of the text. The primary approach enriches the visual representation by leveraging the affective and aesthetic information of the image to significantly enhance the sentiment classification performance of the extracted aspects. To implement this, the proposed framework, Emotelligence-Adv, utilizes the capability of vision-language models to generate rich affective descriptions from the image and text, thus creating a powerful and targeted representation of the multimodal content. Furthermore, to ensure the extracted features are guided towards affective and aesthetic components, an auxiliary task is dedicated to the direct prediction of image affect and aesthetics. Parallel to this, to enrich the textual representation and improve the aspect extraction task, graph structures and textual dependency modeling are used to enhance the level of textual features. These approaches are integrated into a single framework, achieving a synergistic approach. Experimental results on the Twitter-2015 and Twitter-2017 datasets demonstrate that the two proposed frameworks improve performance over the baseline model. Specifically, the Emotelligence-Adv approach coupled with the text graph module increased the F1 score by approximately 1.88% and 1.73% compared to the baseline model, achieving the best performance on both datasets. Significantly, this model, by utilizing powerful vision-language models, is designed with a smaller number of trainable parameters than other models examined, highlighting its computational efficiency. This research demonstrates that the intelligent integration of affective and structural aspects is an effective solution for more accurate and robust sentiment analysis in complex multimodal environments.
-
تعداد فصل ها
6
-
استاد راهنماي خارج از دانشگاه
دكتر عليرضا درويشي
-
لينک به اين مدرک :