• شماره ركورد
    25497
  • شماره راهنما
    COM3 152
  • عنوان

    پاسخ‌گويي به پرسش‌هاي مقايسه‌ايِ ذهني درباره¬ي محصولات: روشي آگاه به شدت ترجيح

  • مقطع تحصيلي
    دكتري
  • رشته تحصيلي
    مهندسي كامپيوتر - نرم افزار
  • دانشكده
    مهندسي كامپيوتر
  • تاريخ دفاع
    مردادماه 1404
  • صفحه شمار
    256 ص.
  • استاد راهنما
    دكتر محمدعلي نعمت بخش , دكتر افسانه فاطمي
  • كليدواژه فارسي
    پرسش‌هاي مقايسه‌اي ذهني , شدت ترجيح , نظركاوي مقايسه‌اي , طبقه‌بندي پرسش‌ها. , استخراج روابط مقايسه‌اي , بازيابي نقدهاي مرتبط , توليد پاسخ خودكار , يادگيري عميق
  • چكيده فارسي
    پرسش‌هاي مقايسه‌ايِ ذهني به‌دليل ماهيتِ پيچيده و وابسته به ترجيحاتِ كاربران، همواره چالشي عمده براي سيستم‌هاي پاسخ‌گويي خودكار بوده‌اند. بااين‌حال، بسياري از پژوهش‌هاي پيشين در پاسخ‌دهي به اين‌گونه پرسش‌ها دچار كاستي‌هايي چون ناديده‌گرفتنِ «شدّت ترجيح» و روابطِ پيچيده¬ي مقايسه‌اي‌اند و در تجميعِ ترجيحات نيز به رأيِ اكثريتِ ساده تكيه مي‌كنند كه در كم‌نمونه‌گي و تعارضِ شواهد ناپاياست. اين پژوهش روشي مبتني بر پردازشِ زبانِ طبيعي و يادگيريِ عميق را براي پاسخ‌دهي به اين‌گونه پرسش‌ها معرفي مي‌كند. روش پيشنهادي شامل سه مرحله‌ي اصلي است: «پردازش پرسش»، «بازيابي نقدهاي مرتبط» و «توليد پاسخ». در مرحله‌ي نخست، با استفاده ازRoBERTa، پرسش‌ها به‌صورت دقيق در ده كلاس بر اساس محورهاي ذهني/عيني و مقايسه‌اي/غيرمقايسه‌اي طبقه‌بندي مي‌شوند؛ سپس روابط مقايسه‌اي ذهني، از جمله موجوديت‌ها، جنبه‌هاي مقايسه‌اي، قيود و ترجيحات، با به‌كارگيري زنجيره‌ي RoBERTa-based-go-emotions + MTL + Adapter + NLI + SwapCPC استخراج مي‌گردد. در مرحله‌ي دوم، با ساخت جمله‌هاي پرس‌وجوي خنثي‌سازي‌شده بر مبناي زيرروابط و محاسبه‌ي شباهت معنايي با stsb-roberta-base-v2، جملات مرتبط از ميان نقدهاي كاربران گردآوري مي‌شوند. در مرحله‌ي سوم (توليد پاسخ)، جملات مقايسه‌اي ذهنيِ بازيابي‌شده تحليل و برچسب‌گذاري شده، معدن‌كاوي نظرِ مقايسه‌اي انجام مي‌شود و با تجميع ترجيحات كاربران، پاسخ‌هاي كوتاه (قالب‌محور) و پاسخ‌هاي بلند (با مدل¬هاي زبانيِ مولد و پرامپت‌ها) توليد مي‌گردد؛ براي رواني و انسجام، از GPT-4o نيز استفاده شده است. ارزيابي رويكرد بر چند مجموعه‌داده‌ي ويژه‌ي اين كار، شامل FQSD، Smartphone-SCQRE، Brands-CompSent-19-SCQRE،FSSD و SCQAD انجام شده است. نتايج تجربي نشان‌دهنده‌ي كارايي بالا و بهبودهاي معنادار نسبت به روش‌هاي پيشين است. به‌طور مشخص، در «پردازش پرسش»، دسته‌بند ده‌كلاسه به F1 برابر با 97٫1٪ مي¬رسد. در «استخراج رابطه (SCQRE)»، ميانگين F1 در سناريوي مرحله‌اي 85٫8٪ و در حالت سرتاسري 72٫5٪ است؛ ارزيابي پنج‌تايي در تنظيم دودويي F1 برابر 78٫8٪ دارد. در «بازيابي»، آستانه‌ي بهينه‌ي0٫70 τ= به F1 برابر 80٫3٪ (مرحله‌اي) و 72٫9٪ (سرتاسري) مي‌انجامد. در «پاسخ‌دهي»، روش «جمع‌بندي ترجيح» با پارامتر بهينه‌ي 2 α= به صحت 91٫8٪ و خطاي ميانگين مطلق 0٫10 مي‌رسد؛ در سناريوي سرتاسري اين مقادير به 70٫4٪ صحت و 0٫24 MAE كاهش مي‌يابد. براي پاسخ كوتاه،EM به‌ترتيب 92٫3٪ (مرحله‌اي) و 73٫6٪ (سرتاسري) است. براي پاسخ بلند، صحت از 88٫9٪ به 70٫5٪ افت مي‌كند؛ افزون‌براين، افزودن مؤلفه‌ي «شدت ترجيح» در 80 مقايسه‌ي دوتايي انساني موجب تغيير سودمند تصميم در 12٫5٪ موارد، بهبود استناد از 3٫5 به 4٫3 و برتري انساني 46/14/20 به نفع نسخه‌ي آگاه از شدت شد؛ اينها همراه با ساير شواهد كمّي، كارايي روش را در هر سه مرحله تأييد مي‌كنند.
  • كليدواژه لاتين
    Subjective comparative questions,. , Preference Intensity , Comparative opinion mining, . , Question classification,, . , , Extraction of comparative relations, , relevant review retrieva‎l. , Automatic answer generation, . , Deep learning.
  • عنوان لاتين
    Answering Subjective Comparative Questions on Products: an Intensity Preference-Aware Method
  • گروه آموزشي
    مهندسي نرم افزار
  • چكيده لاتين
    Subjective Subjective comparative questions, due to their complex nature an‎d dependence on user preferences, have long posed a major challenge for automatic question-answering systems. However, many prior studies suffer from shortcomings such as ignoring preference intensity an‎d complex comparative relations, an‎d relying on simple majority voting for preference aggregation, which is unstable under data sparsity an‎d conflicting evidence. This work introduces an NLP- an‎d deep-learning-based method for answering such questions. The proposed approach comprises three main stages: question processing, retrieva‎l of relevant reviews, an‎d answer generation. First, using RoBERTa, questions are accurately classified into ten classes along the subjective/objective an‎d comparative/non-comparative axes; then subjective comparative relations—including entities, comparative aspects, constraints, an‎d preferences—are extracted via a chain of RoBERTa-based-go-emotions + MTL + Adapter + NLI + SwapCPC. In the second stage, relation-aware pseudo-neutral query sentences are constructed an‎d semantic similarity to review sentences is computed with stsb-roberta-base-v2 to retrieve relevant evidence. In the third stage (answer generation), retrieved subjective comparative sentences are analyzed an‎d labeled, comparative opinion mining is performed, an‎d user preferences are aggregated to produce short, template-based answers an‎d long, LLM-based answers (via pro‎mp‎ts); GPT-4o is also used for fluency an‎d coherence. The approach is eva‎luated on several task-specific datasets, including FQSD, Smartphone-SCQRE, Bran‎ds-CompSent-19-SCQRE, FSSD, an‎d SCQAD. Results show strong effectiveness an‎d significant improvements over prior work. Concretely, in question processing, the ten-class classifier achieves F1 = 97.1%. In relation extraction (SCQRE), the mean F1 is 85.8% in the staged setup an‎d 72.5% end-to-end; the quintuple eva‎luation in the binary setting attains F1 = 78.8%. In retrieva‎l, the optimal similarity threshold τ = 0.70 yields F1 = 80.3% (staged) an‎d 72.9% (end-to-end). In answering, the preference aggregation method with α = 2 (OWA–Yager) achieves Accuracy = 91.8% an‎d MAE = 0.10; end-to-end these become 70.4% an‎d 0.24. For short answers, EM is 92.3% (staged) vs. 73.6% (end-to-end). For long answers, Accuracy dro‎ps from 88.9% to 70.5%. Moreover, adding the preference intensity component in 80 human pairwise comparisons yields a 12.5% rate of beneficial decision change, improves groundedness from 3.5 to 4.3, an‎d achieves a human preference outcome of 46/14/20 in favor of the intensity-aware version; together with other quantitative evidence, these confirm the effectiveness of the proposed method across all three stages.
  • تعداد فصل ها
    6
  • فهرست مطالب pdf
    152089
  • نويسنده

    باباعلي، مرضيه