توليد خودكار پرسش با استفاده از مدل GPT در سامانه پرسش‌پاسخ به زبان فارسي

شماره ركورد
23924
شماره راهنما
COM2 658
نويسنده
طالبي، فرنوش
عنوان
توليد خودكار پرسش با استفاده از مدل GPT در سامانه پرسش‌پاسخ به زبان فارسي
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي كامپيوتر - نرم افزار
دانشكده
مهندسي كامپيوتر
تاريخ دفاع
1403/06/17
صفحه شمار
89 ص.
استاد راهنما
افسانه فاطمي خوراسگاني
كليدواژه فارسي
سيستم پرسش‌پاسخ , توليد سوال , ترنسفورمر از پيش آموزش‌ديده مولد (GPT)
چكيده فارسي
توليد سوالات مناسب براي اهداف آموزشي، بهبود فراگيري، و سنجش آموخته¬هاي فراگيران، از زمان-برترين و چالشي¬ترين وظيفه¬ها در همه¬ي رشته¬ها و همه¬ي مقاطع تحصيلي است. اين فرايند به¬صورت دستي به اين¬شكل انجام مي¬شود كه طراح با كمك برخي منابع در دسترس، و پس از انتخاب نوع سوال، يك مجموعه سوال و همچنين پاسخ آن‌ها را از متن منبع استخراج مي¬كند. اين سوالات، بعداً از نظر سطح سختي و پيچيدگي مرتب مي¬شوند و سوالات نهايي از اين مجموعه انتخاب مي¬شود. خودكارشدن اين فرايند مي‌تواند نقش به¬سزايي در بهبود اين فرايند، ايفا كند و موجب پيشرفت امر آموزش شود. در اين پژوهش، به بررسي و بهبود فرآيند توليد سوالات آموزشي براي زبان فارسي پرداخته شده است. با توجه به كمبود منابع و مجموعه‌داده‌هاي مناسب براي آموزش و ارزيابي مدل‌هاي پردازش زبان طبيعي به زبان فارسي، دو مجموعه‌داده متفاوت مورد استفاده قرار گرفتند: ParSQuAD، كه از مجموعه‌داده SQuAD 2.0 اقتباس و به فارسي ترجمه شده است و SDS، كه از متون كتاب‌هاي علوم متوسطه اول استخراج شده است. با بهره‌گيري از اين مجموعه‌داده‌ها، 16 مدل جديد براي توليد سوالات آموزشي از جمله سوالات چهارگزينه‌اي، صحيح/غلط و جاي‌خالي طراحي و ارزيابي شدند. رويكردهاي پيشنهادي با استفاده از ابزارها و مدل‌هاي مختلفي مانند Hazm، GPT-3.5-turbo، GPT-2، Dorna، PerDeepKE و KeyBERT توسعه يافته‌اند كه به شكل هوشمندانه‌اي قادر به شناسايي و تغيير مفاهيم كليدي در متون و توليد سوالات معنادار و متنوع هستند. عملكرد اين مدل‌ها با استفاده از ارزيابي‌هاي انساني و معيارهاي استانداردي چون دقت، حساسيت، درست‌نمايي و امتيازF1 ارزيابي شده است. نتايج نشان مي‌دهند كه رويكردهاي پيشنهادي بهبود قابل توجهي در فرآيند توليد سوالات آموزشي ايجاد كرده‌اند و مي‌توانند به عنوان ابزار مؤثري در بهبود فرآيند يادگيري و ارزيابي فراگيران به‌كار گرفته شوند. با توجه به ارزيابي‌هاي انجام‌شده، مدل‌هاي ارائه‌شده در اين پژوهش توانستند عملكرد مناسبي در توليد سوالات آموزشي براي زبان فارسي نشان دهند. اين پژوهش گام مهمي در توسعه ابزارهاي آموزشي هوشمند براي زبان فارسي برداشته و زمينه‌ساز تحقيقات بيشتر در حوزه پردازش زبان طبيعي و توليد سوالات آموزشي در اين زبان است.
كليدواژه لاتين
Question-Answering System (QAS) , Question Generation (QG) , Generative Pre-Trained Transformer (GPT)
عنوان لاتين
Automatic Question Generation Using GPT Model in Persian Question Answering System
گروه آموزشي
مهندسي نرم افزار
چكيده لاتين
Generating appropriate questions for educational purposes, the improvement of learning, and the assessment of learnersʹ knowledge are among the most time-consuming and challenging tasks across all disciplines and educational levels. This process is manually conducted in the following manner: the designer, using some available resources, selects the type of questions and then extracts a set of questions and their corresponding answers from the source text. These questions are then sorted by their level of difficulty and complexity, and the final questions are selected from this set. Automating this process can play a significant role in enhancing it and contributing to the advancement of education. In this research, we explore and enhance the process of generating educational questions in the Persian language. Given the scarcity of resources and suitable datasets for training and eva‎luating natural language processing models in Persian, two different datasets were utilized: ParSQuAD, which is adapted and translated from the SQuAD 2.0 dataset into Persian, and SDS, which is extracted from middle school science textbooks. Using these datasets, 16 new models were designed and eva‎luated to generate educational questions, including multiple-choice, true/false, and fill-in-the-blank questions. The proposed approaches were developed using various tools and models such as Hazm, GPT-3.5-turbo, GPT-2, Dorna, PerDeepKE, and KeyBERT. These tools intelligently identify and alter key concepts in the texts to generate meaningful and diverse questions. The performance of these models was assessed using human eva‎luations and standard metrics such as precision, recall, accuracy, and F1 score. The results indicate that the proposed approaches significantly improve the process of generating educational questions and can serve as effective tools in enhancing the learning and assessment process for learners. Based on the eva‎luations conducted, the models presented in this research demonstrated strong performance in generating educational questions for the Persian language. This research marks an important step in the development of intelligent educational tools for Persian and lays the groundwork for further studies in natural language processing and educational question generation in this language.
تعداد فصل ها
6
فهرست مطالب pdf
75840
لينک به اين مدرک :
https://lib.ui.ac.ir/dL/search/default.aspx?Term=23924&Field=0&DTC=3

کلیه حقوق این اثر برای شرکت مهندسی ارتباطات پيام مشرق محفوظ می باشد

طالبي، فرنوش

توليد خودكار پرسش با استفاده از مدل GPT در سامانه پرسش‌پاسخ به زبان فارسي