شماره ركورد
23924
شماره راهنما
COM2 658
عنوان
توليد خودكار پرسش با استفاده از مدل GPT در سامانه پرسشپاسخ به زبان فارسي
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي كامپيوتر - نرم افزار
دانشكده
مهندسي كامپيوتر
تاريخ دفاع
1403/06/17
صفحه شمار
89 ص.
استاد راهنما
افسانه فاطمي خوراسگاني
كليدواژه فارسي
سيستم پرسشپاسخ , توليد سوال , ترنسفورمر از پيش آموزشديده مولد (GPT)
چكيده فارسي
توليد سوالات مناسب براي اهداف آموزشي، بهبود فراگيري، و سنجش آموخته¬هاي فراگيران، از زمان-برترين و چالشي¬ترين وظيفه¬ها در همه¬ي رشته¬ها و همه¬ي مقاطع تحصيلي است. اين فرايند به¬صورت دستي به اين¬شكل انجام مي¬شود كه طراح با كمك برخي منابع در دسترس، و پس از انتخاب نوع سوال، يك مجموعه سوال و همچنين پاسخ آنها را از متن منبع استخراج مي¬كند. اين سوالات، بعداً از نظر سطح سختي و پيچيدگي مرتب مي¬شوند و سوالات نهايي از اين مجموعه انتخاب مي¬شود. خودكارشدن اين فرايند ميتواند نقش به¬سزايي در بهبود اين فرايند، ايفا كند و موجب پيشرفت امر آموزش شود.
در اين پژوهش، به بررسي و بهبود فرآيند توليد سوالات آموزشي براي زبان فارسي پرداخته شده است. با توجه به كمبود منابع و مجموعهدادههاي مناسب براي آموزش و ارزيابي مدلهاي پردازش زبان طبيعي به زبان فارسي، دو مجموعهداده متفاوت مورد استفاده قرار گرفتند: ParSQuAD، كه از مجموعهداده SQuAD 2.0 اقتباس و به فارسي ترجمه شده است و SDS، كه از متون كتابهاي علوم متوسطه اول استخراج شده است. با بهرهگيري از اين مجموعهدادهها، 16 مدل جديد براي توليد سوالات آموزشي از جمله سوالات چهارگزينهاي، صحيح/غلط و جايخالي طراحي و ارزيابي شدند.
رويكردهاي پيشنهادي با استفاده از ابزارها و مدلهاي مختلفي مانند Hazm، GPT-3.5-turbo، GPT-2، Dorna، PerDeepKE و KeyBERT توسعه يافتهاند كه به شكل هوشمندانهاي قادر به شناسايي و تغيير مفاهيم كليدي در متون و توليد سوالات معنادار و متنوع هستند. عملكرد اين مدلها با استفاده از ارزيابيهاي انساني و معيارهاي استانداردي چون دقت، حساسيت، درستنمايي و امتيازF1 ارزيابي شده است. نتايج نشان ميدهند كه رويكردهاي پيشنهادي بهبود قابل توجهي در فرآيند توليد سوالات آموزشي ايجاد كردهاند و ميتوانند به عنوان ابزار مؤثري در بهبود فرآيند يادگيري و ارزيابي فراگيران بهكار گرفته شوند.
با توجه به ارزيابيهاي انجامشده، مدلهاي ارائهشده در اين پژوهش توانستند عملكرد مناسبي در توليد سوالات آموزشي براي زبان فارسي نشان دهند. اين پژوهش گام مهمي در توسعه ابزارهاي آموزشي هوشمند براي زبان فارسي برداشته و زمينهساز تحقيقات بيشتر در حوزه پردازش زبان طبيعي و توليد سوالات آموزشي در اين زبان است.
كليدواژه لاتين
Question-Answering System (QAS) , Question Generation (QG) , Generative Pre-Trained Transformer (GPT)
عنوان لاتين
Automatic Question Generation Using GPT Model in Persian Question Answering System
گروه آموزشي
مهندسي نرم افزار
چكيده لاتين
Generating appropriate questions for educational purposes, the improvement of learning, and the assessment of learnersʹ knowledge are among the most time-consuming and challenging tasks across all disciplines and educational levels. This process is manually conducted in the following manner: the designer, using some available resources, selects the type of questions and then extracts a set of questions and their corresponding answers from the source text. These questions are then sorted by their level of difficulty and complexity, and the final questions are selected from this set. Automating this process can play a significant role in enhancing it and contributing to the advancement of education.
In this research, we explore and enhance the process of generating educational questions in the Persian language. Given the scarcity of resources and suitable datasets for training and evaluating natural language processing models in Persian, two different datasets were utilized: ParSQuAD, which is adapted and translated from the SQuAD 2.0 dataset into Persian, and SDS, which is extracted from middle school science textbooks. Using these datasets, 16 new models were designed and evaluated to generate educational questions, including multiple-choice, true/false, and fill-in-the-blank questions.
The proposed approaches were developed using various tools and models such as Hazm, GPT-3.5-turbo, GPT-2, Dorna, PerDeepKE, and KeyBERT. These tools intelligently identify and alter key concepts in the texts to generate meaningful and diverse questions. The performance of these models was assessed using human evaluations and standard metrics such as precision, recall, accuracy, and F1 score. The results indicate that the proposed approaches significantly improve the process of generating educational questions and can serve as effective tools in enhancing the learning and assessment process for learners.
Based on the evaluations conducted, the models presented in this research demonstrated strong performance in generating educational questions for the Persian language. This research marks an important step in the development of intelligent educational tools for Persian and lays the groundwork for further studies in natural language processing and educational question generation in this language.
تعداد فصل ها
6
فهرست مطالب pdf
75840
نويسنده