پاسخ‌دهي نوع آزاد در سيستم‌هاي درك خوانشي چندگامي از متون ناهمگن

شماره ركورد
24390
شماره راهنما
COM3 136
نويسنده
محمدي، ازاده
عنوان
پاسخ‌دهي نوع آزاد در سيستم‌هاي درك خوانشي چندگامي از متون ناهمگن
مقطع تحصيلي
دكتري
رشته تحصيلي
مهندسي كامپيوتر - نرم افزار
دانشكده
مهندسي كامپيوتر
تاريخ دفاع
دي ماه 1402
صفحه شمار
99 ص.
استاد راهنما
احمد براآني دستجردي , رضا رمضاني
كليدواژه فارسي
درك خوانشي ماشين , پردازش زبان طبيعي , استدلال چندگامي , درك خوانش استخراجي , درك خوانشي انتزاعي
چكيده فارسي
مساله درك خوانشي ماشين يكي از مسائل چالشي و قديمي در حوزه تحقيقاتي پردازش زبان طبيعي است و هدف آن آموزش ماشين براي فهم داده‌هاي غير ساخت‌يافته به شكل متن است. در اين مساله ماشين بايد بر اساس يك متن به سوالات مرتبط با آن پاسخ بدهد، سؤالاتي كه معمولاً به‌راحتي قابل پاسخ نيستند و به استدلال در آن متن نياز دارند. مساله درك خوانشي چندگامي در متون ناهمگن يك نوع پرچالش از سيستم‌هاي درك خوانشي است، زيرا پاسخ سؤالات در قسمت‌هاي مختلف چندين متن ناهمگن پراكنده شده‌ است و ماشين تنها با جمع‌آوري همه اطلاعات و انجام استدلال چندگامي قادر به پاسخگويي به سؤال است. با توجه به اينكه اين متون به‌صورت يكجا و منسجم نوشته نشده‌اند، ممكن است تفاوت لغوي، اطلاعات متناقض و شكاف‌هاي اطلاعاتي زيادي در آن‌ها باشد كه باعث ‌شود روند پاسخگويي پيچيده‌تر شود. از سوي ديگر متون زبان طبيعي حاوي هر دو اطلاعات لغوي و معنايي در كنار يكديگر هستند. استفاده درست از همه اين اطلاعات به‌جاي تمركز صرف بر ويژگي‌هاي ظاهري متن باعث مي‌شود علاوه بر بهبود عملكرد، سيستم در برابر تفاوت‌هاي لغوي، اطلاعات متناقض و شكاف‌هاي اطلاعاتي ايمن‌تر شود. با توجه به بررسي مدل‌هاي موجود به نظر مي‌رسد مهم‌ترين مشكل اين است كه به‌جاي در نظر گرفتن تمام اطلاعات مهم و ارزشمند، بر برخي اطلاعات لغوي و ظاهري براي پاسخ به سوال تمركز شده است و بقيه اطلاعات را ناديده مي‌گيرند. موضوعات نشان‌دهنده الگوها و ساختارهاي معنايي در متون زبان طبيعي هستند و همچنين از عوامل كليدي در پاسخگويي به سوالات در سيستم هاي درك خوانشي است. ازاين‌رو اين رساله يك مدل درك خوانشي ارائه مي‌دهد كه بر به‌كارگيري اطلاعات همه‌جانبه در بهبود توانايي استدلال چندگامي در متون ناهمگن تمركز دارد. در اين راستا با اضافه كردن اطلاعات معنايي مانند موضوع جملات، موضوع روابط و اهميت روابط، ابتدا يك روش امتيازدهي جديد براي رتبه‌بندي متون ورودي ارائه مي‌شود. علاوه‌بر‌آن يك گراف وزن‌دار معرفي مي‌شود كه با دريافت حداكثر اطلاعات لغوي و معنايي از متون ورودي به بهبود عملكرد سيستم درك خوانشي در استخراج بازه‌هاي پاسخ كمك مي‌كند. اما ازآنجاكه در سيستم‌هاي درك خوانشي چندگامي با متون ناهمگن، در موارد زيادي پاسخ به سؤال با استخراج تنها يك بازه متوالي از متن امكان‌پذير نيست، در ادامه قابليت توليد پاسخ‌هاي نوع آزاد نيز اضافه گرديده و پاسخ نهايي با جمع‌آوري اطلاعات از قسمت‌هاي مختلف متون ناهمگن، توسط مدل توليد مي‌شود. همچنين در اين رساله يك روش كدگذاري توسعه‌يافته ارائه شده است كه موضوعات را به‌عنوان يكي از سرنخ‌هاي اصلي درك خوانشي در پايه‌اي‌ترين لايه دخالت مي‌دهد. به‌اين‌ترتيب به‌جاي استفاده از كدگذاري‌هاي رايج، يك نسخه كدگذاري سفارشي‌شده براي مساله درك خوانشي ارائه مي‌شود. مدل پيشنهادي با بهبود مطالعات پيشين در دو نوع درك خوانشي استخراجي و انتزاعي تأثيرگذاري ايده مطرح‌شده در اين رساله را اثبات مي‌كند. در اين راستا، ابتدا مدل با استفاده از مجموعه داده HotpotQA مورد ارزيابي قرار گرفت كه در سه مجموعه معيار ارزيابي توانست بهترين نتيجه را كسب كند. در اين راستا نمره F1 و انطباق كامل پاسخ به ترتيب 83,09 و 70,10 به دست آمد، همچنين نمره F1 و انطباق كامل پشتيبان به ترتيب 88,88 و 63,33 و نمره F1 و انطباق كامل تركيبي به ترتيب 75,26 و 47,62 به دست آمد كه نسبت به پژوهش‌هاي قبلي بهتر است. سپس با استفاده از مجموعه داده MS Marco با مدل‌هاي درك خوانشي انتزاعي با پاسخ نوع آزاد مقايسه شد كه در اين راستا مقدار ROUGE-L برابر 67,66، مقدار BLEU-1 برابر 65,85 و مقدار BLEU-2 برابر 58,42 به دست آمد كه نسبت به ديگر مدل‌ها بهبود داشته است.
كليدواژه لاتين
Machine reading comprehension , Natural language processing , Multi-hop reasoning, , Extractive machine reading comprehension , , Abstractive machine reading comprehension
عنوان لاتين
Free-form Answering in Multi-hop Reading Comprehension Systems from Heterogenous Texts
گروه آموزشي
مهندسي نرم افزار
چكيده لاتين
The problem of Machine Reading Comprehension is one of the challenging problems in Natural Language Processing, and its purpose is to eva‎luate the machine’s ability to understand unstructured data. The problem of multi-hop reading comprehension in heterogeneous texts is a challenging type of reading comprehension system, because the answers are scattered from different parts of several heterogeneous texts, and the machine is able to answer the question by collecting all the information and performing multi-hop reasoning. On the other hand, natural language texts contain both lexical and semantic information together, so applying both of these information, instead of only focusing on the lexical clues can improve the systemʹs performance to handle lexical differences, information gaps, and contradictory information. This thesis presents a machine reading comprehension model that focuses on the use of full information in improving the ability of multi-hop reasoning in heterogeneous texts. In this regard by adding semantic information such as the topic of sentences, the topic of relationships, and the importance of relationships, first a new scoring method for ranking input texts is presented. In addition, this study introduces a weighted graph for reading comprehension systems, which helps to obtain maximum lexical and semantic information from the input texts. Since with heterogeneous texts, it is more likely not possible to answer the question by only one continuous span, then the ability to generate free-form answers is also considered and the final answer is produced by the model by collecting information from different and non-continuous parts. In addition, a developed encoding method is presented that involves topics as one of the main clues of reading comprehension at the basic level of encoding. Thus, instead of using a common encoding method, a customized encoding method is presented for the reading comprehension problem. The proposed model shows the effectiveness of the presented idea in this thesis by improving previous studiesʹ results in two types of extractive and abstractive reading comprehension systems. First, the model was eva‎luated using the HotpotQA dataset, which was able to obtain the best results in three sets of eva‎luation metrics. In this regard, the F1 score and exact-match of the answer have been obtained as 83.09 and 70.10 respectively, as well as the F1 score and exact-match of the support have been 88.88 and 63.33 respectively and the joint F1 score and exact-match have been 75.26 and 47.62 respectively, which improved the state-of-the-art result. Then, the model was compared with abstract reading comprehension models with free-form answers using the MS Marco dataset. In this regard, the ROUGE-L value has been obtained as 67.66, BLEU-1 as 65.85, and BLEU-2 as 58.42, which improved the state-of-the-art resul.
تعداد فصل ها
6
فهرست مطالب pdf
120444
لينک به اين مدرک :
https://lib.ui.ac.ir/dL/search/default.aspx?Term=24390&Field=0&DTC=3

کلیه حقوق این اثر برای شرکت مهندسی ارتباطات پيام مشرق محفوظ می باشد

محمدي، ازاده

پاسخ‌دهي نوع آزاد در سيستم‌هاي درك خوانشي چندگامي از متون ناهمگن