-
شماره ركورد
23999
-
شماره راهنما
COM2 660
-
نويسنده
معيني، سارا
-
عنوان
تشخيص و تصحيح خودكار خطاهاي دستوري رايج در زبان فارسي با استفاده از يادگيري عميق
-
مقطع تحصيلي
كارشناسي ارشد
-
رشته تحصيلي
مهندسي كامپيوتر - نرم افزار
-
دانشكده
مهندسي كامپيوتر
-
تاريخ دفاع
1403/06/17
-
صفحه شمار
79 ص.
-
استاد راهنما
رضا رمضاني
-
كليدواژه فارسي
تشخيص خطاي دستوري , اصلاح خطاي دستوري , درك زبان طبيعي , يادگيري عميق , ايجاد خطاي مصنوعي
-
چكيده فارسي
در دنياي امروز، استفاده از نامهها يا متون دستنويس براي امور روزمره به شدت كاهشيافته و بيشتر افراد ترجيح ميدهند متون خود را به صورت الكترونيكي بنويسند و تدوين نمايند. با اين حال، به دليل كمبود وقت، عدم توجه كافي هنگام نوشتن يا حتي نداشتن دانش كافي، ممكن است متون نوشته شده دچار اشتباهات نگارشي شوند. حتي كساني كه به زبان مادري خود تسلط كامل دارند نيز ممكن است دچار چنين اشتباهاتي گردند. اين اشتباهات ميتوانند كيفيت متون را كاهش داده و از انتقال صحيح معناي متن جلوگيري كنند. بنابراين، رعايت قوانين دستوري براي نويسندگان متون امري ضروري به حساب ميآيد. سيستمهاي تشخيص و اصلاح دستور زبان ميتوانند با صرف زمان كمتر و دقت بيشتر اين كار را بصورت خودكار انجام دهند. در زبان فارسي، اين كار اغلب با روشهاي مبتني بر قانون انجام شده است. اما با پيشرفت هوش مصنوعي و اثبات توانايي آن در درك زبان طبيعي، ميتوان راهكارهايي مبتني بر اين فناوري ارائه داد تا به نتايج بهتري در تشخيص و اصلاح خطاهاي دستوري دست يافت. اين پژوهش به ارائه روشي مبتني بر يادگيري عميق براي تشخيص نوع خطاهاي دستوري فارسي و اصلاح آنها پرداخته است. در روش پيشنهادي، ابتدا با استفاده از مدل پارسبرت نوع خطاي دستوري موجود در متن شناخته شده و سپس از مدلهاي آموزش ديده شده مناسب براي اصلاح خطاي دستوري استفاده شده است. به منظور بهبود عملكرد، سيستم پيشنهادي ابتدا نوع خطاي موجود در متن را تشخيص ميدهد و سپس در بخش اصلاح خطاي دستوري روي مولفه درك زبان طبيعي تمركز كرده و با استفاده از روشهاي تبديل توالي به ويرايش، متن ورودي را به دنبالهاي از برچسبها به عنوان عملگرهاي ويرايش، تبديل ميكند و در نهايت با استفاده از پسپردازش، جمله خروجي را توليد ميكند. همچنين به دليل عدم وجود مجموعهداده مناسب، در اين پژوهش يك مجموعه داده تشخيص و اصلاح خطاي دستوري زبان فارسي ايجاد شده است. بدين منظور ابتدا جملاتي از اينترنت جمعآوري شده و با ايجاد خطاهاي مصنوعي در جملات صحيح دستوري، از آنها در آموزش مدل استفاده شده است. بر اساس ارزيابيهاي انجام شده، معيار F1 براي تشخيص خطا و F0.5براي اصلاح خطا به ترتيب برابر 93 و 87.94 به دست آمد. با توجه به اينكه اين رويكرد اولين رويكرد مبتني بر يادگيري عميق در زبان فارسي براي تشخيص و اصلاح خطاهاي دستوري است، مقادير قابل قبولي ميباشد.
-
كليدواژه لاتين
Grammar Error Detection , Grammar Error Correction , Natural Language Understanding , Deep Learning , Artificial Error Generation
-
عنوان لاتين
Automatic Detection And Correction Of Common Grammatical Errors In Farsi Language Using Deep Learning
-
گروه آموزشي
مهندسي نرم افزار
-
چكيده لاتين
Nowadays, the use of handwritten letters or texts for daily tasks has significantly decreased and most people prefer to write and edit their texts electronically. However, due to lack of time, lack of attention while writing, or even lack of knowledge, written texts may suffer from grammatical errors. Even those who are fully proficient in their native language can make mistakes. These mistakes can reduce the quality of the texts and prevent the correct transmission of the meaning of the text. Therefore, adhering to grammar is considered essential for text writers. Grammatical error detection and correction systems can do this with less time and more accuracy. In the Persian language, this work has often been done with rule-based methods. But with the advancement of artificial intelligence and the proof of its ability to understand natural language, it is possible to provide solutions based on this technology to achieve better results in detecting and correcting grammatical errors. This research has presented a method based on deep learning for detecting Persian grammar error types and correcting them. In this method, the type of error in the text is detected first using the ParseBERT model, and then it uses appropriate trained models to correct errors. To enhance performance, the proposed system first detects the type of error in the text and then focuses on the natural language understanding component during the grammatical error correction phase and converts the input text into a sequence of tags as edit operators using sequence-to-edit methods and finally generates the output sentence through post-processing. Additionally, due to the lack of an appropriate dataset, this research has created a dataset for detecting and correcting grammatical errors in the Persian language. For this purpose, sentences were initially collected from the Internet, and artificial errors were introduced into grammatically correct sentences to be used in training the model. Based on the evaluation of this model, F1 score for error detection and F0.5 for error correction were obtained as 93 and 87.94, respectively. By considering that this approach is the first approach based on deep learning in Persian language to detect and correct grammar errors, the results are acceptable.
-
تعداد فصل ها
6
-
لينک به اين مدرک :