شماره ركورد
25004
شماره راهنما
STA2 295
عنوان
تبديل بيواسطهي استوار باكس-كاكس و يئو-جانسون توسعهيافته در رگرسيون
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
آمار اقتصادي
دانشكده
رياضي و آمار
تاريخ دفاع
1404/06/29
صفحه شمار
145ص.
استاد راهنما
دكتر هوشنگ طالبي
استاد مشاور
دكتر فهيمه طوراني
كليدواژه فارسي
تبديل داده ها , جستجوي پيشرو , شاخص توافق , ضريب تعيين , معيار اطلاع بيزي گسترش يافته
چكيده فارسي
در مدل سازي رگرسيون خطي فرضهايي مانند نرمال بودن خطا و همگني واريانس از پيش نيازهاي اساسي براي اعتبار استنباطهاي آماري به شمار ميآيند با اين حال در داده هاي واقعي اين فرضيه ها اغلب به دليل وجود دادههاي دورافتاده چولگي يا ناهمگني واريانس نقض مي.شوند اين پايان نامه به بررسي برخي از اين تكنيكها پرداخته و بر روي تبديلهاي استوار متغير پاسخ براي رفع اين مشكلات تمركز دارد. در اين مطالعه، تبديلهاي باكس-كاكس و يئو جانسون و محدوديتهاي آنها مرور ميشوند روش تبديل گسترش يافته اي كه توسط رياني و همكاران (2023) ارائه شده است اين محدوديتها را برطرف مي.كند اين روش يك رويكرد بي واسطه و كارآمد است كه با به كارگيري همزمان نمودار ،فان معيار اطلاعات بيزي (BIC) و الگوريتمهاي جستجوي پيشرو مقدار دقيق پارامتر تبديل را انتخاب مي.كند اين روش توانايي شناسايي داده هاي دورافتاده و محافظت در برابر اثر آنها را داشته و در نتيجه به ايجاد مدلهاي رگرسيون استوار منجر ميشود. علاوه بر اين، در اين پژوهش نسخه گسترش يافته اي از تبديل يئو-جانسون كه توسط رياني و همكاران(2022) معرفي شده است، ارائه ميشود. برخي توسعه هاي رياضي در اين روش نوآورانه انعطاف پذيري بيشتري را از طريق امكان استفاده از پارامترهاي تبديل متفاوت براي دادههاي مثبت و منفي فراهم ميسازد و معمولا موجب بهبود تثبيت واريانس و نرمال سازي در شرايط توزيع هاي پيچيده و وجود دادههاي دورافتاده متعدد ميشود. اين تبديلهاي جديد نه تنها به تثبيت واريانس و نرمال سازي باقيمانده ها كمك ميكنند، بلكه دقت پيشبيني برازش مدل و اعتبار استنباطهاي آماري را نيز به طور چشمگيري بهبود ميبخشند به ويژه استواري اين روشها در حضور داده هاي دورافتاده آنها را به گزينه اي ايده آل براي كاربردهاي واقعي تبديل كرده است. اثر بخشي رويكردهاي پيشنهادي از طريق شبيه سازي ها و كاربرد آنها بر روي دادههاي واقعي نشان داده شده است، كه عملكردي برتر نسبت به روشهاي كلاسيك و ناپارامتري را به نمايش ميگذارد در نهايت اين پژوهش نه تنها به توسعه نظري مدلهاي رگرسيون كمك ميكند بلكه ابزارهاي عملي و قابل اعتمادي را براي پژوهشگران و تحليلگران داده فراهم مي آورد تا بتوانند با داده هاي پيچيده به طور مؤثرتري كار كنند پيشنهاد ميشود تحقيقات آتي بر تعميم اين روشها به مدلهاي رگرسيون غير خطي و چندمتغيره متمركز شوند تا دامنه كاربرد آنها گسترش يابد.
كليدواژه لاتين
Agreement Index , Extended Bayesian Information Criterion , Coefficient of Determination , Forward Search , Data Transformation
عنوان لاتين
ر
گروه آموزشي
آمار
چكيده لاتين
In linear regression modeling, assumptions such as error normality and homoscedas- ticity are fundamental for valid statistical inference, yet are often violated in real-world data due to outliers, skewness, or heteroscedasticity. This thesis reviews some of such techniques and focuses on robust transformations of the response variable to address these issues. In this study, we review the Box–Cox and Yeo–Johnson transformations and their limitations. The new extended transformation method, proposed by Riani et al. (2023), resolves the limitations of the mentioned methods. It is an automated and efficient technique using fan plot, Bayesian information criterion, and forward search al- gorithms simultaneously to select a precise transformation parameter value. This method is able to identify outliers and guard against them, leading to robust regression models. Furthermore, in this study, the extended version of the Yeo–Johnson transformation, pro- posed by Atkinson et al. (2020), is introduced. Some mathematical developments in this novel method provide more flexibility by allowing different transformation parameters for positive and negative responses,generally improving variance stabilization and normality under complex distributions and in the presence of numerous outliers. These new trans- formations not only contribute to variance stabilization and residual normalization but also substantially improve prediction accuracy, model fit, and the validity of statistical inference. Their robustness in the presence of outliers makes them an ideal choice for prac- tical applications. The effectiveness of the proposed approaches is demonstrated through simulations and applications to real datasets, showing superior performance compared to classical and nonparametric methods. Ultimately, this research not only contributes to the theoretical development of regression models but also provides practical and reliable tools for researchers and data analysts to more effectively handle complex and imperfect data. It is recommended that future studies focus on extending these methods to nonlinear and multivariate regression models to broaden their scope of application.
تعداد فصل ها
4
فهرست مطالب pdf
145713
نويسنده