شماره ركورد
25718
شماره راهنما
BIOMED2 246
عنوان
پيشبيني بازگشت سرطان سينه: ادغام يادگيري ماشين و آمار زيستي براي پيشآگهي دقيق
مقطع تحصيلي
كارشناسي ارشد
رشته تحصيلي
مهندسي پزشكي- بيوالكتريك
دانشكده
فني و مهندسي
تاريخ دفاع
1404/11/05
صفحه شمار
111 ص.
استاد راهنما
حميدرضا مراتب
كليدواژه فارسي
عود سرطان , سيستمهاي پيشبينيكننده , تمايز , منحني كاليبراسيون , سرطان سينه
چكيده فارسي
عود سرطان سينه همچنان يكي از چالشهاي مهم باليني محسوب ميشود و توسعه مدلهاي پيشبيني دقيق ميتواند نقش مؤثري در تصميمگيريهاي درماني فردمحور ايفا كند. در سالهاي اخير، بسياري از مطالعات پيشين براي پيشبيني عود، از روشها و الگوريتمهاي پيچيده يادگيري ماشين استفاده كردهاند كه اگرچه در برخي موارد عملكرد قابلقبولي نشان دادهاند، اما عموماً از تفسيرپذيري پاييني برخوردار بوده و امكان استفاده باليني گسترده از آنها محدود است. علاوه بر اين، در بخش قابلتوجهي از اين مطالعات، ارزيابي عملكرد مدلها بهصورت ناكافي انجام شده و اغلب به يك روش اعتبارسنجي ساده يا مجموعهاي محدود از معيارهاي ارزيابي بسنده شده است؛ موضوعي كه ميتواند منجر به برآوردهاي خوشبينانه و غيرقابلاعتماد از عملكرد واقعي مدل شود. ازاينرو، هدف اين مطالعه ارائه يك مدل پيشبيني عود مبتني بر رگرسيون لجستيكِ تفسيرپذير، همراه با ارزيابي جامع عملكرد و استفاده از روش اعتبارسنجي بوتاسترپ 0.632، بهمنظور دستيابي به برآوردهاي پايدارتر و معتبرتر از كارايي مدل است.
در اين مطالعه از پايگاه دادهي مركز تحقيقات سرطان سيد الشهداء اصفهان استفاده شده است. اين پايگاهداده شامل 556 بيمار مبتلا به سرطان سينه است كه 88 نفر آن ها دچار عود شده اند. بر اساس فرآيند انتخاب ويژگي، شش متغير نهايي شامل تعداد غدد لنفاوي درگير، نشانگر ki67، وضعيت انجام شيمي درماني، سايز تومور در پستان چپ، پروتئين p53 و پروتئين كاتپسين براي توسعه مدل انتخاب شدند. براي برآورد احتمال عود سرطان، از مدل رگرسيون لجستيك استفاده گرديد. اعتبارسنجي مدل با بهرهگيري از هر دو روش متداول hold-out و بوتاسترپ 0.632 انجام شد تا امكان مقايسه نظاممند ميان راهبردهاي اعتبارسنجي فراهم شود. عملكرد مدل با استفاده از مجموعهاي از معيارهاي تمايز، كاليبراسيون و نيكويي برازش ارزيابي گرديد.
با استفاده از روش اعتبارسنجي بوتاسترپ 0.632، مدل پيشنهادي به مقدار AUC برابر با 0.04±0.822 با فاصله اطمينان (0.891 , 0.75)، صحت برابر با 0.028±0.834 با فاصله اطمينان (0.883 , 0.781) و امتياز F1 برابر با 0.052±0.535 با فاصله اطمينان (0.607 , 0.402) دست يافت كه نشاندهنده توان تفكيكپذيري مناسب مدل است. مقايسه روشهاي اعتبارسنجي نشان داد كه روش hold-out در برخي موارد منجر به برآوردهاي ناپايدار و بيشازحد خوشبينانه از عملكرد مدل ميشود، در حالي كه روش بوتاسترپ 0.632 نتايجي پايدارتر و محافظهكارانهتر ارائه ميدهد. افزون بر اين، خطر عود پيشبينيشده براي هر فرد بهصورت يك نمودار خطر نمايش داده شد كه تفسير باليني خروجيهاي مدل را تسهيل ميكند. همچنين امكان محاسبه خطر با استفاده از يك ابزار وب محور فراهم گرديد.
يافتههاي اين مطالعه نشان ميدهد كه چارچوب مدلسازي پيشنهادي، در تركيب با اعتبارسنجي بوتاسترپ 0.632، رويكردي مقاوم و قابلاعتماد براي پيشبيني عود سرطان پستان فراهم ميآورد. در مقايسه با روش متداول hold-out، اين رويكرد موجب كاهش سوگيري خوشبينانه و افزايش اعتبار معيارهاي گزارششدهي عملكرد مدل ميشود. همچنين، ارائه نتايج در قالب نمودار خطر و ابزار وب محور، كاربردپذيري باليني مدل را از طريق امكان ارزيابي فردمحور خطر افزايش ميدهد. با وجود اين مزايا، محدوديتهايي نظير حجم نمونه و ماهيت گذشتهنگر دادهها بايد مدنظر قرار گيرد. مطالعات آينده ميتوانند بر اعتبارسنجي خارجي مدل و ادغام نشانگرهاي زيستي بيشتر بهمنظور بهبود عملكرد پيشبيني تمركز كنند.
كليدواژه لاتين
Cancer Recurrence , Predictive Systems , Calibration Curve , Discrimination , Breast Cancer
عنوان لاتين
Predicting Breast Cancer Recurrence: Integrating Machine Learning and Biostatistics for Precision Prognosis
گروه آموزشي
مهندسي پزشكي
چكيده لاتين
Breast cancer recurrence remains one of the major clinical challenges, and the development of accurate predictive models can play an important role in personalized treatment decision-making. In recent years, many previous studies have employed complex machine learning methods and algorithms to predict recurrence. Although these approaches have demonstrated acceptable performance in some cases, they generally suffer from low interpretability, which limits their broad clinical applicability. Moreover, in a considerable proportion of these studies, model performance has been inadequately evaluated, often relying on a single simple validation strategy or a limited set of evaluation metrics. This can lead to optimistic and unreliable estimates of true model performance. Therefore, the aim of this study is to propose an interpretable recurrence prediction model based on logistic regression, accompanied by a comprehensive performance evaluation and the use of the bootstrap 0.632 validation method to obtain more stable and reliable estimates of model effectiveness.
In this study, data from the Seyed Al-Shohada Cancer Research Center in Isfahan were used. This database includes 556 patients with breast cancer, of whom 88 experienced recurrence. Based on the feature selection process, six final variables—namely the number of involved lymph nodes, the Ki-67 marker, chemotherapy status, tumor size in the left breast, p53 protein, and cathepsin protein—were selected for model development. Logistic regression was employed to estimate the probability of cancer recurrence. Model validation was performed using both the conventional hold-out method and the bootstrap 0.632 approach, allowing for a systematic comparison between validation strategies. Model performance was evaluated using a set of discrimination and calibration metrics.
Using the bootstrap 0.632 validation method, the proposed model achieved an AUC of 0.822 ± 0.04 with a confidence interval of (0.75, 0.891), an accuracy of 0.834 ± 0.028 with a confidence interval of (0.781, 0.883), and an F1-score of 0.535 ± 0.052 with a confidence interval of (0.402, 0.607), indicating an appropriate discriminative ability of the model. Comparison of validation methods showed that the hold-out approach, in some cases, resulted in unstable and overly optimistic estimates of model performance, whereas the bootstrap 0.632 method provided more stable and conservative results. In addition, the predicted individual recurrence risk was presented in the form of a risk chart, which facilitates the clinical interpretation of the model outputs. It also provided the capability to calculate risk using a web-based tool.
The findings of this study indicate that the proposed modeling framework, when combined with bootstrap 0.632 validation, provides a robust and reliable approach for predicting breast cancer recurrence. Compared with the conventional hold-out method, this approach reduces optimistic bias and enhances the credibility of the reported performance metrics. Furthermore, presenting the results in the form of a risk chart improves the clinical applicability of the model by enabling individualized risk assessment. Despite these advantages, limitations such as sample size and the retrospective nature of the data should be considered. Future studies may focus on external validation of the model and the integration of additional biomarkers to further improve predictive performance.
تعداد فصل ها
5
فهرست مطالب pdf
157542
نويسنده