-
شماره ركورد
25457
-
شماره راهنما
IT3 9
-
نويسنده
تركي، اميد
-
عنوان
حفظ حريم خصوصي كارا در مطالعات وابستگي سطح ژنوم
-
مقطع تحصيلي
دكتري
-
رشته تحصيلي
مهندسي كامپيوتر- رايانش امن
-
دانشكده
مهندسي كامپيوتر
-
تاريخ دفاع
1404/10/3
-
صفحه شمار
155 ص.
-
استاد راهنما
مائده عاشوري تلوكي
-
كليدواژه فارسي
داده ژنوميك , حفظ حريم خصوصي , يادگيري فدرال , زنجيره قالب ها , شبكه هاي مولد تخاصمي , هوش مصنوعي توضيح پذير
-
چكيده فارسي
پيشرفت هاي چشمگير در ژنوميك، فرصت هاي بي سابقه اي را براي پزشكي شخصي سازي شده و كشف
درمان هاي نوين فراهم آورده است. با اين حال، اين حوزه با يك تعارضبنيادين روبرو است: نياز مبرم به
مجموعه داده هاي بزرگ براي دستيابي به نتايج آماري معتبر، در مقابل چالش هاي جدي حريم خصوصي
كه مانع از اشتراك گذاري آزادانه داده هاي ژنومي، به عنوان يكي از حساس ترين اطلاعات هويتي افراد،
مي شود. اين بن بست دسترسي به داده، به ويژه براي مؤسسات كوچكتر و پژوهشگران مستقل، به يك
تنگناي اصلي در مسير پيشرفت هاي علمي تبديل شده است. اين رساله با هدف غلبه بر اين بن بست،
دو راهكار نوآورانه و مكمل را براي تسهيل استفاده مسئولانه از داده هاي ژنومي ارائه مي دهد. راهكار
يك سيستم محاسبات توزيع شده براي مطالعات وابستگي سطح ژنوم ،Fed-GWAS نخست، چارچوب
استكه با ادغام يادگيري فدرال بين دستگاهي، فناوري زنجيره قالب ها و يكسازوكار تشويقي، (GWAS)
به افراد امكان مي دهد بدون به اشتراك گذاري داده هاي خام خود، در پژوهش هاي علمي مشاركت كنند.
اين چارچوب با ارائه يك پروتكل تجميع امن و مقاوم در برابر تباني كامل و يك ساختار استخراج دولايه،
به كاهش نمايي در زمان اجرا و مقياس پذيري بالا در مقايسه با طرح هاي پيشين دست مي يابد. راهكار
رويكردي مبتني بر توليد داده هاي سنتزي براي ،(PPSD) دوم، خط لوله اشتراك گذاري داده خصوصي
(GAN) تسهيل دسترسي به داده ارائه مي دهد. اين خط لوله جامع، با بهره گيري از شبكه مولد تخاصمي
و يك تابع زيان سفارشي، داده هاي ژنومي با وفاداري آماري بالا توليد مي كند كه ويژگي هاي پيچيده و
وابستگي ژنوتيپ-فنوتيپ را حفظ مي نمايد. نوآوري كليدي اين خط لوله، استفاده پيشگامانه از هوش
به عنوان ابزاري براي ارزيابي كيفيت، امنيت و به ويژه مديريت ريسك هاي (XAI) مصنوعي توضيح پذير
حريم خصوصي داده هاي سنتزي قبل از انتشار است. در مجموع، اين رساله با ارائه اين دو چارچوب
مكمل، پاسخي جامع به بحران دسترسي به داده در تحقيقات ژنوميك ارائه مي دهد.
-
كليدواژه لاتين
Genomic Data , Privacy-Preserving , Federated Learning , Blockchain , Generative Adversarial Networks , Explainable AI
-
عنوان لاتين
Efficient Preserving Privacy in Genome-Wide Association Studies
-
گروه آموزشي
مهندسي فناوري اطلاعات
-
چكيده لاتين
Significant advancements in genomics have created unprecedented opportunities for
personalized medicine and novel therapeutic discoveries. However, this field faces
a fundamental conflict: the critical need for large-scale datasets to achieve statistically
robust results versus significant privacy challenges that hinder the open sharing
of genomic data, one of the most sensitive forms of personal information. This data
accessibility bottleneck has become a primary obstacle to scientific progress, particularly
for smaller institutions and independent researchers. This thesis addresses
this challenge by proposing two novel and complementary solutions to facilitate the
responsible use of genomic data. The first solution, the Fed-GWAS framework,
is a distributed system for privacy-preserving Genome-Wide Association Studies
(GWAS). By integrating cross-device federated learning, blockchain technology for
a trust-based incentive mechanism, and a fully collusion-resistant secure aggregation
protocol, Fed-GWAS enables individuals to participate in scientific research
without sharing their raw data. The framework achieves an exponential reduction
in runtime and superior scalability compared to state-of-the-art schemes, enabled
by a novel two-layer mining structure. The second solution, the Private Pipeline
for Synthetic Data-Sharing (PPSD), tackles the data accessibility problem by enabling
the generation of high-fidelity synthetic genomic data. This comprehensive
pipeline leverages Generative Adversarial Networks (GANs) and features a custom
loss function designed to preserve complex statistical properties and the crucial
genotype-phenotype association. A key innovation of PPSD is the pioneering use of Explainable AI (XAI) as a tool for data curators to interpret the model and evaluate
the privacy risks of the synthetic data before its release. Together, these two
frameworks provide a comprehensive approach to the data accessibility crisis in genomics.
By empowering both individuals and researchers, this dissertation paves
the way for faster, more accurate, and yet responsible and privacy-preserving datadriven
discoveries in medical research.
-
تعداد فصل ها
6
-
استاد راهنماي خارج از دانشگاه
مينا عليشاهي
-
فهرست مطالب pdf
151615
-
لينک به اين مدرک :