• شماره ركورد
    25457
  • شماره راهنما
    IT3 9
  • عنوان

    حفظ حريم خصوصي كارا در مطالعات وابستگي سطح ژنوم

  • مقطع تحصيلي
    دكتري
  • رشته تحصيلي
    مهندسي كامپيوتر- رايانش امن
  • دانشكده
    مهندسي كامپيوتر
  • تاريخ دفاع
    1404/10/3
  • صفحه شمار
    155 ص.
  • استاد راهنما
    مائده عاشوري تلوكي
  • كليدواژه فارسي
    داده ژنوميك , حفظ حريم خصوصي , يادگيري فدرال , زنجيره قالب ها , شبكه هاي مولد تخاصمي , هوش مصنوعي توضيح پذير
  • چكيده فارسي
    پيشرفت هاي چشمگير در ژنوميك، فرصت هاي بي سابقه اي را براي پزشكي شخصي سازي شده و كشف درمان هاي نوين فراهم آورده است. با اين حال، اين حوزه با يك تعارضبنيادين روبرو است: نياز مبرم به مجموعه داده هاي بزرگ براي دستيابي به نتايج آماري معتبر، در مقابل چالش هاي جدي حريم خصوصي كه مانع از اشتراك گذاري آزادانه داده هاي ژنومي، به عنوان يكي از حساس ترين اطلاعات هويتي افراد، مي شود. اين بن بست دسترسي به داده، به ويژه براي مؤسسات كوچكتر و پژوهشگران مستقل، به يك تنگناي اصلي در مسير پيشرفت هاي علمي تبديل شده است. اين رساله با هدف غلبه بر اين بن بست، دو راهكار نوآورانه و مكمل را براي تسهيل استفاده مسئولانه از داده هاي ژنومي ارائه مي دهد. راهكار يك سيستم محاسبات توزيع شده براي مطالعات وابستگي سطح ژنوم ،Fed-GWAS نخست، چارچوب استكه با ادغام يادگيري فدرال بين دستگاهي، فناوري زنجيره قالب ها و يكسازوكار تشويقي، (GWAS) به افراد امكان مي دهد بدون به اشتراك گذاري داده هاي خام خود، در پژوهش هاي علمي مشاركت كنند. اين چارچوب با ارائه يك پروتكل تجميع امن و مقاوم در برابر تباني كامل و يك ساختار استخراج دولايه، به كاهش نمايي در زمان اجرا و مقياس پذيري بالا در مقايسه با طرح هاي پيشين دست مي يابد. راهكار رويكردي مبتني بر توليد داده هاي سنتزي براي ،(PPSD) دوم، خط لوله اشتراك گذاري داده خصوصي (GAN) تسهيل دسترسي به داده ارائه مي دهد. اين خط لوله جامع، با بهره گيري از شبكه مولد تخاصمي و يك تابع زيان سفارشي، داده هاي ژنومي با وفاداري آماري بالا توليد مي كند كه ويژگي هاي پيچيده و وابستگي ژنوتيپ-فنوتيپ را حفظ مي نمايد. نوآوري كليدي اين خط لوله، استفاده پيشگامانه از هوش به عنوان ابزاري براي ارزيابي كيفيت، امنيت و به ويژه مديريت ريسك هاي (XAI) مصنوعي توضيح پذير حريم خصوصي داده هاي سنتزي قبل از انتشار است. در مجموع، اين رساله با ارائه اين دو چارچوب مكمل، پاسخي جامع به بحران دسترسي به داده در تحقيقات ژنوميك ارائه مي دهد.
  • كليدواژه لاتين
    Genomic Data , Privacy-Preserving , Federated Learning , Blockchain , Generative Adversarial Networks , Explainable AI
  • عنوان لاتين
    Efficient Preserving Privacy in Genome-Wide Association Studies
  • گروه آموزشي
    مهندسي فناوري اطلاعات
  • چكيده لاتين
    Significant advancements in genomics have created unprecedented opportunities for personalized medicine an‎d novel therapeutic discoveries. However, this field faces a fundamental conflict: the critical need for large-scale datasets to achieve statistically robust results versus significant privacy challenges that hinder the open sharing of genomic data, one of the most sensitive forms of personal information. This data accessibility bottleneck has become a primary obstacle to scientific progress, particularly for smaller institutions an‎d independent researchers. This thesis addresses this challenge by proposing two novel an‎d complementary solutions to facilitate the responsible use of genomic data. The first solution, the Fed-GWAS framework, is a distributed system for privacy-preserving Genome-Wide Association Studies (GWAS). By integrating cross-device federated learning, blockchain technology for a trust-based incentive mechanism, an‎d a fully collusion-resistant secure aggregation protocol, Fed-GWAS enables individuals to participate in scientific research without sharing their raw data. The framework achieves an exponential reduction in runtime an‎d superior scalability compared to state-of-the-art schemes, enabled by a novel two-layer mining structure. The second solution, the Private Pipeline for Synthetic Data-Sharing (PPSD), tackles the data accessibility problem by enabling the generation of high-fidelity synthetic genomic data. This comprehensive pipeline leverages Generative Adversarial Networks (GANs) an‎d features a custom loss function designed to preserve complex statistical properties an‎d the crucial genotype-phenotype association. A key innovation of PPSD is the pioneering use of Explainable AI (XAI) as a tool for data curators to interpret the model an‎d eva‎luate the privacy risks of the synthetic data before its release. Together, these two frameworks provide a comprehensive approach to the data accessibility crisis in genomics. By empowering both individuals an‎d researchers, this dissertation paves the way for faster, more accurate, an‎d yet responsible an‎d privacy-preserving datadriven discoveries in medical research.
  • تعداد فصل ها
    6
  • استاد راهنماي خارج از دانشگاه
    مينا عليشاهي
  • فهرست مطالب pdf
    151615
  • نويسنده

    تركي، اميد