• شماره ركورد
    24581
  • شماره راهنما
    IT3 8
  • عنوان

    توسعه امن تحليل اجزاي اصلي بر روي داده‌هاي توزيع‌شده با افراز عمودي

  • مقطع تحصيلي
    دكتري
  • رشته تحصيلي
    مهندسي كامپيوتر- رايانش امن
  • دانشكده
    مهندسي كامپيوتر
  • تاريخ دفاع
    140/12/22
  • صفحه شمار
    96 ص.
  • استاد راهنما
    حميد ملا
  • كليدواژه فارسي
    تحليل اجزاي اصلي , تجزيه QR , محاسبات چندسويه‌ي امن , رمزنگاري هم‌ريخت , حريم خصوصي , روش جاكوبي , بردار ويژه
  • چكيده فارسي
    داده‌كاوي كاربردهاي زيادي در زمينه‌هاي مختلف مانند بانكداري، بازاريابي، مراقبت‌هاي سلامت و كشف تقلب دارد. يكي از ابزارهاي ارزشمند در داده‌كاوي، تحليل اجزاي اصلي (PCA) است. تحليل اجزاي اصلي يك روش رياضياتي براي تغيير فضاي نمايش داده‌ها و به نوعي كاهش ابعاد داده‌ها است. كاهش بُعد يك ابزار مهم يادگيري ماشين است كه براي حل مشكلاتي هم‌چون بيش‌برازش در زماني كه تعداد ويژگي‌ها بسيار بيشتر از تعداد نمونه‌ها است، كاهش هزينه‌هاي محاسباتي و كاهش مصرف انرژي به دليل ابعاد بالاي فضاي ويژگي‌ها به كار مي‌رود. هدف PCA تصوير كردن داده‌ها بر روي اجزاي اصلي با بالاترين ميزان واريانس مي‌باشد كه منجر به حفظ حداكثري اطلاعات موجود در داده مي‌شود.محاسبه PCA بر روي داده‌هاي متعلق به چندين صاحب داده با توجه به حريم خصوصي آن‌ها در بسياري از موارد مانند مراكز درماني يك نياز است. ما در اين رساله ابتدا با استفاده از تجزيه‌ي QR، رمزنگاري هم‌ريخت و يك سرور محاسبات يك پروتكل چندسويه براي محاسبه‌ي PCA با حفظ حريم خصوصي و با نام PPPCA-SQR ارائه مي‌كنيم. اين پروتكل اولين طرح موجود براي محاسبه‌ي امن PCA مي‌باشد كه هم در افراز افقي و هم در افراز عمودي قابل استفاده مي‌باشد و هم‌چنين تمامي اجزاي اصلي را محاسبه مي‌كند. در ادامه با حذف سرور محاسبات، پروتكل جديدي با نام PPPCA-QR به همان منظور ارائه مي‌كنيم كه در نتيجه تمامي محاسبات توسط صاحبان داده انجام مي‌شود. سپس با تغيير روش محاسبه‌ي بردارهاي ويژه و با استفاده از روش جاكوبي روش جديدي با نام PPPCA-SJ براي محاسبه‌ي اجزاي اصلي در افرازهاي افقي و عمودي و با حفظ حريم خصوصي معرفي مي‌كنيم. لازم به ذكر است كه در مقايسه با طرح‌هاي معرفي‌شده‌‌‌ي پيشين، طرح‌هاي PPPCA-SQR و PPPCA-QR اولين طرح‌هاي محاسبه‌ي امن PCA در افراز عمودي هستند. هم‌چنين طرح‌هاي پيشنهادي اولين طرح‌هايي هستند كه هم تمامي اجزاي اصلي محاسبه شده و هم از رمزنگاري تاحدودي هم‌ريخت (SHE) استفاده شده است. امنيت پروتكل‌‌هاي PPPCA-SQR و PPPCA-QR ، با استفاده از روش شبيه‌سازي دنياي واقعي-دنياي ايده‌آل كه شناخته‌شده‌ترين روش براي اثبات امنيت پروتكل‌ها مي‌باشد، اثبات شد. به طور دقيق‌تر، با فرض عدم تباني و هم‌چنين خاصيت امنيت معنايي سيستم رمزنگاي CKKS، امنيت پروتكل‌هاي مذكور به صورت صوري اثبات مي‌شود. لازم به ذكر است كه پروتكل PPPCA-SJ داراي نشت جزئي اطلاعات است و در نتيجه اثبات امنيت آن به صورت صوري امكان‌پذير نيست. در انتها كارايي هر پروتكل مورد بررسي قرار خواهد گرفت. به طور خاص، با استفاده از چهارچوب Microsoft SEAL، پروتكل‌هاي پيشنهادي بر روي پايگاه داده SDSS با اندازه‌ي 1000×4 شبيه‌سازي شدند. در اين شبيه‌سازي، پروتكل PPPCA-SQR در 4 دور و در زمان كلي 69118 ms و با تبادل 633600 بايت هم‌گرا شد. هم‌چنين پروتكل PPPCA-SJ در 4 دور و در زمان كلي 71422 ms و با تبادل 635904 بايت هم‌گرا شد.
  • كليدواژه لاتين
    Principal component analysis , QR factorization , Secure multiparty computation , Homomorphic cryptography , Privacy , Jacobi method , Eigen vector
  • عنوان لاتين
    Secure Development of Principal Component Analysis over Vertically Distributed Data
  • گروه آموزشي
    مهندسي فناوري اطلاعات
  • چكيده لاتين
    Data mining has many applications in different areas like banking, marketing, health care an‎d fraud detection. One of the most valuable tools in data minning is principal component analysis (PCA). Computing PCA on data belonging to several data owners with respect to their privacy in a need in many cases e.g. medical centers. In the current thesis, by using QR factorization, homomorphic encryption an‎d a computation server, we propose a privacy preserving multi-party protocol called PPPCA-SQR to compute PCA. The protocol is the first scheme to compute all of the principal components with restect to privacy in both horizontal an‎d vertical distribution of the data. After that, by omitting the computation server, we propose a protocol called PPPCA-QR to compute all of the principal components in horizontal an‎d vertical distirbutaion, without a server. Hence, all of the computations distribute among data owners. By changing the eigen vector computation method from QR factorization to Jacobi method, we propose another privacy preserving protocol called PPPCA-SJ to compute PCA over horizontal an‎d vertical distributation of data. At the end, we prove the security of our proposed schemes by real world-ideal world simulation which is the most well-known method to prove the security of protocols. We then analyse the performance of each proposed protocol. The security of the PPPCA-SQR an‎d PPPCA-QR protocols was proven using the real-world-ideal-world simulation method, which is the most well-known method for proving the security of protocols. More precisely, assuming no collusion an‎d also the semantic security property of the CKKS cryptosystem, the security of the mentioned protocols is formally proven. It should be noted that the PPPCA-SJ protocol has a partial information leakage an‎d as a result, its security cannot be proven formally. Finally, the performance of each protocol will be examined. Specifically, using the Microsoft SEAL framework, the proposed protocols were simulated on the SDSS database of size 4×1000. In this simulation, the PPPCA-SQR protocol converged in 4 rounds an‎d in a total time of 69118 ms with an exchange of 633600 Bytes. Also, the PPPCA-SJ protocol converged in 4 rounds, in a total time of 71422 ms, an‎d with an exchange of 635904 Bytes.
  • تعداد فصل ها
    7
  • فهرست مطالب pdf
    123486
  • نويسنده

    جابري، مهراد