秘密計算

【比較】秘密計算と差分プライバシーの違いをわかりやすく解説!

本記事では、秘密計算と差分プライバシーの違いを解説します。

はじめに

情報化社会となった近年では、ユーザのデータを取得し、それを活用して新しいサービスやデータを作成することが企業の新たなビジネスチャンスとなっています。

しかし、同時に、EUでGDPRが施工されたことを皮切りに、世界中でプライバシーを保護しようとする動きが強まっています。

こうした状況において、プライバシーに配慮しつつ、データ解析を可能とする計算技術に注目が高まっています。

本記事では、プライバシーに配慮した計算技術として注目されている、秘密計算と差分プライバシーの違いについて解説していきます。

秘密計算とは

秘密計算とは、暗号化したままの状態で計算を実行することです。

秘密計算の代表的な仕組みは以下の2つです。

  • 準同型暗号ベース
  • 秘密分散 + MPCベース

準同型暗号ベースの秘密計算は、暗号鍵を用いて情報を暗号化することで秘匿性を担保し、秘密分散 + MPCベースの秘密計算は、データを分割し、物理的な計算空間を隔てることによってデータの秘匿性を担保します。

秘密分散+MPCベースの秘密計算の場合は、構築難度は高い反面、計算スピードは完全準同型暗号ベースに比較して早いことが一般的に知られています。ある研究では同一の計算を実行する際、秘密分散+MPCベースの秘密計算に比べ、準同型暗号ベースの秘密計算は、実行時間が3,000倍以上長かったという演算結果が得られています。 (下記表参照)

 

 

参照元:菊池 亮 五十嵐 大 秘密計算の発展 (2018) https://www.jstage.jst.go.jp/article/essfr/12/1/12_12/_pdf

なお、詳細な両者のメリット・デメリットの比較は以下の記事にて解説しています。

【秘密計算手法比較】準同型暗号とマルチパーティ計算(MPC)は何が違うのか?

計算速度が遅いことは、データ分析での利用において非常に大きなデメリットとなります。そのため、準同型暗号に関しては、上記理由から今回の比較からは除外して考えることとします。

差分プライバシーとは

差分プライバシーとは、個人データが識別されないようにしながら、大規模なデータセットから学習できるようにするアプローチです。

差分プライバシーでは、ランダムなデータをデータセットの中に挿入することによって、個人のプライバシーを保護します。これにより、データ分析者は、精密な計算結果を得ることはできなくなってしまいますが、元々知りたかった計算結果の近似値を、ユーザのプライバシーを保護した状態で取得することが可能になります。

差分プライバシーの詳細に関しては、以下の記事にて解説しています。

【入門】差分プライバシーとは?GAFAが採用したデータ活用手法を紹介!

秘密計算と差分プライバシーの違い

プライバシー担保方法の違い

MPC + 秘密分散ベースの秘密計算では、秘密分散によってデータをシェア化して秘匿化すること、つまり、暗号化により、ユーザ個人のプライバシーを担保しています。

差分プライバシーでは、データセットに対し、ランダムなデータを入力することにより、計算結果から正確なデータとしてユーザの個人情報を取得できないようにすることによって、プライバシーを担保しています。

実装難易度

両技術ともに、専門知識が必要とされ、長年、容易に計算を実行することが難しいとされてきました。しかし、サービスやオープンソースの充実によってそんな状況も変わりつつあります。

まず、MPC + 秘密分散ベースの秘密計算エンジンとして、株式会社Acompanyは、2020年10月初旬に弊社独自開発の秘密計算エンジンである「QuickMPC」をリリースしました。現在は、「QuickMPC」を基にパートナー企業との実証実験、共同研究を推進しています。

また、差分プライバシーは、ライブラリのオープンソースがGoogleによってローンチされています。。

応用事例

MPC + 秘密分散ベースの秘密計算は、さまざまな分野で応用されています。最近では、スタンフォード、オックスフォード、ブロード研究所の科学者たちが、マルチパーティ計算(MPC)を活用してユーザーのプライバシーを損なうことなくCovid-19のスクリーニングを最適化する方法を実証したという事例があります。

そのほか、MPC + 秘密分散ベースの秘密計算の応用事例は以下の記事にて解説しています。

【事例】安全にデータ活用を!マルチパーティ計算(MPC)の事例を紹介!

 

一方、差分プライバシーの応用事例としては、GAFAの利用が挙げられます。例えばGoogleは、マップで検索したレストランの情報に混雑時間や人気メニューを表示する機能に、差分プライバシーを使っています。

秘密計算と連合学習の違い・マトリックス

 

まとめ

秘密計算と差分プライバシーの違いについて、解説しました。

  • 秘密計算とは、暗号化したままの状態で計算を実行することである。
    • 主な手法として、秘密分散 + MPCベースと準同型暗号ベースが存在する
    • 計算速度の観点から、秘密分散 + MPCベースの秘密計算を比較対象として扱う
  • 差分プライバシーとは、個人データが識別されないようにしながら、大規模なデータセットから学習できるようにするアプローチである。
  • 秘密計算では、暗号化によりユーザのプライバシーを保護するのに対し、差分プライバシーでは、データセットにノイズを追加することでユーザの正確なデータを取得できないようにすることでプライバシーを保護している。
  • 秘密計算は、株式会社Acompanyが独自に開発して秘密計算エンジンを提供しており、差分プライバシーはGoogleによりオープンソースライブラリが公開されている。
  • 秘密計算はCovid-19スクリーニングに使用された事例などがあり、差分プライバシーはGoogleマップの混雑表示などに利用されている。

メンバー募集

Acompanyでは、秘密計算の社会実装に向けてメンバーを絶賛募集中です!
優秀なメンバーが集まる環境で世の中に新しい価値を作る挑戦を僕らとしませんか?
以下の分野のメンバーを募集中です!

✅ ソフトウェアエンジニア
✅ マーケティング
✅ バックオフィス

興味がある方は、まずは軽くお話しするだけでも大丈夫ですので、ぜひご連絡ください!😎

話を聞きたい!

-秘密計算
-, , , ,

© 2021 秘密計算の国内最大ブログ | Acompany Co., Ltd. Powered by AFFINGER5