個人情報保護 情報セキュリティ 秘密計算

プライバシー保護マシンラーニングは、データ共有の課題を解決できるか?

プライバシー保護マシンラーンイグ

はじめに

本記事では、近年海外のメディアを中心に話題となっているプライバシー保護マシンラーニング(Privacy-Preserving Machine Learning)の背景と全体像について解説します。

プライバシーを守る人工知能技術は、コストと複雑さの障壁を克服できれば、研究者や企業にとってこれまで難しかった機密データから知見を得ることが容易になる可能性があります。

プライバシー保護マシンラーニングへの期待

IDCの発表によると2020年の総データ量は、59ゼタバイトを超えるとされています。

日々増加するデータ量の増加と計算コストの低下によりデータ活用のニーズはますます高まっています。しかし、サイバーセキュリティやデータに付随するプライバシーの問題がデータ活用を進める障壁となります。例えば、企業はサイバーセキュリティが理由で十分にデータ活用を進めることができていません。

また、金融犯罪や病気についてのデータセットも上記の問題でデータセットの入手が困難で、研究者が問題解決に取り組むことを妨げます。

従来のマシンラーニングでは、暗号化されていないデータセットに対して解析処理を行います。そのため、データセットの持ち主と分析者が違う場合や、持ち主の違う複数のデータセットを統合分析することは、セキュリティリスクが高くハードルが高いものでした。さらに、データセットがプライバシーの付随するデータであれば、なおのことです。

プライバシー保護の観点では、データの匿名化が最も有名なプライバシー保護手法です。個人情報保護法で匿名加工処理を施したデータ(匿名加工情報)であれば、第三者提供を認められています。

しかし、データの爆発的な増加により、マスキングされたデータセットの中の個人を特定することはさほど難しくなくなっています。2019年に公開されたある論文では、匿名化を施したデータセットに対して、研究者の作成したモデルを使用すると99.98%が正しく再識別される結果となりました。米RSAの最高技術責任者であるZulfikar Ramzan氏は、「プライバシーを保護するという目標は、利用可能なデータの断片が非常に多いため、解決が難しくなっています」と述べています。

このようなプライバシー保護の重要性とデータ活用のジレンマがプライバシー保護マシンラーニングへの期待を高める結果となりました。プライバシー保護マシンラーニングは、複数のデータ所有者が完全性とプライバシーを損なうことなく、学習モデルを構築するための技術です。

プライバシー保護マシンラーニングの技術

プライバシー保護マシンラーニングの主要な技術要素は下記です。

  • マルチパーティ計算(Multy-party Computation)
  • 連合学習(Federated learning)
  • 差分プライバシー(Differential privacy)
  • 準同型暗号(Homomorphic encryption)

マルチパーティ計算(Multy-party Computation)

マルチパーティ計算は、複数の関係者がそれぞれのデータを共有することなく、共同でデータの分析を行うことを可能とします。

秘密計算の一種としても注目されます。マルチパーティ計算については、こちらの記事でも詳しく紹介しています。

連合学習(Federated learning)

連合学習は、分散環境にある複数のデバイスでアルゴリズムの学習を実施し、学習した結果をすべての中央サーバーと共有することで、モデルを構築することでプライバシーを保護した学習を実現します。

例えば、国内でも不正送金を検知するモデルの取り組みなどが挙げられます。

差分プライバシー(Differential privacy)

差分プライバシーは、データにノイズを追加してデータ侵害を困難にすることで、プライバシーの保護を実現します。このような暗号化手法は、大規模なデータセットに向いています。

準同型暗号(Homomorphic encryption)

準同型暗号は、暗号化したデータの状態で計算を行う技術です。この技術を用いたデータの所有者は、生成された計算の結果を復号する事ができます。

準同型暗号は秘密計算の一種として注目されます。

まとめ

プライバシー保護マシンラーニング(Privacy-Preserving Machine Learning)についてまとめました。

従来のデータ活用とセキュリティのトレードオフの関係から両立の実現への期待が高まっています。

特に、要素技術は日々進化を続けているので要注目です。

  • マルチパーティ計算(Multy-party Computation)
  • 連合学習(Federated learning)
  • 差分プライバシー(Differential privacy)
  • 準同型暗号(Homomorphic encryption)

参考


メンバー募集

Acompanyでは、秘密計算の社会実装に向けてメンバーを絶賛募集中です!
優秀なメンバーが集まる環境で世の中に新しい価値を作る挑戦を僕らとしませんか?
以下の分野のメンバーを募集中です!

✅ MPCエンジニア
✅ マーケティング
✅ バックオフィス

興味がある方は、まずは軽くお話しするだけでも大丈夫ですので、ぜひご連絡ください!😎

話を聞きたい!

-個人情報保護, 情報セキュリティ, 秘密計算
-, , , , , ,

© 2020 秘密計算の国内最大ブログ | Acompany Co., Ltd.