この記事では、近年、注目度が高まってきたセキュアマシンラーニングの解説と、実際に各企業で進んでいる研究事例の紹介をします。
はじめに
近年、身の回りで利用する様々なものがIoT化しているように、生活の中でデジタル機器に触れることが当たり前になってきています。
そうした状況は、企業に対し、それらの機器から得られた消費者の行動パターンなどの情報を収集し、機械学習などの分析などを用いて利活用するといった新たなビジネスチャンスをもたらしています。
しかし、今年6月に個人情報保護法が改正されたことで、企業に求められる情報リテラシーも向上し、収集した個人情報の取り扱いに係るリスクも高まってきています。
なお、改正個人情報保護法に関する詳細は下記記事にて解説しています。
http://acompany.tech/blog/revised-personal-information-protection/
そうした中、情報を暗号化した状態で機械学習を行うことができるセキュアマシンラーニングに注目が集まり、世界中の企業で調査・研究が行われています。
セキュアマシンラーニングとは
セキュアマシンラーニングとは、解析対象となるデータを暗号化したままの状態で、つまり、秘密計算を用いて、機械学習を行う手法のことです。
従来の機械学習では、データの解析を行う際に、生のデータを利用する必要がありました。これよって、外部から攻撃を受けた際にデータが流出してしまったり、機密性を高めるためにデータの流動性が制限されたりするというデメリットがありました。
しかし、先述したセキュアマシンラーニングの技術を用いることによって、これらのデメリットを解消することができます。
近年のセキュアマシンラーニングに関する事例
ここからは、近年のセキュアマシンラーニングに関する事例を紹介します。
セキュアマシンラーニングの中で特に注目が集まっているのは、ディープラーニングを実現することを目指す研究であり、実際に多くの機関で研究が行われています。
NTTが発表した事例
NTTは、データを暗号化したまま標準的なディープラーニングの学習処理を行う技術を発表しました。
一般的なディープラーニングは、四則演算や、指数、逆数、平方根を組み合わせた処理を行います。しかし、セキュアマシンラーニングに欠かせない秘密計算には、これらの計算の一部が不得手である、というデメリットがありました。その影響もあり、従来のセキュアマシンラーニングでは、粗い精度の結果しか得られませんでした。
NTTが開発したディープラーニングに欠かせない計算を行う専用の関数を新たに導入することによって、従来の技術に比べて短時間で精度の高い結果を得ることが可能になりました。
Microsoftが発表した事例
Microsoftは、TensorFlowという機械学習ライブラリのコードからMPCプロトコルを生成するシステム、CrypTFlowを発表しました。このシステムを用いたセキュアマシンラーニングの推論精度が、平文による推論精度と一致した、という結果も得られています。
このシステムでは、段階的にTensorFlowのコードを変換させていくことによって、安全性の高いMPCプロトコルを得ることができます。
Microsoftが従来発表していたシステムでは、手書き文字の学習などの小規模なネットワークでのセキュアマシンラーニングの実行しかできませんでした。しかし、今回の発表では、より大きなデータセットで従来に比べ、優位な結果が得られています。
ディープラーニングに関する研究が盛んに行われる一方で、実際に活用間近なセキュアマシンラーニングの事例も存在します。
国立大学法人神戸大学が取り組んでいる事例
国立大学法人神戸大学は、国立研究開発法人情報通信研究機構(NICT)サイバーセキュリティ研究所セキュリティ基盤研究室、株式会社エルテスと共に、「プライバシー保護深層学習技術(Deep Protect)」を活用した不正送金検知の実証実験を行っています。
この実証実験では、金融機関5行と協力し、暗号のまま加算できる「加法準同型暗号」という暗号を用いてセキュアマシンラーニングを行っています。
この技術を用いて複数の銀行の取引データを機械学習することによって、不正取引を自動検知できるようになると述べられています。
まとめ
様々な分野、業種においてデジタルトランスメーションが進む中、データ活用が新たなイノベーションやビジネスチャンスのきっかけともなり得る世の中になってきています。 また、同時にそれらの情報を安全に利活用できる技術が求められています。
そのための技術の一つとして、暗号化したまま機械学習を行うことができる、セキュアマシンラーニングが注目されています。
- セキュアマシンラーニングとは、解析対象となるデータを暗号化したまま機械学習を行う手法のことである
- セキュアマシンラーニングの分野において、特にディープラーニングの領域では、MPCを用いた研究が盛んに行われている
- セキュアマシンラーニング技術を活用した実証事例も増え始めている