データセキュリティ

連合学習(Federated Learning)についてわかりやすく解説!

はじめに

連合学習(Federated learning)とは、従来の機械学習が持つ弱点を克服した新たな機械学習の手法であり、近年大きな注目を集めています。

本記事では、以下の3つの項目に焦点を当てて解説しています。

  • 連合学習とは何か
  • 連合学習と一般的な機械学習にはどういった違いがあるのか
  • データ活用にどのような影響を与えるのか

なお、連合学習と秘密計算の違いに関しては、以下の記事にて解説しています。

【比較】連合学習(FL)と秘密計算の違いって何?

連合学習(Federated learning)とは

連合学習(Federated learning)とは、データを集約せずに分散した状態で機械学習を行う方法であり、2017年にGoogle社が提唱しました。

Googleは、連合学習を用いることでデータを処理する過程の効率性を高め、スマートフォンがより良いパフォーマンスを発揮するだろう、と考えたのです。

スマートフォンを用いた連合学習は以下のようなプロセスで行われます。

  1. スマートフォンに現在のモデルをダウンロードする
  2. スマートフォン自らのデータに基づいた機械学習を行い、改善点や変更点を割り出す
  3. 改善点や変更点の情報のみスマートフォンからサーバーに送信される
  4. サーバーはこの情報を他のスマートフォンから送信された情報と共有し、さらに良いパフォーマンスを発揮するための共有モデルとして改善される

このように連合学習では、個々のデバイスで機械学習を行い、改善点や変更点のみを集計して、より向上したモデルをデバイスに再度配布をするのです。

一般的な機械学習と連合学習の違い

一般的な機械学習には以下のようなデメリットがあります。

  • データの収集
  • データの計算による負荷
  • データのやり取りによる通信量
  • データの持ち主のプライバシー

従来の機械学習は、個々のデータを1つの場所に集約し、そのデータを用いて学習を行います。

学習が行われる前の大量のデータが1箇所に送信されるためデータの収集に時間がかかり、加えて学習の際の計算負荷も大きくなります。

また、データのやり取りに多大な通信量がかかることに加えて、データがデータの持ち主のデバイスから外に出てしまうため、プライバシーの担保ができないこともデメリットとして挙げられます。

つまり、従来の機械学習は大量のデータを持ち主から離して扱うため、上記のような問題を抱えてしまうのです。

 

そこで、これらの問題を解決する手法として、連合学習が注目されています。

連合学習では個々のデバイスで機械学習を行い、改善点などの必要な要素のみ集計します。

そのため、大量のデータを収集する必要がなく、データの計算負荷も一定であり、通信量も少なく済みます。

さらに、データがデータの持ち主から離れることがないので、プライバシーも確保できます。

この連合学習の特性によって、データの活用のハードルが下がると考えられます。

連合学習によるデータの活用

先ほど述べたように、連合学習はプライバシーを担保したままデータを活用できる手法です。

例えば、GoogleはAndroidのGoogleキーボードに連合学習を使用しています。

Googleキーボードでは、文字を入力している時に関連するキーワードを表示し、その候補の中から選んだキーワードをスマートフォンに学習させます。

そして、必要な要素のみをサーバに送信し、新たなモデルを再度配布するため、連合学習を用いたデータ活用が行われているのです。

 

また、私たちが普段利用しているスマートフォンはデータの宝庫と言われています。

そのため、スマートフォンのデータには多方面での活用の可能性があるのですが、プライバシーの問題があるため多くの人はスマートフォンのデータが利用されることは、望まないと考えられています。

しかし、プライバシーが確保されるならばどうでしょうか。データが活用されることに対して拒否感を示す人は減ると思われます。

多くの人が連合学習を用いたスマートフォンのデータ活用に賛同すれば、様々な領域におけるデータ活用がより盛んになると考えられます。

 

連合学習はスマートフォンなどのデバイスだけでなく、医療分野においても活躍します。

例えば、いくつかの病院が連携して、ある病気の処置法を機械学習を用いて計算する場合について考えます。

従来の機械学習を用いると、その病気の罹患者の年齢・性別・身長・体重・病気にかかった時期・ほかの持病・生活習慣など、プライバシーに関わる情報を、全ての病院から集めて計算をすることになります。

この方法では、プライバシーの担保ができないため、情報を提供することに抵抗感を示す人も多いと考えられます。

一方、連合学習を用いる場合、その病気の罹患者の情報について病院ごとに集計・機械学習を行い、各病院の計算結果のみを集めて処置を考えます。

そのため、それぞれの病院から患者のデータが出ないので、プライバシーを確保したまま病気への処置を算出することができるのです。

また、連合学習は医療だけでなく、金融・軍事・製薬などのプライバシー保護を必要とする様々な領域において活用される可能性があると考えられています。

まとめ

  • 連合学習(Federated Learning)とはデータを集約せずに分散した状態で機械学習を行う手法である
  • 連合学習によって従来の機械学習が抱えていたプライバシー問題などが解決できる
  • 連合学習は医療・金融・製薬など多方面に活用することができる
  • 様々な利点はあるが機械学習の全ての問題を解決することはまだ不可能である

連合学習は従来の機械学習の抱える問題を解決する新たな手法でありますが、まだ全ての課題を解決することはできません。

しかし、連合学習の技術が進歩することによって、データの利用がさらに容易になり、活用の幅が広がると考えられます。

引用

メンバー募集

Acompanyでは、秘密計算の社会実装に向けてメンバーを絶賛募集中です!
優秀なメンバーが集まる環境で世の中に新しい価値を作る挑戦を僕らとしませんか?
以下の分野のメンバーを募集中です!

✅ ソフトウェアエンジニア
✅ マーケティング
✅ バックオフィス

興味がある方は、まずは軽くお話しするだけでも大丈夫ですので、ぜひご連絡ください!😎        

詳細はこちら

       

【無料】秘密計算コンソーシアムメンバー募集中!

秘密計算コンソーシアムは秘密計算を中心とした、プライバシーテックに関連する情報発信およびイベント開催を行うコミュニティです!!
個人情報やプライバシーの付随するデータの活用に悩まれている企業・担当者様にとって、法令遵守した安全安心なデータ活用を実現するヒントが得られる場所となっています。
無料ですので、ぜひご気軽にご加入ください!

コミュニティ参加メンバーへの特典

✅ 月1回のイベント「秘密計算.jp」を優先的にご案内
 初回は豪華メンバーが登壇します!!
✅ 限定メールマガジンの配信
✅ 「2時間でプライバシー保護データ活用がわかる勉強会」特別割引

詳細・申し込みはこちらから!

-データセキュリティ
-, , , , ,

© 2021 秘密計算の国内最大ブログ | Acompany Co., Ltd. Powered by AFFINGER5