はじめに

連合学習（Federated learning）とは、従来の機械学習が持つ弱点を克服した新たな機械学習の手法であり、近年大きな注目を集めています。なお、連合学習と秘密計算の違いに関しては、以下の記事にて解説しています。
https://acompany.tech/privacytechlab/comparison-federated-learning-and-secure-computing/

連合学習（Federated learning）とは

連合学習（Federated learning）とは、データを集約せずに分散した状態で機械学習を行う方法であり、2017年にGoogle社が提唱しました。 Googleは、連合学習を用いることでデータを処理する過程の効率性を高め、スマートフォンがより良いパフォーマンスを発揮するだろう、と考えたのです。スマートフォンを用いた連合学習は以下のようなプロセスで行われます。

スマートフォンに現在のモデルをダウンロードする
スマートフォン自らのデータに基づいた機械学習を行い、改善点や変更点を割り出す
改善点や変更点の情報のみスマートフォンからサーバーに送信される
サーバーはこの情報を他のスマートフォンから送信された情報と共有し、さらに良いパフォーマンスを発揮するための共有モデルとして改善される

このように連合学習では、個々のデバイスで機械学習を行い、改善点や変更点のみを集計して、より向上したモデルをデバイスに再度配布をするのです。

連合学習のメリット

連合学習には「データ通信及びデータ保管コストの削減」や「学習モデルの更新がより容易かつ素早く行えるようになる」、「結果習得までに時間の短縮化」など下記のようなメリットがあります。

データ通信及びデータ保管コストの削減
結果習得までの時間の短縮化
学習モデルの更新がより容易かつ素早く行えるようになる
最新の学習モデルの利用までの即時性
電力消費量の大幅なカットオフ
プライバシーの確保

ここでは3つのメリット「データ通信及びデータ保管コストの削減」と、「結果取得までの時間の短縮化」、そして「プライバシーの確保」について詳しく見ていきます。連合学習を使用する上で最大のメリットとなるのはやはり、サーバーへの負荷低減です。機械学習において、データを大量に、そして一つのサーバーに集約して行うため、負荷がかなりかかります。一方で連合学習の場合は、すでに学習が完了したモデルのみを1カ所のサーバーに送信するため、従来の機械学習よりはサーバーへの負荷がかかりません。また通信量も少なくすみます。結果取得までの時間の短縮化に関しては、サーバー負荷低減同様、一つのサーバーで学習から全て集約をする必要がなく、個々のデバイスで機械学習を行い、改善点などの必要な要素のみを集計。従来の機械学習よりも早く結果を取得できます。また連合学習は、もとデータがデータの持ち主から離れることがなく、学習の結果のみをサーバーへ送信する手法のため、プライバシーの確保も期待できます。このことから、プライバシーテックの一つとして見られることも多いです。この連合学習の特性によって、データの活用のハードルが下がると考えられます。

一般的な機械学習のデメリットを補完している

一般的な機械学習には以下のようなデメリットがあります。

データの収集
データの計算による負荷
データのやり取りによる通信量
データの持ち主のプライバシー

従来の機械学習は、個々のデータを１つの場所に集約し、そのデータを用いて学習を行います。学習が行われる前の大量のデータが１箇所に送信されるためデータの収集に時間がかかり、加えて学習の際の計算負荷も大きくなります。また、データのやり取りに多大な通信量がかかることに加えて、データがデータの持ち主のデバイスから外に出てしまうため、プライバシーの担保ができないこともデメリットとして挙げられます。つまり、従来の機械学習は大量のデータを持ち主から離して扱うため、上記のような問題を抱えています。

連合学習によるデータの活用

先ほど述べたように、連合学習はプライバシーを担保したままデータを活用できる手法です。例えば、GoogleはAndroidのGoogleキーボードに連合学習を使用しています。

Googleキーボードでは、文字を入力している時に関連するキーワードを表示し、その候補の中から選んだキーワードをスマートフォンに学習させます。

そして、必要な要素のみをサーバに送信し、新たなモデルを再度配布するため、連合学習を用いたデータ活用が行われているのです。

また、私たちが普段利用しているスマートフォンはデータの宝庫と言われています。そのため、スマートフォンのデータには多方面での活用の可能性があるのですが、プライバシーの問題があるため多くの人はスマートフォンのデータが利用されることは、望まないと考えられています。しかし、プライバシーが確保されるならばどうでしょうか。データが活用されることに対して拒否感を示す人は減ると思われます。

多くの人が連合学習を用いたスマートフォンのデータ活用に賛同すれば、様々な領域におけるデータ活用がより盛んになると考えられます。連合学習はスマートフォンなどのデバイスだけでなく、医療分野においても活躍します。例えば、いくつかの病院が連携して、ある病気の処置法を機械学習を用いて計算する場合について考えます。

従来の機械学習を用いると、その病気の罹患者の年齢・性別・身長・体重・病気にかかった時期・ほかの持病・生活習慣など、プライバシーに関わる情報を、全ての病院から集めて計算をすることになります。この方法では、プライバシーの担保ができないため、情報を提供することに抵抗感を示す人も多いと考えられます。

一方、連合学習を用いる場合、その病気の罹患者の情報について病院ごとに集計・機械学習を行い、各病院の計算結果のみを集めて処置を考えます。そのため、それぞれの病院から患者のデータが出ないので、プライバシーを確保したまま病気への処置を算出することができるのです。また、連合学習は医療だけでなく、金融・軍事・製薬などのプライバシー保護を必要とする様々な領域において活用される可能性があると考えられています。

まとめ

連合学習（Federated Learning）とはデータを集約せずに分散した状態で機械学習を行う手法である
連合学習によって従来の機械学習が抱えていたプライバシー問題などが解決できる
連合学習は医療・金融・製薬など多方面に活用することができる
様々な利点はあるが機械学習の全ての問題を解決することはまだ不可能である

連合学習は従来の機械学習の抱える問題を解決する新たな手法でありますが、まだ全ての課題を解決することはできません。しかし、連合学習の技術が進歩することによって、データの利用がさらに容易になり、活用の幅が広がると考えられます。

引用

Google AI Blog(2017)
https://ai.googleblog.com/2017/04/federated-learning-collaborative.html
FEDERATED LEARNING: STRATEGIES FOR IMPROVING COMMUNICATION EFFICIENCY(2017)
https://arxiv.org/pdf/1610.05492.pdf
Federated Machine Learning: Concept and Applications(2019)
https://arxiv.org/pdf/1902.04885.pdf