はじめに
連合学習(Federated Learning)とはなんだろうか。
連合学習は、今までの機械学習が持つ弱点を克服した「新たな機械学習」として注目を浴びる手法であり、昨今大きな注目を集めている。
過去、プライバシーテック研究所でも連合学習についての紹介記事や、秘密計算との違いなどの記事を出してきた。これらの記事公開から2年ほど経過し、ようやく連合学習でも具体的な事例が出るようになってきた。
そこで今回は、連合学習を実際に使用した事例について紹介していこうと思う。
復習:連合学習とは
まずは連合学習についておさらいをしておきたい。
連合学習とは、データを集約せずに分散した状態で機械学習を行う方法であり、2017年にGoogleにより提唱された。現にGoogleのキーボード予測変換はこの連合学習が使用されているという。
連合学習の最大のメリットは、サーバーに負荷をかけずに機械学習ができる点だ。パソコンやスマホなどの端末で学習を行い、機械学習において必要な結果をサーバーへ送信することで、サーバーだけに頼らない学習方法となっている。
このことから、秘密計算や差分プライバシーといったプライバシーテックの一つとして数えられることが多い。現在プライバシーテックは6つの技術が含まれていると考えられる。そのほかの技術に関してはこの記事を参照してほしい。
脱線したが、連合学習の仕組みを簡単に説明すると、端末内部で参照できるデータのみを利用してモデルを作成し、端末内で学習を実行。学習後モデルのパラメーターのみをサーバーへ共有し、サーバーのモデルを更新する仕組みだ。
詳しくはこの記事に書いているので確認してほしい。
どのようなケースで連合学習が活躍しているのか
Googleのキーボード予測変換での連合学習の使用はとても有名だ。Googleによれば、Googleが開発したAndroidのキーボード「Gboard」にて連合学習が使われているという。仕組みとしては、Gboardが提案した予測変換をユーザーがクリックしたかどうかをスマホ端末に保存。この履歴を使用して連合学習を行い、ユーザーへの予測変換の提案力を高めているようだ。
キーボードの予測変換は、私たちにとって身近な存在だ。ここではそれ以外のヘルステック分野や金融分野での連合学習の具体例について紹介していきたい。
ヘルステック分野で加速する連合学習の実例
ヘルステック分野では、連合学習の利用が加速している。
例えば医療系AIスタートアップのOwkin(フランス)は、連合学習をコア技術に医療データのプラットフォームを運営している。2021年には1億8,000万ドル(約240億円)の調達に成功。ユニコーン企業の1社だ。
Owkinでは、医療現場に正しい治療の精度を向上させることを目的に、各医療機関が保有するカルテデータの機械学習に取り組んでいる。とはいえ、カルテ情報には大量の個人情報が含まれている。この個人情報を出すことなく、各医療機関でモデルを生成し、個人情報を含まないモデル「のみ」をデータセンターに送信。大きな学習モデルを作るという連合学習を提案している。
創薬創生を目的とした用途も多かった。
創薬創生のためのデータベース作成に、連合学習を取り入れた事例が複数ある。その代表例にはMELLODDYプロジェクトがある。これは、複数の創薬会社で機密情報を守りつつもライブラリを共有するやり方だ。参加企業には、アステラス製薬といった日本企業も名を連ね、その他にもアストラゼネカやAMGENなど創薬会社が参画する。
創薬には大量のデータが欠かせない。しかし、個人情報に該当するものが多く、なかなか外部と連携できない。
他にも、国内単体ではヘルステック分野に連合学習を取り入れた機械学習ライブラリを提供するスタートアップがいる。Elixは、連合学習機能を有したAI創薬向け機械学習ライブラリ『kMoL』を公開。kMoLは、データに含まれる化合物の機密性を外に出すことなく、大量のデータから創薬の生成につながるデータを提供できると期待されている。
金融分野での連合学習実例も見られるように
中国系では金融分野でのプライバシーテックが加速している。
連合学習も同じで、香港応用科学技術研究所(ASTRI、香港)は、銀行やプラットフォーマーと連携して、中小企業を対象とした信用評価モデルの生成に取り組んだという。中小企業が融資を申請し、認可を受けている場合にのみ、金融機関は対象企業に関連するパラメータを取得し、信用評価を行うことができる仕組みという。
また同社は、2020年に「Alternative Credit Scoring of Micro-, Small and Medium-sized Enterprises」というタイトルの、企業の信用力に対するホワイトペーパーを執筆。連合学習を活用し、データを外に出さずに会社の信用力をスコア化する取り組みも進んでいるようだ。
もう一社、中国本土で金融領域で連合学習に取り組む企業がある。
藍象智聯(杭州)科技(同・浙江省杭州)は、連合学習に取り組む企業だ。2021年、モントリオールで開催された「FTL-IJCAI’21(連合学習に際する最新技術発表会)」において全く新しいグラフ連合学習の技術紹介論文が採択された。
同社の手がける連合学習は、銀行同士のネットワークとオペレータ側のネットワークの仲介役として働き、双方に機密性を保持したまま詐欺防止のために取引を遮断することができるという内容のようだ。
日本ではNECが連合学習と秘密計算を掛け合わせて創薬における予測モデル構築にチャレンジ
では国内の事例はどうなのだろうか。
日本の場合、連合学習を実際に活用した事例はまだまだこれからだろうという段階にある。2022年3月、NECが秘密計算と連合学習を組み合わせ、創薬における予測モデル構築の実証実験を行ったとのリリースを公開した。
同実証実験は、連合学習技術を基盤として手を加えた機械学習ライブラリにNECの秘密計算技術を適用して実施。様々な化合物と毒性が記載されているデータセットを用いた毒性予測モデル等を評価したという。
この実証実験の結果は、連合学習モデルに秘密計算技術を適用して構築したAIモデルは、連合学習技術のみで構築したAIモデルと比較して同等の精度を満たすことを確認したという。
とはいえ、この実証実験では連合学習の強みはあまり出ていない。
まだまだ国内では、実用に向けた動きはなさそうだ。
まとめ
- 連合学習はプライバシーテックの一つである
- 連合学習はヘルスケア領域と金融領域で実用が加速している
- 国内ではまだ確立したプレイヤーがおらず、これからの状態となっている