本記事では、データ連携のメリット・デメリットや、データ連携を取り巻く環境を整理した後、データ連携のリスクを抑える手法を紹介します。
はじめに
近年、IoT化が進み、サービスを提供する企業は様々な場面でユーザの情報を取得することができるようになっています。
また、そうして収集した情報をサービスの垣根を超えて利用する、データ連携によって新たな価値が創出されています。
企業間でのデータ連携による事例として、株式会社日立製作所、KDDI株式会社、積水ハウス株式会社による、通信契約時の本人確認情報をセキュアに連携することで、賃貸契約や損害保険、ライブラインなどの申し込みを簡素化できるワンストップ提供ビジネスがあります。
従来の不動産業界の賃貸物件の契約の際、ユーザは実店舗を訪問し、担当者の立ち合いを受けて内見を実施したのち、店舗窓口にて入居申し込み手続きをしていました。しかし、この方法では、ユーザにとっても、不動産会社にとっても負担が大きく、繁忙期の業務量の増大や、接客サービスの機会損失が起こっていました。
上記の課題を解決するため、KDDIが持つ通信契約時の本人確認情報を、ユーザ同意を得て利用し、この顧客情報と賃貸契約情報をセキュアに連携するという、実証実験を実施しました。その結果、内見や本人確認業務の簡素化が可能であることが確認されました。
これに加えて、物件入居の際に必要となる損害保険や電気、ガス、通信といったライフラインの申し込み手続きも簡素化できる可能性があることも明らかになっています。
このように、企業間でのデータ連携によって新たな価値を創出している事例が存在します。
しかし、その一方で、企業間でのデータ連携によるインシデントが発生しています。
企業間データ連携によるインシデントの事例
実際に、データ活用を推進するためにデータ連携を行なったものの、提供先の企業や関連企業からそうしたデータが漏洩してしまった事例は多く存在しています。
以下では、近年発生した事例を2つ紹介します。
2020年5月、NTTコミュニケーションズは不正アクセスにより業務契約している自衛隊関連情報が流出した可能性があるとして、調査を行なっていることを認めました。同社は同月に社内サーバの異常な操作を確認し、業務契約している621社の工事情報などが流出した可能性があると発表していました。
2021年3月、東京都が調査を依頼していた会社がウイルスに感染し、自治体のデータが漏洩した恐れがあると発表しました。他にも、東京都足立区や、荒川区、北海道旭川市などの複数自治体が、同社から情報が流出した可能性を公表しています。
データ連携に対する規制強化
企業によってユーザの様々な情報が取得されるようになったことは一見、ユーザにとって有益なことかもしれません。しかし、次第にそうしたデータ取得がユーザのプライバシーを脅かす事例が発生してきました。
そのような企業活動から、個人のプライバシーを守るため、世界的にユーザのプライバシーを保護するために法整備が進んでいます。こうした動きは欧州のGDPRから始まりました。日本でも、2020年の改正個人情報保護法によって、規制が強化されています。
なお、これら法制度の詳細は以下の記事にて解説しています。
リスクを抑えたデータ連携の実現が求められる
ここまでの話を整理します。
まず、IoTやICT技術の発達により、ユーザから様々なデータを取得可能になりました。そうしたデータを連携して活用することで、新たな価値を創出した事例もあります。
しかし、データ連携を行うことにより、連携先や関連企業からそれらのデータが流出してしまうといった問題も発生しています。
また、個人のプライバシーを守るため、プライバシーに関する情報への規制が強化されつつあります。
このような状況で、データ漏洩のリスクがない、以下のようなプライバシー保護とデータ活用を両立する技術が注目されています。
- 秘密計算 ( Secure Computing )
- 連合学習 ( Federated learning )
- 差分プライバシー ( Differential privacy )
秘密計算 ( Secure Computing )
秘密計算 ( Secure Computing ) とは、データを暗号化したまま計算を実行できる技術です。
データを暗号化したままの状態で計算を実行できるため、データ連携を行なったとしても、提携先での漏洩のリスクを抑えることができます。
詳細は以下にて解説しています。
連合学習 ( Federated learning )
連合学習 ( Federated learning ) とは、データを集約せずに分散した状態で機械学習を実行できる手法です。
GoogleがAndroidのGoogleキーボードのキーワード学習にも利用している技術でもあります。
詳細は以下にて解説しています。
差分プライバシー ( Differential privacy )
差分プライバシー ( Differential privacy ) とは、個人データが識別されないようにしながら大規模なデータセットにおけるプライバシー保護を実現する手法です。
Appleがユーザの絵文字の利用頻度状況などのデータを収集する際に利用している技術でもあります。
詳細は以下にて解説しています。
まとめ
データ連携のメリット・デメリットや、それに関する法律、また、そのリスクを抑える手法を解説しました。
- データ連携によって新たな価値を創出している事例が存在する。
- その一方で、データ連携先や関連企業による情報流出が発生している。
- ユーザのプライバシーを守るための法整備が進み、データ連携への規制が強化されている。
- リスクを下げつつデータ連携を行うという観点から、プライバシー保護とデータ活用を両立する技術が注目されている。
- 秘密計算は、データを暗号化したまま計算を実行できる技術である。
- 連合学習とは、データを集約せずに分散した状態で機械学習を実行できる手法である。
- 差分プライバシー とは、個人データが識別されないようにしながら大規模なデータセットにおけるプライバシー保護を実現する手法である。