はじめに
2017年に個人情報保護法が改正された際、ビッグデータの利活用推進を目的に「匿名加工情報(今回は「マスキング情報」の表記)」が新たに定義された。
マスキング情報は個人情報を個人が特定されないようマスキングされ、元の情報に復元ができないようにされた情報だ。
ユーザー側には個人が特定されないといったメリットがあり、企業側にはユーザー属性などを活用してマーケティングや商品・サービス開発できるといったメリットがある。
ただ、マスキング情報は加工の手間がかかる、一般消費者の認知度は低いなど、未だに多くの課題を抱えている。
このような中でマスキング情報は現状、正しく利活用され、当初の目的であったビッグデータ利活用推進を果たしているのだろうか。
今回は、マスキングの現状や課題、マスキングに取り組んでいる企業について解説していく。
「マスキング情報」の現状はなかなか厳しい
そもそも、マスキング情報とは何なのか。
プライバシーテック研究所では何度もマスキング情報(匿名加工情報の表記がメイン)を取り扱ってきた。その中で匿名加工情報を研究所では下記のように定義している。
「匿名加工情報とは、個人情報を加工して特定の個人を識別できないようにしたものであり、個人情報保護法において定義されている、個人に関連する情報の一つだ」
匿名加工情報に関しては、個人情報保護委員会が定義、そして事業者に対する義務などを詳しく書いているので、該当ページも参考にしてほしい。
マスキング情報の現状
まず、マスキング情報の現状からみていこう。マスキング情報が個人情報保護法で定義されたのは2017年に改正法が施行された時だ。
ビッグデータの利活用推進などを目的に匿名加工情報の規定が新設・導入された。規定が新設された後、マスキング情報の利活用は進んでいるのか。
野村総合研究所が2020年に公表した「パーソナルデータの適正な利活用の在り方に関する実態調査(令和元年度)報告書」によれば、マスキング情報の公表事業者は、2017年度末で約300社、2018度末では366社、2020年3月時点で約500社と年々増加している。
業界別に見ると、小売業が約23%、保険・福祉業が約17%の順で多い。また、業界内の内訳を見ると、小売業の中では調剤薬局・ドラッグストアが約77%、保険福祉業の中では健康保険組合が約67%を占めている。
マスキング(匿名加工)情報の課題
ただ、利活用が進んでいるからといって、マスキングがスムーズに利活用できるとは限らない。
というのも、マスキングには未だに多くの課題を抱えているからだ。
定義はあるものの情報ごとに方法が異なり加工が面倒
「パーソナルデータの適正な利活用の在り方に関する実態調査(令和元年度)報告書」によれば、マスキング情報を扱っている各事業は悩みながら適正な加工方法を決定しているとしている。
これは個人情報保護委員会事務局が事務局レポートで加工事例を公開しているものの、自社保有の情報と完全に一致しているケースは少ないことが原因だ。
個人が識別されないようにするには、元となる個人情報を高度にマスキングしなければならず、非常に大きな手間がかかる。
だからといって、あまりにも高度にマスキングしてしまうと、情報が欠損してしまうため、詳細な分析を簡単に行えないといった課題が新たに発生してしまうというわけだ。
一般消費者の認知度が低い
もう1つの課題は認知度の低さだ。
一般社団法人データサイエンティスト協会が「匿名加工情報利用に関する意識調査」を行い、2019年に公表した。意識調査によれば、マスキング情報の一般消費者の認知度は低く、「知らなかった」と回答した割合は全体の8割を超えている。
認知度が低いことも相まって、マスキング情報の賛否を問われても判断できないという人が全体の5割を占めている結果となった。
2019年の調査結果のため、当時と比べると認知度は多少向上しているかもしれないが、個人情報の保護という意識だけが先行し、マスキング情報やCookieなどデータの種類について理解していない消費者は少なくない。
マスキング情報の悪いイメージが先行した場合、反対意見に傾く可能性も高いといえるだろう。したがって、マスキング情報の利活用をさらに推進していくためには、一般消費者の認知度を向上させて、理解の促進に取り組んでいかなければならない。
マスキング情報の利活用はヘルスケアや会計領域で進んでいる
マスキング情報の課題は多いが「マスキング情報の現状」でも簡単に触れたとおり、マスキング情報の利活用は着実に進んでいる。
「パーソナルデータの適正な利活用の在り方に関する実態調査(令和元年度)報告書」を見ると、令和2年3月時点で調剤薬局・ドラッグストアや健康保険組合、会計士・税理士事務所、病院などで利活用が進んでいることが分かる。
利活用事例として有名なのは、マスキングを忠実に守っているJR東日本の「駅カルテ」だろう。Suicaから得たユーザー情報を加工し、性別や年代別の特徴、利用状況などを閲覧できる。
マスキング対応企業にはヘルスケアが多い?
マスキング情報の利活用が進んだことで、マスキング情報市場に参画し、マスキング事業を展開している企業が増えている。
中でも、今回調査した中で目立ったのが「ヘルスケア領域」だ。ここで紹介するほとんどの企業はヘルスケア向けのマスキングサービスを展開している。やはり、医療データは高機密な情報が多く、国内でも早々に取り掛かっているのだろう。
インフィニティメディカルソフト
インフィニティメディカルソフトは、マスキング対応医療画像エクスポートソフト「MitySafetyExporter」を提供している。
このソフトを活用すれば、CTRやMRIなどの画像上の個人情報や施設情報を簡単な操作で削除できるため、学会資料用のデータ変換など様々なシーンで利用可能だ。
健康保健医療情報総合研究所
健康保険医療情報総合研究所は、ID匿名化ツール「Anony-an(アノニャン)」を提供している。
マスキング情報を提供する際は、患者IDを削除しなければならない。Anony-anは画面構成がシンプルなツールで、簡単な操作で匿名化番号を作成できる。
EMシステムズ
EMシステムズはマスキング情報の作成・提供を行っているようだ。
またEMシステムズによれば、医療機関などから個人情報匿名化の委託を受けて、マスキング情報として患者情報と処方箋情報、調剤実施情報の3項目を作成し、高度なセキュリティで保護されたクラウドサービスにおいてこれらの情報を提供しているという。
Yuimedi
Yuimediは医療データ特化型クレンジングソフトウェア「Yuicleaner」を提供している。
クレンジングナレッジの蓄積や表記ゆれなどの自動集といった医療分野のデータ活用を手助けしてくれるソフトウェアだが、匿名化処理のサポート機能も実装されているのが特徴だ。
k-匿名化の処理はもちろん、匿名変換された情報の匿名度を測定してくれるサポート機能もあり、安全にマスキング情報を利活用できる。
MediBic
メディビックは匿名化システム「Anonymity」を提供している。
強固なセキュリティとバーコード機能を併せ持つトータルシステムとなっており、様々な実験などで扱われている検体の匿名化を簡単かつ効率的に行うことが可能だ。
インサイトテクノロジー
インサイトテクノロジーはマスキングツール「Insight Data Masking」を提供している。
日本語に最適化されたマスキングツールで機械学習モデルならびにルールベースのエンジン解析によって個人情報などの機密情報を自動で抽出できる。
文字種や文字長を維持したままマスキング処理したり、セグメント指定してマスキング処理したりするなども可能だ。
AimeSOFT
Aimesoft Japanは、データマスキングツール「AimeMasking(アイメマスキング)」を提供している。
AimeMaskingは個人情報のマスキングにAIや機械学習データを利用しており、山田さんを高橋さんに置き換えるというように、人名や組織名などを統計上ならびに自然言語処理上の意味を変更させることなくマスキングが可能だ。
keepdata
Keepdataは純国産のDXソリューション「KeepData Hub」を提供している。
KeepData Hubは業務プロセスをデジタル化させるためのツールだが、利用データのマスキング機能が実装されている。
これにより、一括変換で個人情報を除去し情報のマスキングが可能だ。
ENTORRES
ENTORRESは自動マスキングシステム「DICOMゲートウェイ」を提供している。
CTなどから送信された医療画像や治験・研究IDなどを任意のルールに従って自動マスキングすることが可能だ。
ナウキャスト
ナウキャストはビッグデータを利活用するために行われるマスキング加工化などの前処理工程をサポートするソリューション「DataPrep(データプレップ)」の提供開始を発表した。
オペレーターとの手作業と機械学習などの自動処理プロセスを組み合わせることで効率的に精度の高いマスキングを行える。
対応可能なデータはPOSとクレジットカード、位置情報の3種類だが、相談次第では他のデータでも利用できるそうだ。
User Local
User Localはマスキングツール「個人情報マスキングAIツール」を提供している。
個人情報マスキングAIツールは個人情報をAIが自動で判別しマスキングしてくれるツールだ。ブラウザやWebAPIからデータをアップロードするだけで個人情報をマスキングでき、金融や行政・自治体、流通・小売業など幅広い分野で活用されている。
TRUST SMITH
TRUST SMITHは映像データ自動マスキングAIツール「Masking-AI」を提供している。
画像や映像内に移っている人の顔や車のナンバープレートをAIが自動でマスキングして個人情報を取り除くことが可能だ。
人件費や映像の応用範囲を拡大でき、保険会社や映像制作会社などで多くの業界で活用されつつある。
dSPACE
dSPACE Japanは、AIによって自動で画像をマスキングできるツール「Identity Protection Anonymizer」を提供している。
複数のディープラーニングアルゴリズムを利用することで、顔やナンバープレートを自動検出してマスキングすることが可能だ。
4DIN
4DINは、臨床データ匿名化ツールとして「CoNaxs」を提供している。
研究データに記載されている年齢や氏名、日付、郵便番号などの個人情報を簡単かつ効率的にマスキング情報へ変換することが可能だ。
今回紹介したマスキング対応企業を一覧にしてみた。ぜひ参考にしてほしい。

まとめ
- 個人情報保護法(2017年施行)で新設されたマスキング(匿名加工)情報の利活用数は2017年度末で約300社だったのに対し2020年3月は約500社となっている。
- 業界別に見ると小売業、保健福祉業の順で多く、小売業では調剤薬局・ドラッグストア、保険福祉業だと健康保険組合での利活用が多い。
- マスキング情報は加工に手間がかかり高度にマスキングすると情報の欠損によって詳細に分析ができないなど多くの課題がある
- 課題はあるものの医療分野を中心にマスキング情報の利活用は進んでおり、新設時の目的であったビッグデータの利活用推進は達成しているといえるだろう
参考文献
パーソナルデータの適正な利活用の在り方に関する実態調査(令和元年度)報告書
匿名加工情報や仮名加工情報を使うには?JR東日本の「駅カルテ」が実現したデータ販売を解説
匿名化対応医療画像エクスポートソフトMitySafetyExporter
AimeMasking : データ匿名化・データマスキングツール アイメマスキング
ナウキャスト、ビックデータ分析の前処理工程をワンストップで支援するソリューション「DataPrep(データプレップ)」を提供開始