19
データガバナンスとプライバシーのコンプライアンス: Talendを活用してGDPRのコンプライアンスを 実現するための実践的な16のステップ 著者:Sunil Soares、 Jean-Michel Franco 2017年7月8日 ホワイトペーパー

著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

  • Upload
    others

  • View
    3

  • Download
    0

Embed Size (px)

Citation preview

Page 1: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

データガバナンスとプライバシーのコンプライアンス:Talendを活用してGDPRのコンプライアンスを実現するための実践的な16のステップ著者:Sunil Soares、Jean-Michel Franco

2017年7月8日

ホワイトペーパー

Page 2: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

www.talend.com 1

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。 GDPRは2年間の移行期間を経て、2018年5月25日に適用が開始されます。 GDPRは、顧客、従業員、見込み客を含む全てのデータ主体の個人データの取り扱いに適用されます。 個人データとは、「識別された、または識別可能な自然人(「データ主体」)に関連するあらゆる情報を意味します。識別可能な自然人とは、特に、氏名、識別番号、位置データ、オンライン識別子等の識別子、またはその人物に関する物理的、生理的、遺伝子的、精神的、経済的、文化的あるいは社会的アイデンティティに固有の1つ以上の要素を参照することによって、直接的または間接的に識別可能な人物です」。 典型的な例としては、CRM内の顧客名や連絡先、従業員の給与、福利厚生、パフォーマンスデータ等があります。その他、車の所在位置や運転者の行動を示す可能性があるセンサーデータ等、新しいデータタイプも適用対象となります。

この規則はEUのデータ主体に適用されます。米国、アジア太平洋、中東、アフリカ等、EU圏外の管轄区で活動する組織によってデータが取り扱われる場合も同様です。 GDPRに違反すると、多額の制裁金が科せられる可能性があります。その金額は、最大で2,000万ユーロまたは組織の全世界年間売上高の4%のいずれか高い方になります。

GDPRのコンプライアンスを実現するために重要な役割を担うのが、強力なデータガバナンスプログラムです。 データ所有、メタデータ管理、データ品質管理、モデルガバナンスの従来のデータガバナンス分野は、GDPRのコンプライアンスにも適用されます。 さらに、文書化された法的ガイドラインによる定義だけでなく実際に検証可能な方法で、ステークホルダー間のデータ保護のアカウンタビリティを促進するため、データプレパレーションとデータスチュワードシップに関連するセルフサービス分野をGDPRのコンプライアンスに組み込む必要があります。

アプローチの概要

図1は、GDPRのコンプライアンスをサポートするデータガバナンスプログラムを運用化するための16のステップを示しています。

図1:GDPRのデータガバナンスを運用化するためのエンドツーエンドのアプローチ。

16. GDPRのコントロールへの

コンプライアンスを強制する15. データ共有同意の

セットアップ14. 情報のライフサイクルを

管理する13. エンドユーザー

コンピューティングを管理する

12. 分析モデルを管理する11. データ系列を提供する10. データ品質を向上する9. ベンダーリスクアセスメントを実施する

8. データ保護影響評価を実施する

7. データマスキング基準を確立する

6. 許容可能な使用基準を定義する

5. データ収集基準を確立する

4. 重要データセットと重要データ要素を識別する3. データ所有者を確認する2. データ分類を作成する1. ポリシー、標準、

コントロ ールを開発する

Page 3: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

www.talend.com

1. データガバナンスのポリシー、標準、コントロールを開発する

データガバナンスプログラムは、GDPRのコンプライアンスをサポートするためのポリシー、基準、コントロールを確立する必要があります。 表1は、GDPRのコントロール、及び自動化とトレースコントロールのためのTalendコンポーネントの一覧です。

表1:GDPRのコントロールの例

GDPRの条項 GDPRの説明 GDPRのコントロール Talendツールの例

第6条 取り扱いの適法性 • 個人データの取り扱いを必要とする新しいプロジェクトの設計フェーズにおいて、法務部門とコンプライアンス部門による承認を受ける

• Talend Metadata Manager

• Talend Master Data Management(MDM)

第7条 同意の条件 • データ主体の同意を得て、その同意が得られたことの証拠を提供する

• Talend Data Quality

• Talend Big Data及び/またはTalend MDM

第9条 人種、民族的素性、政治的思想等の特別な種類の個人データの取り扱い

• 特別な種類のデータをCDEとして識別する

• プロジェクトの設計フェーズにおいて、特別な種類の個人データの使用について法務部門とコンプライアンス部門による承認を受ける

• Talend Metadata Manager

• Talend Data Quality

第11条 識別を必要としない取り扱い

• データマスキング • Talend Data Quality

• Talend Data Preparation

第30条 取り扱い活動の記録 • 企業内の機密データのデータ系列及び第三者への拡張

• Talend Metadata Manager

2

Page 4: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

www.talend.com 3

2. データ分類を作成する

データガバナンスチームは、エンタープライズデータアーキテクチャーと連携し、データをカテゴリとサブカテゴリに分類する必要があります。 これは、組織がGDPRの観点から管理する必要がある全てのデータの全体像を構築するうえで役立ちます。たとえば、データ分類では、従業員情報がレベル1のカテゴリとして含まれる場合があります(図2を参照)。 そして、給与/福利厚生、身元、連絡先、保護対象保健情報(PHI)、ソーシャルメディア、業績等、複数のレベル2カテゴリにさらに分類されます。

図2:従業員情報のデータ分類。

Talend Metadata Managerでは、ビジネス用語辞書を使用して用語集を定義し、用語をカテゴリやサブカテゴリにリンクすることもできます。 ビジネス用語辞書は、文書化された既存のデータモデルをドラッグしたり、他のソース(CSV、Microsoft Excel等)から用語や定義をインポートしたり、オブジェクト分類プロセスでユーザーインターフェイスを介してインタラクティブオーサリングを実行したりする等の方法で簡単に構築できます。 公開された用語辞書には、適切な権限を持つ全てのユーザーが検索ベースのインターフェイスを介してアクセスできます(図3を参照)。

図3:Talend Metadata Managerのビジネス用語辞書。

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

従業員

連絡先 業績ソーシャル

メディア保護対象保健情報(PHI)

身元給与/福利厚生

レベル1

レベル2

Page 5: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

www.talend.com 4

3. データ所有者を確認する

次のステップは、1つ以上のデータカテゴリ及びサブカテゴリに対して最終的に責任を負うデータ所有者を定義することです。これらのデータ所有者は、データに関する日常業務に責任を負うデータスチュワードを任命します。 データスチュワードは、重要データセットや重要データ要素(CDE)の識別とともに、データ収集、データ使用、データマスキングの標準を確立します。 Talend Metadata Managerは、データの所有者とデータスチュワードをデータカテゴリとサブカテゴリに分類し、関連するロールとワークフローを割り当てることもできます。

たとえば、Talend Metadata Managerは、「顧客」、「顧客アイデンティティ」、「顧客請求書」、「顧客連絡先」、「顧客出荷先情報」のデータ所有者を分類できます。 Talend Data Stewardshipにより、これらのデータ所有者とデータスチュワードは、ワークフロー内で安全で監査可能なロールベースのアクセス制御を使用して、データ仲裁、エラー解決、データ標準の承認等のセルフサービス型プロセスを運用できます(図4を参照)。

図4:Talend Data Stewardshipで、協力的仲裁、エラー解決、マージ/グルーピングキャンペーンのロールを割り当てる。

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

Page 6: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

www.talend.com 5

4. 重要データセットと重要データ要素を識別する

16のステップから成るこの徹底的なプロセスは、データガバナンスが非常に厳格な活動であることを示しています。データスチュワードは、それぞれが使用するデータカテゴリで重要データセットとCDEを識別することによって、取り組みを優先付けする必要があります。 前述の例で、従業員の身元は、氏名、性別、生年月日、国民識別番号を含む多くのCDEで構成されています。 従業員のソーシャルメディア情報は、Facebook®、Twitter®、LinkedIn®等の多数の重要データセットで構成されています(図2を参照)。

データガバナンスチームは、データ収集とデータ使用の基準が個別のCDEではなく重要データセットのレベルで設定されることが適切であるかどうかを判断する必要があります。 たとえば、Facebook ID(CDE)ではなく全体的なFacebook情報(重要データセット)について、許容される使用基準やセキュリティ基準を管理する方が適している場合があります。

Talend Metadata Managerは、個人データ関連のビジネス用語を含むISO 11179のビジネス用語辞書をサポートしています。前述の例をさらに使用する場合、Talend Metadata Managerには、「氏名」、「電子メールアドレス」、「電話番号」等、顧客アイデンティティのビジネス用語のインベントリを含むことができます。 さらにTalend Metadata Managerは、企業全体のソースシステムの物理フィールドへの、これらの個人データ要素のマッピングもサポートしています。 物理フィールドはテクニカルメタデータに基づいています。テクニカルメタデータは、Talend Metadata Managerのさまざまなコネクターによりソースシステムから収集されます(図5を参照)。 GPSナビゲーションシステムが交通状況の変化をドライバーに警告するのと同様に、Talend Metadata Managerの広範なコネクターは正確なデータ環境を常に提供します。

図5:Talend Metadata Managerを使用した、データモデルとデータ要素の定義、あるいはレトロエンジニアリング

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

Page 7: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

www.talend.com 6

5. データ収集基準を確立する

GDPRの第25条は、データ保護バイデザイン及びデータ保護バイデフォルトを規定しています。 この規制により、管理者(個人データの取り扱いの目的及び手段を決定する実体)は、デフォルトで特定の取り扱い目的ごとに必要な個人データのみ取り扱われるように保証するための、データの最小化等の適切な技術的・組織的措置を実施する必要があります。 この義務は、収集された個人データの量、取り扱いの範囲、保存期間、アクセス可能性に適用されます。 データガバナンスチームは、新しいプロジェクトのデータ収集について設計フェーズで法務部門とコンプライアンス部門が承認するためのコントロールを確立する必要があります。 たとえば、ソフトウェア企業が、オンラインフォームを使用して、ユーザーに試用版ソフトウェアのダウンロードを許可する場合を例にあげます。 このような場合に、フォームに申請者の氏名と電子メールアドレスの入力を要求することは合理的です。しかし、申請者の生年月日や国民識別番号を要求することは不適切です。

Talend MDM、Talend Big Data、Talend Data Qualityは、個人データと同意を含む、データ主体に関連する全ての情報が調整されるGDPRデータレイクの作成をサポートしています。 たとえば、これらのツールを使用することで、「James Smith」と「Jim Smith」の前者だけが電子メールのオプトインを提供している場合でも、これらが実際には同一人物ものであることが分かります。GDPRデータレイクは、電子メールキャンペーン、Cookieの同意、電話契約等、全ての同意の単一インベントリも管理できます。 このリポジトリは、企業内の全てのアプリケーションにわたって、単一のデータ主体に関する全ての同意のリストを保持します。 これは、特定アプリケーションの特定データ主体について、同意を得た方法と時間の監査証跡と記録レベルの系列を提供します。 全ての情報がGDPRデータレイクで調整されると、データガバナンスチームはデータポータビリティや忘れられる権利等のサービスを提供できます。

必須ではありませんが、中央で設計・管理されるシステムだけでなく、あらゆる場所でデータが発生するビッグデータ時代においては、データレイクの概念をGDPRに適用するケースがあります。 これらの環境では、受け取るデータが完全に構造化・文書化されていないことがあります。 そのような場合、これらの生データセットから個人データのフットプリントをキャプチャーし、続いて、機械学習モデル用にデータを使用するデータサイエンティスト等のデータ専門家からデータを保護するために、ルールをクラウドソーシングする必要があります。

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

Page 8: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

www.talend.com 7

6. 許容可能な使用基準を定義する

GDPRの第6条は、個人データの取り扱いの適法性を規定しています。 データ主体が同意した場合、契約の履行または法的義務のために取り扱いが必要な場合、データ主体または他の自然人の重大な利益を保護するために取り扱いが必要な場合を含む、特定の状況においてのみ、取り扱いが適法とされます。 データガバナンスチームは、個人データの使用を必要とする新しいプロジェクトが設計フェーズで法務部門とコンプライアンス部門による承認を受けることを確実にするためのコントロールを確立する必要があります。

GDPRの第7条第1項は、データ主体が自己の個人データの取り扱いに同意したことを、管理者が証明できなければならないと規定しています。 データガバナンスチームは、企業の同意リポジトリを確立するために、IT部門、法務部門、コンプライアンス部門と連携する必要があります。 企業の同意リポジトリには、データ主体からの同意の不変な記録が含まれていなければなりません。 たとえば、リポジトリは、会社が開設したWebサイトのユーザーからのWeb Cookieの使用に対する同意の記録を含むことができます。 前述のように、Talend MDM、Talend Big Data、Talend Data Qualityに基づくGDPRデータレイクは、データ主体による全ての同意のカタログとして使用できます。

図6に示すように、Talendジョブは、第三者システムからオプトインデータを回収し、Talend MDMを使用して同意情報を必要とする全てのアプリケーションに公開するために使用されます。 このジョブはまた、Talend Data Qualityを活用して、アウトソーシングされたシステムと中央管理されたGDPRカタログ間のデータを調整し、確率のしきい値に基づいて重複のマッチングを実行します。 このデータパイプラインは完全に自動化されており、また共同作業で運用できるので、ビジネスユーザーはTalend Data Preparationを使用してデータ管理の定義に参加したり、Talend Data Stewardshipを使用してデータ認定やキュレーションのプロセスに参加したりできます。

図6: Talendジョブは、統一されたビジュアル環境でデータ品質、データスチュワードシップ、ビッグデータ統合を組み合わせて、個人データを収集、標準化、調整、認定、保護、伝播する。

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

Page 9: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

Talend Metadata Managerは、個人データ要素の許容可能な使用基準のカタログとしても機能できます。 たとえば、「食事の好み」という属性に「ハラル」のような新しい値がビッグデータ環境に追加される場合、Talendのワークフローを使用して正当な承認を得ることができます。このフィールドは、データ主体の所属宗教を判断するために使用される可能性があり、これについてはGDPRの第9条で明示的に規定されているためです。

Talend MDMはオプトインを含むマスターデータ更新のログを保持します。 図7で、ログは6月14日に顧客「Pierre Flores」に同意が加えられたことを示していますが、この記録を掘り下げると記録の完全な系列が提供され、Webサイトがオプトインを収集したアプリケーションであるという事実が示されます。

図7:Talend MDMは、取り消し/やり直し機能を備え、記録レベルの系列を提供するので、データ主体に関連するオプトイン等のデータの監査証跡が得られる。

www.talend.com 8

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

Page 10: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

www.talend.com 9

7. データマスキング基準を確立する

GDPRの前文第26項は、データ保護の原則が、識別された、または識別可能な自然人に関するあらゆる情報に適用されるべきであると述べられています。 したがって、匿名の情報(すなわち、識別された、または識別可能な自然人に関連しない情報)、あるいはデータ主体が識別可能でないか、もはや識別可能でない方法で匿名にされた個人データに対しては、データ保護の原則は適用されるべきではありません。

GDPRの第11条は、識別を必要としない取り扱いを規定しています。 管理者が個人データを取り扱う目的が、管理者によるデータ主体の識別を必要としないか、もはや必要としない場合、GDPRが定める管理者の義務は大幅に最小化されます。

GDPRの第32条は、取り扱いの保護を規定しています。 技術的現状、実施の費用、取扱いの性質、範囲、文脈及び目的、ならびに自然人の権利と自由に対する多様な可能性及び重大性のリスクを考慮し、管理者と取扱者(管理者に代わって個人データを取り扱う実体)は、保護レベルをリスクに見合ったものにするため、適切な技術的・組織的措置を実施する必要があります。

データガバナンスオフィスは、機密の個人データを適切にマスクまたは暗号化するためのコントロールを確立する必要があります。 データマスキング標準は、複数のフィールドを結合してもデータを再構築できないように保証する必要があります。たとえば、データサイエンティストは、データ分析の前に従業員名フィールドをマスクするように要求できます。 それでも、役職、報酬、性別がわかる場合(たとえば「人事部長の女性であり、基本給与が20万ドル」)、その従業員を特定できる可能性は大きいでしょう。 このような状況では、役職をマスクして「10万ドル以上」等の給与範囲を提供する方が適切である可能性があります。

Talend Data Qualityを使用すると、データパイプラインの任意のステップでデータマスキングとデータシャッフルを実行できます(図8を参照)。 データシャッフルはデータマスキングの一種であり、列(または、列のグループやパーティションのような複雑なデータセット)が無作為にシャッフルされて身元が隠されますが、関連する値はそのまま残ります。 このようにして、プライバシーが維持される一方で、元のデータ値を使用して解析とデータテストが実施可能になります。

図8:データマスキングとシャッフルは、最も一般的な個人データに適合する事前設定またはカスタマイズされた機能により、バッチとリアルタイムのデータストリームに適用できる。

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

Page 11: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

Talend Data Preparationを使用すると、データマスキングを臨機応変に適用でき、事業部門ユーザーは機密データを保護したうえで同僚と共有できます。 マーケティングキャンペーンマネージャーが、パートナーとのキャンペーンの成功を報告する場合の例を考えてみましょう。 このマネージャーは、プライバシーに関連する情報を不適切に明らかにする可能性のあるデータを匿名化してから、分析のためにデータセットを共有できます(図9)。

図9:Talend Data Preparationでのビジネスユーザー向けのセルフサービス型データマスキング。

www.talend.com 10

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

Page 12: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

www.talend.com 11

8. データ保護影響評価を実施する

GDPRの第35条は、データ保護影響評価について規定しています。 このような評価は、データの新しい種類または人種や民族的素性等の特別な種類のデータがある場合に必要とされることがあります。 データガバナンスは、GDPRの規定に応じてデータ保護影響評価を実施するようにコントロールを確立する必要があります。 たとえば、小売業者がモール内のキオスクで顔認識ソフトウェアを使用したい場合、これを活用して、買い物客の性別や年齢層に合わせて広告をカスタマイズできます。 データ保護影響評価で、小売業者は、広告の表示後1分以内に全ての情報を削除し、このデータをソーシャルメディアプロファイルと組み合わせないように求められる場合があります。

Talend Data QualityとTalend Metadata Managerは、高度に自動化された方法で新しいデータセットと関連するセマンティクスのキャプチャー、発見、プロファイリングを実行し、続いてこれらのコントロールルールを大規模に適用できます。 その結果、これらのツールは、あらゆる情報システムのデータ保護影響評価において積極的な役割を果たす可能性があります。 たとえば、企業が、接続されたデバイスから膨大なデータを取り込んでいるデータレイクについて、データ保護影響評価を実施したい場合を考えてみましょう。 Talend Data Qualityは、データレイクへの取り込み前にマスクする必要がある個人情報をデータセット内で発見することによって、データ保護影響評価をサポートできます。

9. ベンダーリスクアセスメントを実施する

GDPRの第28条第1項は、第三者となる情報取扱者の義務を規定しています。 管理者の代わりに取り扱いを実行する場合、管理者は、GDPRの要件を満たす適切な技術的・組織的措置を実施するための十分な保証を提供する取扱者のみを使用する必要があります。 第28条第2項はさらに、事前に管理者からの特定の、または一般的な書面による許可を得ずに、取扱者が他の取扱者を従事させてはならないことを規定しています。 データガバナンスチームは、個人データをベンダーと共有する前に、ベンダーリスクアセスメントについて法務部門とコンプライアンス部門が必ず承認することを確認する必要があります。 ベンダーが下流の取扱者と個人データを共有する場合、下流の取扱者のベンダーリスクアセスメントについて法務部門とコンプライアンス部門が承認する必要があります。

ステップ8と同様に、Talendのテクノロジーは、データがベンダーから収集されたり、ベンダーと共有されたりする状況で、ベンダーリスクアセスメントをサポートできます。 Talendのツールは、評価フェーズだけでなく、日常的なデータ交換に関連するGDPRのコントロールを自動的に適用します。 Talend Data Qualityはデータ統合フロー内にコントロールを埋め込むことができ、またTalend Data Stewardshipはデータスチュワードシップの責任をベンダーに移転できます。

10. データ品質を向上する

GDPRは、データ品質に関連する特定のユースケースについて規定しています。 GDPRの第16条は、企業が不当な遅延なく、不正確な個人情報を訂正し、不完全な個人データを完全にする必要があることを規定しています。 データガバナンスチームは、顧客、従業員等のデータ主体が、自己の個人情報に関連するあらゆるデータ品質の問題をすみやかに解決できるようにするためのコントロールを確立する必要があります。 顧客や従業員のデータは組織内の多くの場所やシステムに断片化されていることがあるため、データ調整も重要です。 GDPRは、要求に応じてデータ主体に公開できる一貫した完全なビューに、この情報を調整する必要があると規定しています。

Talend Data Qualityは、適切な場所(オンプレミスのHadoopクラスター、またはクラウド)及び適切なタイミング(保存データまたはストリーミングデータ)により、データ品質管理とデータ匿名化を実行するためのネイティブコードを生成します(図10を参照)。 また、複数のシステムにわたってデータセットを調整または接続するための高度な重複排除機能とマッチング機能も提供します。

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

Page 13: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

   図10:Talend Data Qualityは、パターン、辞書またはオントロジーに基づいて、個人データと新しいデータソースのマッチングを自動的に実行し、         強調表示されたデータにタグを追加したりルールを適用したりできる。

組織は、データ保護担当役員からデータスチュワードまたはビジネスユーザーへの権限の委任もサポートすべきです。 たとえば、セールスエンジニアは、自己の担当アカウントの連絡先データを常に最新の状態に保つために最も適していると考えられます。 キャンペーンマネージャーは、マーケティングデータベース内で同意のメカニズムが導入されていることを確認すべきでしょう。 組織内の全員がデータ使用のコンプライアンスに従って管理できるように保証するには、Talend Data PreparationやTalend Data Stewardship等、ワークフローベースのセルフサービス型アプリケーションを各部門に提供する必要があります。これによって、データを危険にさらすことなく各部門の自律性を高めることができます(図11を参照)。

図11:Talend Data Stewardshipは、スチュワードシップワークフローのオーケストレーション、及び組織内のあらゆるユーザーへの活動の委任を可能にする。

www.talend.com 12

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

Page 14: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

www.talend.com 13

11. データ系列を提供する

GDPRの第30条は、組織が取り扱い活動の記録を保持する必要があることを規定しています。 この記録には、個人データのカテゴリの説明、個人データの取得者のカテゴリ(第三国または国際機関の取得者を含む)、及び第三国または国際機関への個人データの移転が含まれている必要があります。 記録保持要件は、組織に代わってデータを取り扱う、いわゆる取扱者にも及びます。 この条項に従うために、データガバナンスチームはメタデータ管理とデータ系列機能を強化する必要があります。

Talend Metadata Managerは、ビジネスインテリジェンス、Hadoop、NoSQL、ETL等、複数のプラットフォームにわたるデータ系列をサポートします(図12を参照)。 Talend Big Data PlatformはApache AtlasとCloudera Navigatorにも統合され、データレイク内でのデータフローの系列を提供します。

図12:Talend Metadata Managerは、オプトイン等の重要データをエンドツーエンドで表示し、データのソースとターゲットを追跡及びトレースする。

12. 分析モデルを管理する

GDPRの第22条は、プロファイリングを含む自動化された個人意思決定を規定しています。 この条項に従って、データ主体は、自己に関する法的影響または同様に著しい影響をもたらす、プロファイリングを含む自動化された取り扱いのみに基づく意思決定の対象とならない権利を有します。 企業は、自らのデータ分析モデルに対して、リスクとマーケティングの傾向を踏まえたガバナンスを確立する必要があります。

郵便番号を使用したデータ分析モデルにより、顧客にクレジットのプロモーションをしている銀行の例を考えてみましょう。マイノリティ層が多数を占める特定の郵便番号を銀行が除外した場合、郵便番号の使用によって異なる影響がもたらされる可能性があります。 データガバナンスチームは、データ分析モデルが実稼働環境にリリースされる前に、全てのモデルについて法務部門とコンプライアンス部門が承認するようにコントロールを確立する必要があります。

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

Page 15: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

これらの分析モデルは、CDEやデータ標準と同様の方法で管理する必要があります。 少なくとも、データガバナンスチームはTalend Metadata Managerを使用して、モデル名、モデル所有者、入力変数、出力変数、モデル方法論、作成日、法務部門とコンプライアンス部門による承認の証明を含むモデルインベントリを構築できます。

13. エンドユーザーコンピューティングを管理する

GDPRの第32条は、個人データの取り扱いの保護を規定しています。 組織は、通常、デスクトップまたはMicrosoft® SharePoint®リポジトリに格納できるスプレッドシートやデータベースの形式で、大量のエンドユーザーコンピューティング(EUC)アプリケーションを生成しています。 EUCは、一般的にITの管理対象外であり、多くの場合、機密の個人データを含んでいます。

Talendのツールを使用してエンドユーザーコンピューティングのコントロールを取り戻すには、2つの方法があります。 第1の方法は、個人データを扱う必要があるユーザーに対して、オフィスオートメーションツールよりも優れたオプションを提供することです。 実際にIDCの調査では、組織の従業員のうち、さまざまなスプレッドシートを使用して自由にセルフサービスのデータを準備しているユーザーの割合は約8%であり、その中で最も多いユースケース(60%)はデータ統合であることが示されています。 Talend Data Preparationは、個人データを使用する場合も含めて、ビジネスユーザーがデータプレパレーション作業を行う場合に、より効果的なアプローチを提供します。 さらに重要なのは、データソース内の個人を識別可能な属性を、ビジネスユーザーがデータに対して行ったアクションとともに自動的にキャプチャーすることによって、関連する活動を追跡及びトレースする機能です(図13)。

図13:Talend Data Preparationは、Microsoft Excelや他のオフィスアプリケーションよりも優れたセルフサービスオプションを提供し、データプレパレーション、安全なコントロールと再利用のためのビジネスユーザー活動のキャプチャーに役立つ。

第2のアプローチは、収集された自由形式テキストから個人データをキャプチャーしてから、分類やマスキング等の適切な処理を実行することです。 Talend Data Qualityは、自然言語処理機能を提供し、文書(電子メール、Microsoft Word、PDF等)内の自由形式テキスト、アプリケーション(Salesforce、Zendesk、Service Now等)、あるいはWebまたはモバイルアプリケーション(ソーシャルメディア、ディスカッションフォーラム等)でユーザーが生成したコンテンツから、潜在的な個人データを抽出してタグ付けします。 Apache Sparkを介して非常に大きな規模で処理可能な高度な機械学習を使用することで、自由形式テキストに含まれる個人データへの潜在的な参照を自動的にタグ付けし、さらなる処理を実行できます。

www.talend.com 14

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

Page 16: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

www.talend.com 15

14. 情報のライフサイクルを管理する

GDPRの第17条は、「忘れられる権利」として一般に知られている消去の権利を規定しています。 データ主体は、当初収集された目的との関連で情報がもはや必要でない場合を含む多くの状況において、企業が個人データを消去するよう要求できます。

データガバナンスチームは、データ主体がデータの消去を要求できるようにするメカニズムを確立する必要があります。さらに、そのような要求がすみやかに審査・対処されるように運用コントロールを確立しなければなりません。 組織は、Talend Data Servicesを介して実現されるGDPRサービスをWebサイトで提供できます。 より一般的には、Talend Data Servicesは、アクセス権(第15条)、訂正権(第16条)、忘れられる権利(第17条)を含む、データ主体の権利に対応するためのデータアクセスポイントを公開できます。 Talend Data Integration(図14を参照)により、データを自動的かつ安全に抽出し、データポータビリティを満たすために機械可読フォーマットに処理できます(第20条)。

図14:Talend Data Integrationでデータポータビリティの権利を守る。

Talend Metadata Managerが提供するリポジトリは、組織内で個人データが置かれている場所やその取扱者をすばやく識別するうえで重要な機能を果たします。 個人データの各CDEをソースシステム内の発生場所にマッピングすることが重要です。課題は、企業が通常はさまざまな文脈で顧客と従業員を把握していることです。 たとえば、航空会社が、Twitter、乗客記録、及びマイレージプログラムのアカウント間で断片化された顧客に関する情報を持っている場合があります。 Talend Big DataとTalend MDMに組み込まれたネイティブのデータ品質機能を利用した異種データのマッチングにより、John Smithが[email protected]及び@JohnSmithと同一人物であることを把握できます。 統一されたデータフローで一度調整されると、Talend Metadata Managerはエンドツーエンドの情報サプライチェーン(図15を参照)を視覚的に示し、データガバナンスとスチュワードシップに関連する役割と責任を割り当てる基礎としてそれを使用します。

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

Page 17: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

図15:Talend Metadata Managerでコンプライアンスのためのデータインベントリを作成する。.

15. データ共有同意のセットアップ

GDPRの第28条第3項は、取扱者による取扱いは、契約あるいはEUまたは加盟国の法律(管理者に関して取扱者を拘束し、取扱いの対象事項及び期間、取扱いの性質及び目的、個人データの種類及びデータ主体の種類、管理者の義務及び権利を定める法律)に基づくその他の法的行為によって管理されるものであることを規定しています。 第28条第4項は、管理者に代わって特定の取り扱い活動を実行するために、取扱者が他の取扱者を従事させる場合にも、同じデータ保護義務が適用されることを規定しています。 これらの法的義務は、データ共有同意の形でカプセル化できます。

データガバナンスチームは、EU内からEU外へ、EU内の組織からベンダーへ、及びベンダーから下流の取扱者への個人データの移動に先立って、データ共有合意について法務及びコンプライアンスチームが必ず承認することを確認する必要があります。これらのデータ共有同意は、Talend Metadata Manager内でセマンティクスによりキャプチャーできます。

www.talend.com 16

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

Page 18: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

www.talend.com 17

16. GDPRのコントロールへのコンプライアンスを強制する

GDPRのコントロールは、規制コンプライアンスを支える全体的枠組みの重要な役目を果たします。 ステップ1では、データガバナンスチームがGDPRのコントロールの枠組みを確立しました。 これらのコントロールは、同意と取り扱い活動の記録に関連する場合があります。 次に、データガバナンスの枠組み内で対処されるさまざまなトピックと、関連するコントロールと監査証跡の実施方法について、より詳細なレベルで説明しました。

この最終ステップでは、これらのコントロールを実際に運用し、データ環境や規制の変化に応じて継続的に維持していきます。これらのコントロールを実施するために、データガバナンスチームは法務部門、プライバシー部門、コンプライアンス部門と連携して、チームとしての取り組みを編成する必要があります。

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

Page 19: 著者:Sunil Soares、Jean-Michel Franco 2017年7月8日.... 1. 欧州連合(EU)一般データ保護規制による データガバナンスのコンプライアンス. 欧州連合(EU)は、2016年5月に一般データ保護規則(GDPR)を公表しました。

まとめ

EU GDPRは、2018年5月25日に適用が開始されます。 GDPRは、顧客、従業員、見込み客を含む、EUの全てのデータ主体の個人データの取り扱いに適用されます。 このホワイトペーパーでは、Talendのプラットフォーム上においてGDPRのコンプライアンスのためのデータガバナンスをサポートする、データガバナンスプログラムを運用化するための16のステップについて検討しています。

組織が既存のデータガバナンスツールを再利用してGDPRのコンプライアンスをサポートするためには、法務、コンプライアンス、プライバシー、及びエンタープライズデータ管理のチーム間で連携を推進する必要があります。 特に、組織はGDPRに対応するために「個人データ」の要素を定義し、これらの属性をメタデータリポジトリでアプリケーションにマッピングする必要があります。

GDPRは、複数の管轄区にわたって適用されるデータ主権規制の最も一般的な例です。 データ主権規制には、オーストラリアのプライバシー法、カナダのスパム対策法、中国のサイバーセキュリティー法、ロシアの個人データローカライゼーション法等があります。 このホワイトペーパーで説明したデータガバナンスのベストプラクティスは、これらの規制へのコンプライアンスにも対応するものです。

著者紹介

Sunil Soaresは、Information Asset社の創業者であり、マネージングパートナーを務めています。 また、複数のチーフデータオフィサーの顧問でもあります。 Soaresは、『Selling Information Governance to the Business』、『Big Data Governance』、『Data Governance Tools』、『The Chief Data Officer Handbook for Data Governance』、『Data Governance Compliance for BCBS 239 and DFAST』、『Data Sovereignty and Enterprise Data Management: Extending Beyond the European Union General Data Protection Regulation』を含む著作を発表しています。 現在の役職に就く前は、IBM社の情報ガバナンス担当ディレクターを務めました。

Jean-Michel Francoは、Talendのプロダクトマーケティング担当シニアディレクターとして、企業の革新的データ管理の開発と導入拡大に尽力しています。 HP社でキャリアをスタートさせたFrancoは、同社でビジネスインテリジェンスプラクティスの構築と開発に携わった後、SAP社のマーケティングソリューション担当ディレクター及びBusiness & Decision社のイノベーションディレクターを歴任しました。 これまでに4冊の著作を発表しており、また定期的に記事を発表するとともにイベントやトレードショーでプレゼンテーションを行っています(Twitterアカウント:@jmichel_franco)。

Information Asset社及びTalendについて

Information Asset社は、データガバナンスとエンタープライズデータ管理に注力するサービス企業です。詳細は、www.information-asset.comをご覧ください。

Talendは、クラウド及びビッグデータ統合ソフトウェアの世界的リーダーであり、データを戦略的資産に変える支援を提供しています。これによって、企業は顧客、パートナー、業務に関する組織全体のリアルタイムの知見を獲得できます。Talendは、オープンで順応性の高い統一された統合プラットフォームにより、企業が進化し続ける現代のビジネスのニーズに対応するために必要なデータの俊敏性を実現します。詳細は、www.talend.comをご覧ください。

Copyright© 2017 Information Asset, LLC, and Talend, Inc. All rights reserved.本資料は、Information Asset, LLC及びTalend, Inc.の明示的な事前の書面による許可なく、複製、表示、改変、または配布することはできません。

ここに記載されている製品名または会社名は、それぞれの所有者の商標です。

本レポートは情報提供のみを目的としており、商品性、特定の目的への適合性、提案、仕様、サンプル等から生じるいかなる保証も含め、いかなる保証もなく「現状有姿」で提供されています。

www.talend.com 18

欧州連合(EU)一般データ保護規制によるデータガバナンスのコンプライアンス

ctoumeyragues
Typewritten Text
WP234-JP