TOPセキュリティ > ビッグデータの匿名性、非識別化はどこまで可能か(中)

セキュリティ

ビッグデータの匿名性、非識別化はどこまで可能か(中)

2015/04/22

Taylor Armerding CSO

 現在のデジタル世界で言う「匿名性」とは、どの程度の匿名性なのだろうか。一般大衆が生成した膨大なデータを、マーケティング関連企業、Webサイト、警察機関、研究機関、政府機関など、あらゆる組織が吸い上げる時に、その匿名性はどの程度確保されているのだろうか。

前回から続く)

 米プライバシー擁護団体Center for Democracy and Technologyのチーフテクノロジストを務めるJoseph Lorenzo Hall氏も同意見だ。厳密な非識別化は明らかに有効ではあるが、実際のデータ収集の世界は、その理想を常に満たしているわけではないと同氏は話す。その理由の1つとして同氏が挙げるのは、完全無欠の非識別化を施すと、データの有用性が大きく下がるという点だ。

 「こうしたデータセットの再識別化を可能にする基本的な特徴は、同じ人による行動を記録した複数のレコードが互いに紐付けられていることだ。この点は、こうした記録を残すことのメリットとして大きな部分を占めている」

 「大きな問題は、匿名化が不十分なデータセットを公開したり、個人情報を含んでいないと当人たちが思っているデータセットを企業間で共有したりすることだ。実際には、そうしたデータには、個人と簡単に紐付けられる何らかの永続的な要素が間違いなく含まれている」

↑ページ先頭へ