近年、私たちが生み出すデータは膨大な量となっている。通話・通信記録、交友関係、位置情報、購入履歴、監視カメラに映る映像など、個人の生活に関する情報は常に記録されている。
それを可能にしたのは、インターネット・オブ・シングス(lot)と呼ばれる、あらゆるものをインターネットと結びつける仕組みである。この技術はどんどん普及しており、身の回りのありとあらゆる物体がインターネットに接続され、膨大なデータが生み出される時代が到来しつつある。
2013年、国家安全保障局(NSA)の監視活動が、当時契約企業の職員だったエドワード・スノーデンによって暴露された。これにより、NSAが米国民すべての携帯電話の通話記録を収集していることが明らかになった。
NSAは、収集したデータはあくまで「メタデータ」に過ぎないと主張した。通話の内容を記録しているわけではなく、双方の電話番号や通話の日時、時間数を記録しているだけだというのである。しかしたとえば、ある人物が心臓専門医や薬局と長時間通話していることがわかったら、その人物が心臓病であることは容易に推し量れてしまうだろう。
またNSAは、ネット検索の履歴もメタデータだと主張しているが、これもプライベートを浮き彫りにする情報である。2010年、グーグルのCEOを務めていたエリック・シュミットは、「私たちは、あなたがいまどこにいるかを知っている。これまでどこにいたかも知っている。いまなにを考えているかもだいたい知っている」と述べた。このように、不特定多数の情報を集める際には、コンテンツよりもメタデータのほうが有益に働くのである。
監視のために莫大な手間とコストがかかっていた時代では、監視をおこなうケースは限られており、集めたデータも一定の期間が過ぎたら消去されていた。しかし近年、コンピューターテクノロジーのコストは大きく下落している。これにより、一般市民が情報にアクセスしたり、意見を表明したりすることが簡単になった一方で、国家や企業による監視のコストも小さくなってしまった。
あるオーストリア人の法学生がフェイスブックに対し、自分に関して保存しているデータの開示要求をおこなったときのことだ。フェイスブックは、法学生の交友関係やフィードに流れてくる内容だけでなく、閲覧した広告すべての情報を提出してきたという。
データの収集と保管が低コストでおこなえるようになると、何を残し何を消すかを判断するよりも、すべて保存するほうが楽だ。そのため、あらゆる情報が取捨選択されることなく保存されるようになるのである。
こうした監視は、常に自動的におこなわれる。友人がフェイスブックを利用していれば、彼/彼女と関わりをもつことで情報が筒抜けになるし、グーグル検索を利用しなくても、訪問したサイトに「グーグル・アナリティクス」が埋め込まれていれば、閲覧したことが記録されてしまう。生活を記録しようとする人が増えれば、自分自身で記録をとっていなくても痕跡が残りやすくなる。たとえ監視から逃れようと最大限の努力を払っても、効果は薄いだろう。
あらゆるデータを集めて保存し、そこから価値ある情報を取り出すやり方をデータマイニングと呼ぶ。これにより、蓄積されたビッグデータから、本来の収集目的とは異なる副次的な情報が入手できるようになった。
データマイニングを用いれば、フェイスブックの「いいね!」ボタンから、ユーザーの性格や性的指向などを推測することも可能だ。
3,400冊以上の要約が楽しめる