本書はまず、著者である網野氏が携わったビッグデータ活用プロジェクト事例の面白いエピソードから幕を開ける。
ビッグデータを活用したあるプロジェクトで、ビッグなボリュームのデータではなく、リトルなデータで事業の高度化に有効な活用方法が創出された。これは投資額も抑えられ効果も得られる、ビジネス的に捉えれば「めでたしめでたし」となるハッピーエンドに違いない。
しかし、そのプロジェクトのクライアント側担当者は、「情報システム担当役員(CIO)からはビッグデータ活用のプロジェクトを行えと言われた。それなのに、ビッグデータと言えない程度のデータでは上司に説明がつかない」と言うのだ。
つまり、その担当者が求めているのは、「ビッグなデータを活用した美談や自慢話」であり、本来求められるはずの「経営上の効果」ではないのである。
この事例を読み、私はいかにもコンサルティングの現場でありがちな、担当者の経営的視点の欠如であると感じた。このケースではクライアント内部での政治的な事情がそう言わせているのであろう。ビッグデータ活用は手段であるべきなのに、目的になってしまっている現状をよく表している。
ビッグデータはどのように活用すべきなのか。本書にはその活用例や方法がふんだんに盛り込まれている。
企業を取り巻くデータは3つの切り口で整理することができる。
①定型データ、非定型データ:定型データは「構造化データ」とも呼ばれ、商品名、商品番号、単価、数量等のデータベースに登録されているレコードデータである。一方で、非定型データは「非構造化データ」とも呼ばれ、文書ファイル、eメール、PDFファイル、画像、動画、音声などが該当する。
②社内のデータ、社外のデータ:社内のデータは業務に伴い発生する、クレーム情報や営業日報等の日常で蓄積されるものであり、社外のデータはマーケットリサーチデータや経済データ、政府・自治体のデータが伝統的なもので、更にTwitterやFacebookなどのソーシャルメディアも含まれる。
③マスタデータ、トランザクションデータ:マスタデータは製品や顧客や会計など多くのデータベースで共通の、基本的な情報となる固定的なデータであり、「商品マスタ」「顧客マスタ」「社員マスタ」などが含まれる。一方で、トランザクションデータは伝票だと捉えればよく、「取引明細」などが該当する。
そのようなデータの中で、IBMによればビッグデータと呼ばれるものは4つの特徴があるという。
(1)容量(Volume)
数テラバイトから数ペタバイトにも及ぶデータ量の巨大さが特徴。
(2)種類(Variety)
構造化データだけでなく、テキスト、音声、ビデオ、クリックストリーム、ログファイル等の様々な非構造データの存在に注目すべきである。
3,400冊以上の要約が楽しめる