本書の主人公、大島周司は国内に100店舗を抱える国産の靴メーカーの店舗マネジャーである。ここのところ不調であった売上高に不満を持った投資家が社外取締役を投入し、経営に大きくメスが入れられるという噂を耳にした大島は、どうにかして会社の経営改革を成し遂げたいと思うようになる。休日返上で自店舗や会社全体の売上データの分析を試みる大島だったが、意味ある数字を見出すことができず、「何を悩めばいいのか分からない」ことに悩んでいた。
その大島が休日のカフェで出会ったのが、一見無意味で膨大なデータを原料に意味のある情報を生成する、まるで錬金術のような分析をする大学生3人組であった。大島は彼らの行っていたような複雑な分析に会社の活路が見いだせるのではないかと感じ、彼らと会うために休日のカフェで彼らを待ち伏せるようになる。
大島がカフェで出会った大学生3人組は「データサイエンティスト」と呼ばれる人物である。素人の分析が、主観的で漠然とした勘で作った仮説に都合の良いデータを取っていくというアプローチになりがちであるのに対し、彼らデータサイエンティストの分析は入手しうる全てのデータに当たり、主観的で非科学的な視点を排除していく。たとえば、「会社の売上が落ちている」のであれば、どんな客が来ているのか、その性別差は、年齢は、職業は、来店頻度は・・・と何の仮説も持たずにひたすら表やグラフに落としこんでいく。
これは「記述統計」と呼ばれる手法で非常に時間と労力のかかる作業であるが、この作業により、元々はばらばらだったはずのデータの関係性が見えてくるようになる。全てのデータに総当りしない素人の分析やそこから導き出される施策は、勝手な仮説と経験則とだけに成り立っているものであり、本当の答えと大きく異なるものになりがちだ。
分析の結果を見ると「なんだ、当たり前のことじゃないか」と思うようなものでも、実際の数字のデータから分析のきっかけを掴むことがまず難しい。そのきっかけを見つけるために、ひたすらグラフを作ってビジュアル化して分析をする。それが「単純集計」であり「記述統計」である。たとえ経営改革に役立つ様々なデータがあったとしても、ビジュアル化されていないとなかなか実感が湧かず、発見もない。実際、企業が経営資料として持っているデータでも、ビジュアル化されていないがゆえに理解されず、活用されていない場合も多い。
3,400冊以上の要約が楽しめる