データ分析の準備の際に必要なツールとして、メッセージボード、データツリー、スケジュールがある。
データ分析には「目的」があり、分析結果をどういったアクションにつなげていくかを明確化する必要がある。そのために用いるのが「メッセージボード」だ。
メッセージボードには、(1)誰に対し、(2)何の目的で、(3)何を行うのか、(4)(3)の具体的内容、(5)最初の一歩、の5項目があり、各項目を埋めていく作業となる。
(1)と(2)に関しては、対象者や目的が少しでも変わると分析方法は変わるため、前提を正しく認識した上で分析作業に取り掛かることが大切だ。対象が判然としない場合は大前提の方向性だけでも示し、多少のズレは作業途中で方向修正していくとよい。
(3)から(5)に関しては、仮説立案でも構わない。まずは一つの方向性を示した上で、分析結果から検証し正誤判断していけばよい。
(1)の「誰」をより具体化するために、プロファイリングシートを活用する方法もある。これは対象者について様々な視点から特徴を明確化するものであるため、的を絞ったデータ分析が可能になる。
次に、データツリーの作成について説明したい。これは「取り扱うべきデータの全体地図」であり、どんなデータを使ってどのように分析すべきかを図に表したものである。
同じデータ項目でも、データ分析の目的に応じ分解方法を変えることでツリー構造は変化するため、メッセージボードで明確化した内容が大変重要になる。例えば、利益のデータツリーを作成する場合、「利益=売上+コスト」と「利益=売上+利益率」どちらを選択するか、さらに、「売上」をエリアごとの合計値とするか製品ごとの合計値とするかなどでツリー構造は大きく変化する。
また、詳細なツリー作成を行うことで、データ漏れを防ぐことができる。データツリーが完成すれば、どういった性質のデータが必要か、足りないデータはどれか、といった具体的イメージが視覚化されるためだ。準備段階でデータツリーをしっかりと作り込むことが重要だ。
しかしツリー作成はあくまで分析のための土台作りであり、メッセージボードと同様、まずは仮説を立て、データ収集や分析作業の途中で積極的に作り変えていく姿勢で臨んでよい。
データツリーが完成したら、データ整理を行う。既に存在するデータを洗い出してツリーのリーフ(一番右端にある項目セル)に当てはめ、不足データが顕在化すれば最低限必要なデータ、あるいは代替可能なデータを考える。最後に、集めるべき各データの粒度(細かさの度合い)を考える。
データをその性質で分類すると定量データと定性データの2種類に分けられる。前者は数量で表されるデータ、後者は新聞記事のような数量で表されていないデータを指す。
また、「既に存在する」セカンダリーデータと「新たに集めなければならない」プライマリーデータと分類する方法もある。前者は官公庁発表の白書や公的な統計データ、後者は独自企画のアンケート結果や自社の売上が代表例である。各データのメリット・デメリットを理解し、収集時間などを考慮して最適なデータ収集を心掛けたい。
データを集める際に大切な3つのポイントがある。
3,400冊以上の要約が楽しめる