データ分析の力

因果関係に迫る思考法
未読
データ分析の力
データ分析の力
因果関係に迫る思考法
未読
データ分析の力
出版社
出版日
2017年04月20日
評点
総合
4.0
明瞭性
5.0
革新性
3.0
応用性
4.0
要約全文を読むには
会員登録・ログインが必要です
本の購入はこちら
書籍情報を見る
本の購入はこちら
おすすめポイント

情報通信革命にともない、特定の専門職に限らず、データ分析能力が必要とされる時代になった。たとえば来期の広告戦略策定にあたり、過去に打った広告と売り上げのデータを調べ、広告が売り上げに及ぼす影響を見るといった場面がそうだ。

また自分が分析するわけではない場合でも、データ分析に関する知識は必要不可欠といっていい。重要な決定が誰かのデータ分析にもとづいて行なわれる機会は、着実に増えてきている。もはや騙されないようにするには、データ分析のリテラシーを高めるしかない。

現代社会では比較的容易にデータを手に入れられるようになったが、データを分析するセンスや思考法が身についてなければ、せっかくのデータも宝の持ち腐れである。たしかにビッグデータはたくさんのデータを提供してくれるだろう。しかしデータの扱い、分析、解釈においては、人間の判断が依然として重要な役割を担っている。それはこれからも変わらない。

本書はデータ分析のもっとも基本となる「因果関係の見極め方」について、数式を使わずに具体例や図、グラフなどを用いて解説した入門書だ。データ分析のおもしろさに触れてみたいのであれば、断然オススメの一冊である。データ分析について、もっと深く勉強してみたくなることまちがいなしだ。

著者

伊藤 公一朗(いとう こういちろう)
シカゴ大学公共政策大学院ハリススクール助教授。1982年宮城県生まれ。京都大学経済学部卒、カリフォルニア大学バークレー校博士課程修了(Ph.D.)。スタンフォード大学経済政策研究所研究員、ボストン大学ビジネススクール助教授を経て、2015年より現職。全米経済研究所(NBER)研究員、経済産業研究所(RIETI)研究員を兼務。専門は環境エネルギー経済学、産業組織論、応用計量経済学。シカゴ大学では、環境政策・エネルギー政策の実証研究を行う傍ら、データ分析の理論と応用について大学院生向けの講義を行う。

本書の要点

  • 要点
    1
    「広告→売り上げ上昇」といった「因果関係」を示すことは難しい。その他の要因が結果に影響している可能性を排除できないからである。
  • 要点
    2
    ランダム化比較試験(RCT)を用いれば、ランダムに分けた「介入グループ」と「比較グループ」を比較し「平均介入効果」を求めることで、因果関係を示すことができる。
  • 要点
    3
    因果関係を求める最良の手法はRCTだ。しかし実施には資金や労力、また関係機関の協力が必要であり、ハードルが高い。
  • 要点
    4
    RCTが行なえない場合には、RDデザインやパネル・データ分析といった代替手段がある。

要約

データから因果関係を導くのはなぜ難しいのか

他の要因が影響した可能性を排除できない
Pablo_K/iStock/Thinkstock

データから因果関係を導くのは難しい。なぜなら「他の要因が影響していた可能性」を排除できないからである。

たとえばあるアイスクリーム会社で、ウェブ広告を出した2010年と出さなかった2009年の売り上げを比較し、2010年には売り上げが40%上がっていたとする。この場合「広告を出した影響により2010年の売り上げは2009年に比べて上がった」という結論を出すと、どんなまちがいをする危険性があるだろうか。

ここで問題となるのは、「広告→売り上げ上昇」という因果関係が、データ分析結果から導けるかどうかである。仮に2010年の夏が2009年の夏よりも猛暑だった場合、40%の売り上げ増は広告の影響ではなく、単に気温が高くなったために消費者がアイスクリームを求めたからと考えることもできてしまう。

相関関係≠因果関係

「広告費」と「アイスクリームの売上高」のように、2つのデータの動きに関係性があることを、統計学では「相関関係がある」という。

データさえ手元にあれば、相関関係があるかないかを導くことは容易だ。だが厄介なことに、XとYに相関関係があることがわかっても、それで因果関係があるとはいえないのである。

ビジネスや政策決定においては、因果関係を正確に見極めることが大切だ。もし過去に売り上げが伸びたのが広告の影響ではなく、気温や経済活動の変化といった他の影響だった場合、多額の費用を投じて広告を打っても、売り上げは上がらないことになる。つまり投資がまったくのムダになってしまうおそれがあるのだ。

【必読ポイント!】現実世界で実験をする

介入グループと比較グループ

因果関係によってもたらされる効果のことを「介入効果」と呼ぶ。介入効果とは、介入により影響を受けた場合と、受けなかった場合との差である。たとえば電気料金の値上げがあった場合、価格上昇が消費者の電力消費に与えた影響(=介入効果)は、価格の上昇がなかった場合との差ということになる。

介入を受ける「介入グループ」と受けない「比較グループ」に分けて実験を行ない、両者の結果を比較すれば、「平均介入効果」として測定が可能だ。ただしその際に必要となる仮定がある。それは「もしも介入が存在しなかったとしたら、介入グループの平均消費量と比較グループの平均消費量は等しくなる」ということである。残念ながらこの仮定を立証することはできない。というのも「価格変化がなかった場合」の介入グループの消費量データは、現実には存在しないためだ。

ランダムなグループ分けが重要
Nastco/iStock/Thinkstock

ただし例外的にこの仮定を立証できるケースがある。それは「ランダム化比較試験(RCT)」により、介入グループと比較グループのグループ分けを行なった場合である。

ここでカギとなるのが、消費者のグループ分けをランダム(無作為)に行なうことだ。ランダムなグループ分けの利点は、ある程度多くのサンプル数が存在すれば、2つのグループは統計的に同質の集団とみなせることである。

これはグループ分けの悪い例を考えるとわかりやすい。たとえば「電力価格の上昇を経験してみたい」と申し出てきた消費者だけを介入グループに振り分け、それ以外の消費者を比較グループに振り分けた場合はどうだろうか。電力価格の上昇を経験してみたいという消費者とそれ以外の消費者とでは、特性が異なる可能性が高い。ゆえにランダムに分けることが求められるのだ。

RCTの強みと弱み

データ分析を行なう際は、分析や結果の透明性が重要になる。分析者以外にも説得力のある説明をしなければならないからだ。統計的手法のなかには、分析方法が複雑なあまり、分析者以外への透明性が低いものも少なくない。

RCTの強みは、「介入グループと比較グループを比較して平均介入効果を示す」という、非常にシンプルな統計分析であることだ。要するに専門家でない人にも伝わりやすいのである。

もっと見る
この続きを見るには...
残り2735/4367文字

3,400冊以上の要約が楽しめる

要約公開日 2018.01.29
Copyright © 2024 Flier Inc. All rights reserved.
一緒に読まれている要約
2000社の赤字会社を黒字にした 社長のノート
2000社の赤字会社を黒字にした 社長のノート
長谷川和廣
未読
ITビッグ4の描く未来
ITビッグ4の描く未来
小久保重信
未読
インダストリーX.0
インダストリーX.0
エリック・シェイファー河野真一郎(監訳)丹波雅彦(監訳)花岡直毅(監訳)井上大剛(訳)
未読
プラットフォームの教科書
プラットフォームの教科書
根来龍之
未読
STARTUPスタートアップ
STARTUPスタートアップ
牧野洋(訳)ダイアナ・キャンダー
未読
MIND OVER MONEY
MIND OVER MONEY
クラウディア・ハモンド木尾糸己(訳)
未読
ぼくらの未来をつくる仕事
ぼくらの未来をつくる仕事
豊田剛一郎
未読
新DMの教科書
新DMの教科書
一般社団法人 日本ダイレクトメール協会
未読