この1冊ですべてわかる

データサイエンスの基本

未読
データサイエンスの基本
この1冊ですべてわかる
データサイエンスの基本
未読
データサイエンスの基本
出版社
日本実業出版社

出版社ページへ

出版日
2024年09月01日
評点
総合
3.7
明瞭性
3.5
革新性
3.5
応用性
4.0
要約全文を読むには
会員登録・ログインが必要です
本の購入はこちら
書籍情報を見る
本の購入はこちら
おすすめポイント

根拠を示せと上司に詰められて、四苦八苦してしまう。なんとなくで考えて、なんとなくの「答え」を出してやり過ごすこともひとつの能力だが、それだけではいずれ壁にぶつかるだろう。何かへと導きそうなデータは世の中にたくさんあふれている。しかし、そこから情報を引き出せる力が不足している。

そこで大企業もこぞって求めているのが、データサイエンスの知識だ。本書の編著者である滋賀大学データサイエンス学部は、日本初のデータサイエンス専門学部であり、重点教育の拠点校である。

データを扱うには統計の知識が必須だが、細かな計算はコンピュータでカバーできる。データが示していることを理解し、適切に説明できることのほうが大切だ。解釈によっては完全に誤った方向に進んでしまうこともある。だからこそ、データサイエンティストの役割が重視されているのだ。

コンビニで売っている多種多彩なお茶について、味の違いはどれだけ売り上げに影響しているか。なぜあの観光地にはあんなに人が集まるのか。データサイエンスによる「答え」の導出プロセスは、ほかのさまざまな商品、サービスにも応用可能だ。「なんとなくこのブランドが好き」という曖昧な感覚に、説得力をもって応えられる。人びとの「好き」を刺激するヒントが詰まっている。

データに悩まされているすべてのビジネスパーソンに、本書でデータサイエンスの一端に触れていただきたい。

著者

滋賀大学データサイエンス学部(しがだいがく でーたさいえんすがくぶ)
2017年4月に日本初のデータサイエンス学部として開設。文部科学省より「数理及びデータサイエンスに係わる教育強化」の拠点校6校(滋賀大学、北海道大学、東京大学、京都大学、大阪大学、九州大学)の一つとして選定される。企業や地方自治体との連携に積極的で、共同研究や学術指導等の連携実績は200を超える。2019年4月に修士課程を開設し、企業派遣の学生を毎年20名近く受け入れるなど、社会人のリスキリングにも積極的に取り組むその動向は注目されている。

本書の要点

  • 要点
    1
    データサイエンスは、データに基づく知見を人間・組織の意思決定に活用していく科学である。
  • 要点
    2
    オープンデータの集計データによってまず仮説を構築し、より精緻な分析が必要となった段階で個票データの収集に取り組もう。
  • 要点
    3
    重回帰分析によって、「ある説明変数の効果を、他の説明変数の効果を除去した上で導き出せる」。
  • 要点
    4
    統計的仮説検定は、データの背後に確率分布と呼ばれる何らかの仕組みを想定し、手元のデータが得られる確率から結論を導く手法である。

要約

【必読ポイント!】 データサイエンスの目指すもの

意思決定のためのデータサイエンス

データサイエンスとは、「データから新たな知見を引き出し、価値を創造する科学」とよく定義される。データに基づく知見を、人間・組織の意思決定に活用していく。

人間・組織の意思決定とひと口にいっても、ごはんをどうするかという個人レベルのものから、企業の億単位の事業計画のような大規模なものまである。個人レベルのものは、この料理は以前食べたときとても美味しかったという経験の蓄積が大きく影響するだろうし、事業計画ではこれまでの事業データが意思決定の材料になる。

自治体や国家の政策決定についても、EBPM(エビデンス・ベースト・ポリシー・メイキング)と呼ばれる「証拠に基づく政策立案」が日本でも後押しされている。行政レベルの意思決定ではより信頼性の高いデータが必要となり、その実行は容易ではない。

本書では、そうしたさまざまな意思決定に対して応用可能な分析例を素材に、いくつかのデータ分析手法を解説している。ピックアップして紹介しよう。

オープンデータ
NicoElNino/gettyimages

まずは、自治体などが公開しているオープンデータの活用についてだ。

アニメや映画、漫画の物語の舞台やゆかりのある場所である「聖地」に赴く「聖地巡礼」は、「オタク層」を中心として流行している。滋賀県大津市は23カ所の「聖地」を抱えており、その魅力がいかに観光客の呼び込みにつながるか、オープンデータを使って考えたい。

先行研究によると、「聖地巡礼」は一度で終わるわけではなく、二度、三度と繰り返される、すなわちリピーターになる傾向が強いことが示されている。そうして同じ土地を複数回訪れるのであれば、聖地以外の魅力も不可欠の要素だ。

巡礼以外に地域で行うことについて調べたアンケート調査では、観光名所の観光が最も多かった。大津市には延暦寺や琵琶湖などがあり、世界的な観光地である京都も在来線で10分で行ける。

また、大津市は東京、大阪、名古屋からアクセスしやすいという点も大きい。日本国内で「聖地」の数が最多の岐阜市と比較すると、大津市に宿泊した延べ人数は4倍以上であり、各都市圏からまんべんなく宿泊客が来ていることもデータからわかる。

このように、誰もが簡単に無償で利用できるオープンデータからいろいろなことが見える。官民データ活用推進基本法では「国民参加・官民協働の推進を通じた諸課題の解決、経済活性化、行政の高度化、効率化等への期待」がうたわれており、政府や地方公共団体の持つデータの活用が目指されている。

集計データと領域知識
webphotographeer/gettyimages

複数のブランドが乱立する化粧水市場でどのような製品が上位を占めているかの分析を通して、基本的なデータの扱い方を見てみよう。

市場シェア向上につながる要素をできるだけ正確に知るには、個体の一つひとつに関する明示的な変数が得られる「個票データ」を得るのが本筋だが、その収集には莫大な時間的・経済的コストがかかる。仮説発見の段階では、ネットで公表されている「集計データ」からの分析が効率的だ。平均値のような「集団としての計測対象者全体に関する値」であるため、個票データに比べると情報量は劣るが、データの概略はつかめる。この集計データをグラフ化してデータの特徴を捉えるとともに、領域知識によって仮説発見へと導く。領域知識とは、対象物そのもの、あるいはその関連の知識を指し、データのグルーピングや関連性の把握などにおいて重要となる。

性別、年齢、価格、リピート率という指標で化粧水市場シェア率トップ10の製品を見てみると、売り伸ばしについてたとえば以下のような仮説と示唆が得られた。

もっと見る
この続きを見るには...
残り3143/4643文字

3,400冊以上の要約が楽しめる

要約公開日 2024.11.24
Copyright © 2024 Flier Inc. All rights reserved.
一緒に読まれている要約
番狂わせの起業法
番狂わせの起業法
金谷元気akippa
未読
まったく新しいアカデミック・ライティングの教科書
まったく新しいアカデミック・ライティングの教科書
阿部幸大
未読
ビジネスの結果が変わるN1分析
ビジネスの結果が変わるN1分析
西口一希
未読
厚利少売
厚利少売
菅原健一
未読
英米の大学生が学んでいる政治哲学史
英米の大学生が学んでいる政治哲学史
神月謙一(訳)グレアム・ガラードジェームズ・バーナード・マーフィー
未読
ビジネスを育てる 新版
ビジネスを育てる 新版
ポール・ホーケン阪本啓一(訳)
未読
努力は仕組み化できる
努力は仕組み化できる
山根承子
未読
百冊で耕す
百冊で耕す
近藤康太郎
未読