ハーバード・ビジネス・レビューに掲載された「21世紀で最も魅力的な職業はデータサイエンティストだ」という言葉を契機として、データサイエンティストに注目が集まっている。しかしこの領域の第一人者である著者は、統計が今さらになって脚光を浴びていることに対して驚いているという。
というのも、統計知識の多くはここ最近で登場したものではなく、数百年以上も前から存在する学問に基づくもので、本来ここ1~2年の分野ではないからだ。
もちろん今になってデータサイエンスが脚光を浴びる要因はいくつか存在する。一つはデータ処理基盤となるIT技術の進歩である。すなわちデータ活用方法に関して、「クラウドコンピューティング」を始めとしてGPSやスマートフォン/タブレット端末が普及し、ソーシャルメディアが浸透するなど、膨大なデータ量が短時間かつ大規模に処理できるようになったからだ。
もう一つは、「使えるデータ」の整備も進み、行政や公的機関などが蓄積した情報を活用しやすくなり、ビジネスに活かす分析が可能となっていることである。
膨大なデータを操り、ビジネスに活かすためには3つの力が欠かせない。
一、データを活用したビジネスを企画する力
ビジネスにインパクトを与える分析をするためには、「データありき」ではなく、「ビジネスありき」で捉えなければならない。ビジネスへの深い理解と分析ニーズの明示化こそ、その後の分析が有効な示唆を得られるかどうかを分けるのだ。
二、データサイエンスを支える統計知識
分析によりビジネスニーズを理論的に検証するためには、統計知識が必要となる。具体的には、多変量解析、探索的データ解析、機械学習などの理論・手法のことだ。それらを踏まえ、試行錯誤を繰り返し、有効な示唆を得ることが求められる。
三、アナリティクスを実現するITスキル
データの多様性、生成速度、データ量の増加という特性を持つビッグデータを扱うためには、ITアーキテクチャの理解に加え、高いアプリケーション設計・開発能力が問われる。適切なシステムにより、テキストデータ、音声、ビデオといった非構造化データを扱うとともに、自然言語処理に関する技術力も必要となる。
著者が繰り返し主張している点であるが、あくまでビジネス要件を踏まえることこそが、有用なデータ分析に繋がる、ということに留意すべきである。すなわち、プロジェクトを成功に導くためには、適切な「発射台と的」の設定が必要になるということだ。
もしその標的がぶれてしまった場合、
3,400冊以上の要約が楽しめる