IBMのコンピュータ「ワトソン」はテレビのクイズ番組の過去のグランドチャンピオンを打ち負かし、一大センセーションを巻き起こした。人工知能や自然言語処理の研究成果をもとに生み出されたワトソンは、例えば医師による病気の診断と、患者に最も合った治療法の決定をサポートすることを目指し、今も野心的な研究が行われている。
期待されるところは、膨大な医療情報と患者情報を組み合わせて、医師が複雑な症状の治療法をもっと迅速かつ容易に判断できるよう、力を貸すことだ。こういった研究目標は、単なる計算やデータパターンの発見にとどまるものではなく、自ら感じ、学び、推論し、ヒトと自然にやりとりする、すなわちコグニティブコンピュータを開発しようというプロジェクトにほかならない。
真の目標は、ヒトとコンピュータを結びつけ、単独ではできなかった集合知を実現することだ。日々生み出されるビッグデータは天然資源のようなもの。これを活用するために、もっと人間らしく思考し対話するコンピュータが求められている。コンピュータがヒトに合わせて仕事をし、複雑性、客観性、専門性、創造力、感覚を備えるようになることが期待されている。
IBMリサーチは以前から人間とコンピュータの対決を前面に出して研究者の意欲をかきたて、人々の関心を集めてきた。1960年台からチェッカー、バックギャモン、さらにチェスと次から次へと挑戦していった。1997年にディープブルーというプログラムがチェスの世界チャンピオンに勝利し、その後のプロジェクトがクイズ番組だった。
この挑戦を通じて、幅広い用途に適用できる技術プラットフォームが開発された。データ分析のかっちりとしたルールを決めるのではなく、タスクに応じて足したり組み合わせたりできるシンプルなアルゴリズムを数多く使用。分野にかかわらずさまざまな根拠と結論を比較・評価する分析プログラムをつくり、特定分野の専門家がプログラムに知識を提供できるようにした。
IBMリサーチの次の目標は、ワトソンによる米国医師国家試験の学科テスト合格だ。出題科目は解剖学、薬理学、病理学、行動科学、遺伝学など。ワトソンは既に60万ページ相当の医学的エビデンス、42の医学誌および200万ページ相当の臨床試験のデータ、数千の病歴を読み込む等、学習を始めている。
取引記録から動画、音声、センサーデータなど、ありとあらゆるデータが流通するようになった。「モノのインターネット」の進展により、センサーで生成されてネットにとりこまれるデータ量も飛躍的に伸びている。たとえば、ICタグ、監視カメラ、ウェアラブルセンサーなど多岐にわたる入力源がある。それらの膨大な収集データのうち、分析されているものは1%にも満たない。
ビッグデータのために対応すべき事柄は4つのVに代表される。
3,400冊以上の要約が楽しめる