情報通信技術の発達により様々なデータを収集できるようになり、データ分析が意思決定や改善のプロセスに利用されている。ただ、データから得られた相関関係を利用しても、望むような結果を得られない事は多い。因果関係を理解することこそが重要でありデータ分析の核心となる。

著者は国際的な研究成果を数多く発表している第一線の若手研究者で、本書には自身の研究も収録されている。本書はデータ分析の具体例と分析により分かった興味深い事実を、数式や統計の難解な概念は省略し、初心者にも分かりやすく論じている。データ分析の醍醐味を堪能できる、計量経済学の入口にベストな一冊である。

データ分析の力 因果関係に迫る思考法
著者:伊藤公一朗
出版社:光文社新書
発売日:2017年4月18日

データから因果関係を導き出す方法

「広告は売上アップに貢献したか?」「ある政策が期待するような良い影響をもたらしたのか?」などの判断には因果関係を見極めなければできないが、どのようにして単なる相関関係ではなく因果関係に迫ることができるのかが本書のテーマである。

ビッグデータや統計ソフトの利用により相関関係の計測は容易になっているが、一方で怪しい相関データが世に溢れるようにもなっている。「マンションの高層階に住む女性の不妊率が高い」という相関関係が示されたとしても、高層階に住むことが要因でそのようになっているかは定かではない。また、「電気をつけたまま寝ている家の子供に近視が多い」という相関関係を「電気をつけたまま寝かせると子供が近視になる」という誤った因果関係として捉えられた例は有名かもしれない。

因果関係を見極めるためには、統計の精度を上げるためにデータの観測数を増やすだけでなく、ほかの要因の影響や逆の因果関係などのノイズを除去したうえで、優れた分析をするためのデータを用意する必要がある。そのような理想的なデータを取得する方法として、ランダム化比較実験(RCT)やパネル・データ分析といった手法の具体例を紹介している。

因果関係を捉えることで物事を着実に改善できる

本書、さらにはデータ分析の面白さは、分析からとても興味深いエビデンス(証拠)を得られる場合があるところだ。数学などの知識がなくても、エビデンスを読むだけでも大きな知的刺激を受ける。

例えば、重岡仁助教授による日本の高齢者医療制度についての分析では、医療費の自己負担額が減少するとどれだけ外来患者数が増加するかを明らかにしている。また、得られた結果から最適な医療費や最適な自己負担額がどのくらいかを推定でき、医療政策を考える上で重要な貢献をしたのだという。

著者による日本の自動車に対する燃費規制についての分析結果では、メーカーへのインセンティブの設定に失敗し、車体の重量を重くしてしまい燃費を悪化させただけではなく、事故時の安全性も損なわれたという残念な結果をもたらしたことを明らかにしている。

ビジネスにおいてもデータ分析が常識となっていて、米ヤフーの女性CEOとして有名なマリッサ・メイヤーが「検索結果として表示されるリンクの青色はどの青にするか」という調査を行い、最もクリックされやすい青を突き止めたのだという。

データ分析力が今後ますます重要になる

データ分析は政府の政策決定にも積極的に利用されつつあり、オバマ元大統領がエビデンスに基づく政策形成(EBPM)を提唱し、今後もこの流れは止まらないと考えられている。なお、日本も遅ればせながらではあるが、「経済財政運営と改革の基本方針2017」の閣議決定によりEBPMを推進していくようだ。

これからの時代はビジネスでも理系・文系にかかわらずデータ分析の力が求められている。もちろん、一朝一夕で習得できるものではない。ただ、車を安全に運転するために化学や力学といった背景の技術はさほど必要とせず、交通ルールや車の仕様を理解し運転技術を習得すれば充分なように、データ分析も最低限のルールを理解した上で統計ソフトの操作技術を習得すれば、多くの人がデータ分析をビジネスなどで活用することは充分可能だろう。

本書だけではデータ分析の最低限のルールは習得できない(さらに学びたい人向けに参考図書が紹介されている)が、データ分析の面白さを知るには申し分のないものだ。新書サイズでありながら内容の質は高く非常に分かりやすい。2017年の第60回日経・経済図書文化賞、第39回サントリー学芸賞のダブル受賞にも納得がいく。(書評ライター 池内雄一)